feat: vibe code done
This commit is contained in:
26
results/rnj-1:8b/codegen_20260116_195424.md
Normal file
26
results/rnj-1:8b/codegen_20260116_195424.md
Normal file
@@ -0,0 +1,26 @@
|
||||
# Отчет бенчмарка: codegen
|
||||
|
||||
**Дата:** 2026-01-16 19:54:24
|
||||
|
||||
**Общее количество тестов:** 1
|
||||
|
||||
**Успешно выполнено:** 1
|
||||
|
||||
## Результаты тестов
|
||||
|
||||
```
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+
|
||||
| Тест| Скор|Время (с)| Промпт | Ожидаемый | Ответ модели |
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+
|
||||
| Тест| Скор|Время (с)| Промпт | Ожидаемый | Ответ модели |
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+
|
||||
|test1|0.239| 3.51 |Write a Python function that calculates the factor...|def factorial(n):\n if n == 0 or n == 1:\n ...|```python
|
||||
def factorial(n):
|
||||
"""
|
||||
Calculate ...|
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+```
|
||||
|
||||
## Статистика
|
||||
|
||||
- **Средний скор:** 0.239
|
||||
- **Среднее время ответа:** 3.507 секунд
|
||||
23
results/rnj-1:8b/summarization_20260116_195424.md
Normal file
23
results/rnj-1:8b/summarization_20260116_195424.md
Normal file
@@ -0,0 +1,23 @@
|
||||
# Отчет бенчмарка: summarization
|
||||
|
||||
**Дата:** 2026-01-16 19:54:24
|
||||
|
||||
**Общее количество тестов:** 1
|
||||
|
||||
**Успешно выполнено:** 1
|
||||
|
||||
## Результаты тестов
|
||||
|
||||
```
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+
|
||||
| Тест| Скор|Время (с)| Промпт | Ожидаемый | Ответ модели |
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+
|
||||
| Тест| Скор|Время (с)| Промпт | Ожидаемый | Ответ модели |
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+
|
||||
|test1|0.571| 1.21 |Summarize the following text in 1-2 sentences: 'Th...|A quick fox jumps over a lazy dog, surprising it. ...|In a brief summary, the quick brown fox jumps over...|
|
||||
+-----+-----+---------+-----------------------------------------------------+-----------------------------------------------------+-----------------------------------------------------+```
|
||||
|
||||
## Статистика
|
||||
|
||||
- **Средний скор:** 0.571
|
||||
- **Среднее время ответа:** 1.206 секунд
|
||||
44
results/rnj-1:8b/summary_20260116_195424.md
Normal file
44
results/rnj-1:8b/summary_20260116_195424.md
Normal file
@@ -0,0 +1,44 @@
|
||||
# Сводный отчет по всем бенчмаркам
|
||||
|
||||
**Дата:** 2026-01-16 19:54:24
|
||||
|
||||
**Модель:** rnj-1:8b
|
||||
|
||||
## Общие результаты
|
||||
|
||||
```
|
||||
+-------------+------+-------+------------+-------------+
|
||||
| Бенчмарк |Тестов|Успешно|Средний скор|Среднее время|
|
||||
+-------------+------+-------+------------+-------------+
|
||||
| Бенчмарк |Тестов|Успешно|Средний скор|Среднее время|
|
||||
+-------------+------+-------+------------+-------------+
|
||||
| translation | 2 | 2 | 0.666 | 1.262 |
|
||||
+-------------+------+-------+------------+-------------+
|
||||
|summarization| 1 | 1 | 0.571 | 1.206 |
|
||||
+-------------+------+-------+------------+-------------+
|
||||
| codegen | 1 | 1 | 0.239 | 3.507 |
|
||||
+-------------+------+-------+------------+-------------+```
|
||||
|
||||
## Подробности
|
||||
|
||||
### translation
|
||||
|
||||
- **Тестов:** 2
|
||||
- **Успешно:** 2
|
||||
- **Средний скор:** 0.666
|
||||
- **Среднее время:** 1.262 секунд
|
||||
|
||||
### summarization
|
||||
|
||||
- **Тестов:** 1
|
||||
- **Успешно:** 1
|
||||
- **Средний скор:** 0.571
|
||||
- **Среднее время:** 1.206 секунд
|
||||
|
||||
### codegen
|
||||
|
||||
- **Тестов:** 1
|
||||
- **Успешно:** 1
|
||||
- **Средний скор:** 0.239
|
||||
- **Среднее время:** 3.507 секунд
|
||||
|
||||
25
results/rnj-1:8b/translation_20260116_195424.md
Normal file
25
results/rnj-1:8b/translation_20260116_195424.md
Normal file
@@ -0,0 +1,25 @@
|
||||
# Отчет бенчмарка: translation
|
||||
|
||||
**Дата:** 2026-01-16 19:54:24
|
||||
|
||||
**Общее количество тестов:** 2
|
||||
|
||||
**Успешно выполнено:** 2
|
||||
|
||||
## Результаты тестов
|
||||
|
||||
```
|
||||
+-----+-----+---------+-----------------------------------------------------+-------------------------+-------------------------+
|
||||
| Тест| Скор|Время (с)| Промпт | Ожидаемый | Ответ модели |
|
||||
+-----+-----+---------+-----------------------------------------------------+-------------------------+-------------------------+
|
||||
| Тест| Скор|Время (с)| Промпт | Ожидаемый | Ответ модели |
|
||||
+-----+-----+---------+-----------------------------------------------------+-------------------------+-------------------------+
|
||||
|test1| 1.0 | 2.21 |Translate the following English text to Russian: '...|Привет, как дела сегодня?|Привет, как дела сегодня?|
|
||||
+-----+-----+---------+-----------------------------------------------------+-------------------------+-------------------------+
|
||||
|test2|0.333| 0.32 |Translate the following Russian text to English: '...| How are you? | "How are you?" |
|
||||
+-----+-----+---------+-----------------------------------------------------+-------------------------+-------------------------+```
|
||||
|
||||
## Статистика
|
||||
|
||||
- **Средний скор:** 0.666
|
||||
- **Среднее время ответа:** 1.262 секунд
|
||||
Reference in New Issue
Block a user