docs: update test format documentation in README
Update documentation to reflect new TXT format with separator for summarization tests instead of JSON format. Clarify that expected field may be empty if summary generation fails. feat: change test generation to TXT format with separator Change test generation from JSON to TXT format with TEST_SEPARATOR. Add filename sanitization function to handle MongoDB record IDs. Update output path and file naming logic. Add attempt to generate expected summary through LLM with fallback to empty string.
This commit is contained in:
@@ -49,14 +49,12 @@ python scripts/generate_summarization_from_mongo.py --record-id 507f1f77bcf86cd7
|
||||
- Установленный пакет `pymongo` (автоматически устанавливается при первом запуске)
|
||||
|
||||
**Формат generated тестов:**
|
||||
```json
|
||||
{
|
||||
"prompt": "Summarize the following text in 1-2 sentences: 'Текст статьи из MongoDB'",
|
||||
"expected": ""
|
||||
}
|
||||
```
|
||||
Summarize the following text in 1-2 sentences: 'Текст статьи из MongoDB'
|
||||
Ожидаемый пересказ (если доступен)
|
||||
```
|
||||
|
||||
**Примечание:** Поле "expected" будет пустым, так как ожидаемый результат нужно будет сгенерировать отдельно через LLM или вручную.
|
||||
**Примечание:** Тесты генерируются в формате TXT с разделителем `==============`. Поле "expected" может быть пустым, если генерация пересказа не удалась.
|
||||
|
||||
## Установка зависимостей
|
||||
|
||||
|
||||
Reference in New Issue
Block a user