Какая LLM лучше работает с длинным контекстом в 2025Q2?
Напомню, что анализ документа или нескольких документов по чеклисту предполагает их полную загрузку в контекстное окно LLM.

Fiction.liveBench — это первый в своем роде реальный бенчмарк для оценки способности моделей искусственного интеллекта понимать и обрабатывать длинные контексты в текстах.​

Fiction.live, платформа для писателей, представила инструмент Fiction.liveBench. Этот бенчмарк предназначен для тестирования и оценки производительности AI-моделей в понимании длинных текстовых последовательностей, что является критически важным для генерации связных и логически последовательных историй.

Я пока на OpenAI API. Но в бэклог уже закинул задачу по реализации возможности переключения между моделями и тестирования их работы.
https://fiction.live/stories/Fiction-liveBench-Mar-25-2025/oQdzQvKHw8JyXbN87

#LLM
1 АПРЕЛЯ

Заявка на демонстрацию
Сервис работает в тестовом режиме, подключаем клиентов из листа ожидания.
я согласен на получение рекламных рассылок
Нажимая кнопку «отправить», вы принимаете условия лицензионного соглашения и политики обработки персональных данных
Made on
Tilda