Антропик, компания, стоящая за чат-ботом Claude, объявила о запуске обновлённой версии своей модели Claude Opus — Opus 4.8. Новость выходит на фоне параллельной работы над тем, чтобы в ближайшие недели выпустить для всех пользователей более «сильную» и потенциально влияющую на рынок разработку Mythos.
Что известно о Claude Opus 4.8
Согласно заявлению компании, модель Opus 4.8 появится на рынке по той же цене, что и её предшественник. При этом разработчик подчёркивает, что обновление затрагивает результаты на тестовых наборах и даёт улучшения по ряду показателей.
Особый акцент сделан на качестве ответов в части «честности» — то есть на снижении риска того, что модель выдаст пользователю уверенный вывод при недостатке данных или неопределённости в исходной информации.
Mythos: модель с расширенными возможностями в кибербезопасности
Отдельного внимания заслуживает Mythos — крупная языковая модель (Large Language Model, LLM), для которой заявлены повышенные способности в области кибербезопасности. В терминологии LLM это означает, что система обучена не только на текстовых паттернах, но и на материалах, связанных с анализом угроз, логикой реагирования и обработкой информации, полезной для защиты.
Именно технологические возможности Mythos стали причиной повышенного внимания со стороны руководителей компаний и мировых лидеров: опасения связаны с потенциальным влиянием мощных инструментов ИИ на безопасность, а также с тем, как такие системы могут применяться в реальных сценариях.
Как Mythos будет использоваться в рамках Project Glasswing
В сообщении компании уточняется, что в рамках Project Glasswing крупные технологические игроки — Amazon, Microsoft и Apple — получили возможность применять Mythos для задач кибербезопасности.
Проект в данном контексте выступает как «коридор» для практического использования: компании могут задействовать модель в специализированных целях, связанных с защитой цифровых инфраструктур и анализом рисков.
Что говорят ранние тестировщики
Антропик также приводит обратную связь с ранних испытаний. По словам разработчиков, Opus 4.8 стала более склонной отмечать неопределённость вокруг собственных выводов и реже формулирует утверждения, не имея под них достаточной опоры.
Иными словами, модель должна лучше различать ситуации, где информации хватает для уверенного ответа, и те случаи, когда данных недостаточно — вместо этого она будет сигнализировать о возможной неполноте.
Проблема «уверенных выводов» у ИИ
Компания отдельно объяснила общий риск, характерный для языковых моделей. В заявлении Anthropic сказано, что ИИ иногда «перепрыгивает» к заключениям: формулирует уверенный прогресс в своей работе, даже если доказательств или исходных данных недостаточно.
Такую ошибку часто связывают с тем, что модель генерирует продолжение текста статистически правдоподобным образом, а не всегда проверяет, насколько её утверждения подтверждаются фактической информацией. Поэтому улучшения в направлении «честности» и корректной оценки неопределённости считаются важными именно для безопасного применения.
Смысл обновления для пользователей
- Opus 4.8 выходит по прежней цене по сравнению с предыдущей версией — то есть апгрейд не требует дополнительных затрат.
- Качество ответов должно улучшиться на бенчмарках, при этом особое внимание уделено снижению рискованной самоуверенности.
- Поведение при неопределённости заявлено как более осторожное: модель должна чаще обозначать ограничения и реже делать неподкреплённые утверждения.
