Anthropic: Claude Opus 4.8 и Claude Mythos

Антропик, компания, стоящая за чат-ботом Claude, объявила о запуске обновлённой версии своей модели Claude Opus — Opus 4.8. Новость выходит на фоне параллельной работы над тем, чтобы в ближайшие недели выпустить для всех пользователей более «сильную» и потенциально влияющую на рынок разработку Mythos.

Что известно о Claude Opus 4.8

Согласно заявлению компании, модель Opus 4.8 появится на рынке по той же цене, что и её предшественник. При этом разработчик подчёркивает, что обновление затрагивает результаты на тестовых наборах и даёт улучшения по ряду показателей.

Особый акцент сделан на качестве ответов в части «честности» — то есть на снижении риска того, что модель выдаст пользователю уверенный вывод при недостатке данных или неопределённости в исходной информации.

Mythos: модель с расширенными возможностями в кибербезопасности

Отдельного внимания заслуживает Mythos — крупная языковая модель (Large Language Model, LLM), для которой заявлены повышенные способности в области кибербезопасности. В терминологии LLM это означает, что система обучена не только на текстовых паттернах, но и на материалах, связанных с анализом угроз, логикой реагирования и обработкой информации, полезной для защиты.

Именно технологические возможности Mythos стали причиной повышенного внимания со стороны руководителей компаний и мировых лидеров: опасения связаны с потенциальным влиянием мощных инструментов ИИ на безопасность, а также с тем, как такие системы могут применяться в реальных сценариях.

Как Mythos будет использоваться в рамках Project Glasswing

В сообщении компании уточняется, что в рамках Project Glasswing крупные технологические игроки — Amazon, Microsoft и Apple — получили возможность применять Mythos для задач кибербезопасности.

Проект в данном контексте выступает как «коридор» для практического использования: компании могут задействовать модель в специализированных целях, связанных с защитой цифровых инфраструктур и анализом рисков.

Что говорят ранние тестировщики

Антропик также приводит обратную связь с ранних испытаний. По словам разработчиков, Opus 4.8 стала более склонной отмечать неопределённость вокруг собственных выводов и реже формулирует утверждения, не имея под них достаточной опоры.

Иными словами, модель должна лучше различать ситуации, где информации хватает для уверенного ответа, и те случаи, когда данных недостаточно — вместо этого она будет сигнализировать о возможной неполноте.

Проблема «уверенных выводов» у ИИ

Компания отдельно объяснила общий риск, характерный для языковых моделей. В заявлении Anthropic сказано, что ИИ иногда «перепрыгивает» к заключениям: формулирует уверенный прогресс в своей работе, даже если доказательств или исходных данных недостаточно.

Такую ошибку часто связывают с тем, что модель генерирует продолжение текста статистически правдоподобным образом, а не всегда проверяет, насколько её утверждения подтверждаются фактической информацией. Поэтому улучшения в направлении «честности» и корректной оценки неопределённости считаются важными именно для безопасного применения.

Смысл обновления для пользователей

Opus 4.8 выходит по прежней цене по сравнению с предыдущей версией — то есть апгрейд не требует дополнительных затрат.
Качество ответов должно улучшиться на бенчмарках, при этом особое внимание уделено снижению рискованной самоуверенности.
Поведение при неопределённости заявлено как более осторожное: модель должна чаще обозначать ограничения и реже делать неподкреплённые утверждения.