В пятницу китайская компания DeepSeek представила превью-версии своего нового флагманского открытого ИИ-моделя V4. В анонсе разработчики подчеркнули, что обновление делает модель сильнее в задачах, требующих более точного рассуждения, а также улучшает общую производительность.
Какие модели вошли в релиз V4
DeepSeek выпустила сразу два варианта V4: DeepSeek-V4-Pro и DeepSeek-V4-Flash. Разработчики позиционируют «Pro» как более мощную конфигурацию, а «Flash» — как облегчённую и более быструю модель для сценариев, где важны скорость и эффективность.
- DeepSeek-V4-Pro — модель с 1,6 триллиона параметров.
- DeepSeek-V4-Flash — облегчённая версия с 284 миллиардами параметров.
Параметры в данном контексте — это величина, отражающая «масштаб» нейросети: чем их больше, тем потенциально шире возможности модели, хотя растут и вычислительные требования. Облегчённые варианты обычно нацелены на более экономичное развертывание и работу на ограниченных ресурсах.
Что именно заявили о возможностях V4-Pro-Max
Отдельно DeepSeek выделила V4-Pro-Max как наиболее продвинутую модель из линейки. Компания заявила, что она демонстрирует «топовый» уровень результатов на тестах по программированию, а также «существенно сокращает разрыв» с ведущими закрытыми моделями в задачах, связанных с рассуждениями и работой в формате агентных функций.
Агентные задачи — это сценарии, где система не просто отвечает текстом, а действует как «исполнитель»: планирует шаги, выполняет последовательности действий и достигает цели в рамках заданных инструментов или ограничений.
Результаты на MMLU-Pro: сравнение с крупными игроками
В компании также привели данные по бенчмарку MMLU-Pro. Это популярная проверка знаний и способностей модели в задачах, близких к академическому и практическому уровню, где важны качество рассуждений и устойчивость к сложным формулировкам.
Согласно материалам DeepSeek, DeepSeek V4-Pro показала результаты, которые соответствуют OpenAI’s GPT-5.4 на MMLU-Pro, при этом немного уступая Google’s Gemini-3.1-Pro и Anthropic’s Claude Opus 4.6.
Важно уточнить: подобные сравнения зависят от методики тестирования, настройки окружения и конкретной версии моделей. Однако сами бенчмарки в индустрии часто используют как ориентир для оценки прогресса.
Почему релиз V4 важен для рынка
Объявление в пятницу стало для DeepSeek первым крупным выпуском «с нуля» после модели R1, которая вышла в начале 2025 и заметно повлияла на ожидания в отрасли.
Тогда R1 воспринимали как серьёзный шаг вперёд для открытых ИИ-моделей: по оценкам многих участников рынка, производительность могла приближаться к решениям компаний, работающих в «закрытом» формате. Релиз R1 также вызвал резкую реакцию на финансовых рынках — тогда сообщалось о глубоких потерях в глобальных технологических акциях. Инвесторы сомневались в необходимости дальнейшего интенсивного строительства инфраструктуры под ИИ, если более «лёгкие» и эффективные модели способны выдавать сопоставимые результаты.
Связь с инвестиционными переговорами
Новый релиз V4 выходит вскоре после новостей о том, что китайские технологические гиганты Tencent и Alibaba якобы вели переговоры об инвестициях в DeepSeek. В публикациях фигурировала оценка компании — более 20 миллиардов долларов.
Для индустрии такие сделки обычно означают не только приток капитала, но и усиление позиций по доступу к вычислительным мощностям, партнёрствам и каналам дистрибуции.
DeepSeek в контексте «ИИ-тигров» Китая
DeepSeek относят к группе китайских «AI Tigers» — так называют набор из шести AI unicorn (стартапов-«единорогов»), которые, по оценкам отрасли, находятся в авангарде амбиций страны в быстрорастущем секторе ИИ.
Смысл подобного обозначения в том, что речь идёт о компаниях, способных масштабировать разработки и конкурировать не только в технологическом, но и в коммерческом измерении — от моделей до внедрений в бизнес-процессы.
