Китайский технологический гигант Alibaba подтвердил свою причастность к появлению анонимной ИИ-модели HappyHorse-1.0, которая на этой неделе возглавила международные рейтинги качества генерации видео. Речь идет о системе, способной создавать видеоролики по текстовому описанию и на основе изображений — то есть работать сразу в двух популярных сценариях использования.
Как появилась HappyHorse-1.0 и почему вокруг нее разгорелись споры
Модель впервые заметили на платформе для тестирования и сравнения ИИ-решений Artificial Analysis примерно в понедельник. При публикации разработчик не указал ни имя, ни компанию, из-за чего вокруг проекта быстро возникли догадки: кто именно стоит за новой системой — крупная корпорация вроде Tencent или Alibaba, либо независимая команда разработчиков.
В анонимном запуске HappyHorse-1.0 смогла подняться на первое место в «слепых» испытаниях. Важно, что такие тесты обычно устроены так, чтобы участники и наблюдатели не знали заранее, какая именно модель показывает результат: это снижает вероятность предвзятости и делает сравнение более объективным. В рейтингах модель заняла верхние позиции как в задаче text-to-video (текст → видео), так и в image-to-video (изображение → видео).
Что стало известно в пятницу
В пятницу разработчики сообщили подробности через недавно созданный аккаунт на X. В сообщении говорилось, что HappyHorse относится к подразделению Alibaba ATH AI Innovation Unit. Также уточнялось, что проект пока не завершен и продолжает развиваться — то есть речь идет не о финальном релизе, а о продолжающейся работе над моделью.
Alibaba, в свою очередь, подтвердила подлинность опубликованной информации, заявив, что пост действительно соответствует действительности. Тем самым компания фактически сняла главный вопрос недели — кто является автором модели, которая неожиданно «выстрелила» в тестах.
Почему именно HappyHorse привлекла особое внимание
Alibaba уже ранее демонстрировала ИИ-наработки, где присутствовали возможности генерации видео. Однако по уровню публичного интереса и по месту в рейтингах HappyHorse-1.0 оказалось заметно впереди: в последние дни модель стала одной из самых обсуждаемых в индустрии именно из-за результатов в сравнительных оценках.
Для контекста: модели text-to-video и image-to-video считаются одними из самых сложных направлений генеративного ИИ. Если текст → видео требует не только понимания описания, но и построения согласованного визуального действия во времени, то image-to-video дополнительно предполагает сохранение смысловой структуры исходной картинки и превращение ее в динамическую сцену.
Фон на рынке: конкуренты сталкиваются с трудностями
Новость о подтверждении авторства Alibaba пришла на фоне заметных сложностей у конкурентов. В частности, OpenAI недавно прекратила работу своего приложения и платформы для генерации видео Sora, объяснив решение сменой приоритетов.
Компания указала, что будет фокусироваться на инструментах для программирования (coding tools), на корпоративных клиентах и на развитии AGI. Отдельно подчеркивалось, что высокие вычислительные затраты остаются серьезным препятствием для масштабирования видеогенерации.
Как отреагировали рынки
На биржах новость о причастности Alibaba к HappyHorse-1.0 отразилась достаточно быстро. Акции Alibaba, торгующиеся в Гонконге, закрылись в пятницу ростом на 2,12%. Бумаги компании, доступные для инвесторов в США, в ходе предварительных торгов прибавляли около 0,7%.
Что означает появление таких моделей для индустрии
Победа в «слепых» бенчмарках и быстрый набор внимания к анонимному релизу — сигнал того, что гонка в видеогенерации ускоряется. При этом рынку важны не только демонстрации «на глаз», но и воспроизводимость результатов, стабильность качества и способность модели работать с разными входными форматами — от текстовых инструкций до изображений.
С учетом того, что Alibaba обозначила HappyHorse как находящуюся в разработке, следующими шагами, вероятно, станут доработки качества, оптимизация вычислений и расширение практических сценариев применения.
