Alibaba обновила AI-стек: новые модели, чипы и агенты

Alibaba объявила о масштабной модернизации своей экосистемы для искусственного интеллекта. Речь идет не только о программной “надстройке”, но и о всей цепочке — от облачной инфраструктуры и сервисов для работы с моделями до собственных чипов и линейки базовых (foundation) моделей. Цель обновления — ускорить для клиентов создание и запуск AI-агентов, которые способны выполнять задачи в более автономном режиме.

Что именно обновляет Alibaba: “стек” для AI-агентов

На мероприятии Alibaba Cloud Summit компания представила пакет улучшений, охватывающий ключевые компоненты AI-платформы. Для бизнеса это означает более удобный путь от выбора модели до практического развертывания решений, включая инструменты, необходимые агентам для выполнения цепочек действий.

Под “AI-агентом” в данном контексте обычно понимают программную сущность, которая не просто отвечает текстом, а действует: планирует шаги, вызывает инструменты (например, для работы с данными или выполнения команд), отслеживает прогресс и может продолжать выполнение задачи в течение длительного времени.

Новая модель Qwen3.7-Max для кодинга и длительных задач

Ключевым анонсом стала модель Qwen3.7-Max — последняя крупная языковая модель Alibaba, ориентированная на агентский подход к программированию. В компании делают акцент на трех сценариях: агентное кодирование, сложные рассуждения и выполнение задач с “длинным горизонтом”, то есть когда работа разбивается на множество этапов и может занимать продолжительное время.

Сообщается, что Qwen3.7-Max будет доступна разработчикам и предприятиям по всему миру в ближайшее время. Модель рассчитана на работу с задачами, где результатом выступают не только фрагменты кода, но и отладка, а также автоматизация процессов.

Какие возможности заявлены для Qwen3.7-Max

Генерация кода и помощь в отладке (debugging).
Автоматизация офисных рабочих процессов.
Решение многошаговых задач, включающих сотни или даже тысячи действий.
Автономное выполнение задач до 35 часов.
Способность обрабатывать более 1,000 вызовов инструментов (tool calls) без просадки производительности.

Отдельно подчеркивается, что модель оптимизирована под агентские фреймворки, включая OpenClaw, Hermes Agent, Claude Code, Qwen Paw и Qoder. Доступ к Qwen3.7-Max предполагается через платформу модельных сервисов Alibaba — Model Studio.

Panjiu AL128: сервер для инференса и крупномасштабного обучения

Помимо модели, Alibaba усиливает вычислительную базу. Компания запустила Panjiu AL128 Supernode Server, предназначенный для двух ключевых задач: инференса AI-агентов (то есть выполнения уже обученных моделей) и массового обучения больших моделей.

Система рассчитана на высокую плотность вычислений: в одном серверном узле размещены 128 AI-ускорителей. При этом заявляется пропускная способность на уровне петабайт в секунду для одноузлового сценария (single-rack), что должно обеспечивать быстрый обмен данными между ускорителями.

Panjiu AL128 уже доступен на Model Studio для рынка Китая.

Чипы T-Head: Zhenwu M890 и ICN Switch 1.0

Еще один пласт анонсов связан с полупроводниками. T-Head — подразделение Alibaba, занимающееся разработкой чипов — представило Zhenwu M890, который ориентирован на обучение и инференс AI.

Zhenwu M890: рост производительности и параметры памяти

По заявлению компании, новый процессор обеспечивает трехкратный прирост производительности по сравнению с предшественником Zhenwu 810E. Для конфигурации памяти указаны 144 GB GPU memory, а пропускная способность между чипами — 800 GB per second.

Также отмечается поддержка разных форматов точности вычислений — от FP32 до FP4. В контексте AI это важно, потому что более низкая точность (например, FP4) может ускорять вычисления и снижать нагрузку на память, сохраняя приемлемое качество в определенных задачах.

ICN Switch 1.0: коммутатор для соединения ускорителей

Кроме вычислительного процессора, T-Head показала ICN Switch 1.0 — чип-коммутатор. Он заявлен как решение для межсоединений внутри инфраструктуры: устройство обеспечивает суммарную пропускную способность до 25.6 Tbps.

Главная практическая цель — возможность подключения ускорителей с полной пропускной способностью. В компании уточняют, что это позволяет осуществлять полноскоростное взаимосоединение для 64 ускорителей.

В завершение T-Head привела производственные и рыночные ориентиры: на данный момент поставлено более 560,000 устройств Zhenwu, при этом свыше 400 внешних клиентов из 20 отраслей используют эти чипы в своих проектах.

Зачем бизнесу важны эти анонсы

Традиционно внедрение AI-агентов упирается сразу в несколько факторов: качество модели, способность работать с инструментами и длительными сценариями, а также вычислительные ресурсы для обучения и повседневного запуска. Предложенный Alibaba пакет — от Qwen3.7-Max до серверов Panjiu AL128 и чипов T-Head — выглядит как попытка закрыть весь контур разработки и развертывания, чтобы компаниям было проще переходить от экспериментов к промышленному использованию.