Alibaba объявила о масштабной модернизации своей экосистемы для искусственного интеллекта. Речь идет не только о программной “надстройке”, но и о всей цепочке — от облачной инфраструктуры и сервисов для работы с моделями до собственных чипов и линейки базовых (foundation) моделей. Цель обновления — ускорить для клиентов создание и запуск AI-агентов, которые способны выполнять задачи в более автономном режиме.
Что именно обновляет Alibaba: “стек” для AI-агентов
На мероприятии Alibaba Cloud Summit компания представила пакет улучшений, охватывающий ключевые компоненты AI-платформы. Для бизнеса это означает более удобный путь от выбора модели до практического развертывания решений, включая инструменты, необходимые агентам для выполнения цепочек действий.
Под “AI-агентом” в данном контексте обычно понимают программную сущность, которая не просто отвечает текстом, а действует: планирует шаги, вызывает инструменты (например, для работы с данными или выполнения команд), отслеживает прогресс и может продолжать выполнение задачи в течение длительного времени.
Новая модель Qwen3.7-Max для кодинга и длительных задач
Ключевым анонсом стала модель Qwen3.7-Max — последняя крупная языковая модель Alibaba, ориентированная на агентский подход к программированию. В компании делают акцент на трех сценариях: агентное кодирование, сложные рассуждения и выполнение задач с “длинным горизонтом”, то есть когда работа разбивается на множество этапов и может занимать продолжительное время.
Сообщается, что Qwen3.7-Max будет доступна разработчикам и предприятиям по всему миру в ближайшее время. Модель рассчитана на работу с задачами, где результатом выступают не только фрагменты кода, но и отладка, а также автоматизация процессов.
Какие возможности заявлены для Qwen3.7-Max
- Генерация кода и помощь в отладке (debugging).
- Автоматизация офисных рабочих процессов.
- Решение многошаговых задач, включающих сотни или даже тысячи действий.
- Автономное выполнение задач до 35 часов.
- Способность обрабатывать более 1,000 вызовов инструментов (tool calls) без просадки производительности.
Отдельно подчеркивается, что модель оптимизирована под агентские фреймворки, включая OpenClaw, Hermes Agent, Claude Code, Qwen Paw и Qoder. Доступ к Qwen3.7-Max предполагается через платформу модельных сервисов Alibaba — Model Studio.
Panjiu AL128: сервер для инференса и крупномасштабного обучения
Помимо модели, Alibaba усиливает вычислительную базу. Компания запустила Panjiu AL128 Supernode Server, предназначенный для двух ключевых задач: инференса AI-агентов (то есть выполнения уже обученных моделей) и массового обучения больших моделей.
Система рассчитана на высокую плотность вычислений: в одном серверном узле размещены 128 AI-ускорителей. При этом заявляется пропускная способность на уровне петабайт в секунду для одноузлового сценария (single-rack), что должно обеспечивать быстрый обмен данными между ускорителями.
Panjiu AL128 уже доступен на Model Studio для рынка Китая.
Чипы T-Head: Zhenwu M890 и ICN Switch 1.0
Еще один пласт анонсов связан с полупроводниками. T-Head — подразделение Alibaba, занимающееся разработкой чипов — представило Zhenwu M890, который ориентирован на обучение и инференс AI.
Zhenwu M890: рост производительности и параметры памяти
По заявлению компании, новый процессор обеспечивает трехкратный прирост производительности по сравнению с предшественником Zhenwu 810E. Для конфигурации памяти указаны 144 GB GPU memory, а пропускная способность между чипами — 800 GB per second.
Также отмечается поддержка разных форматов точности вычислений — от FP32 до FP4. В контексте AI это важно, потому что более низкая точность (например, FP4) может ускорять вычисления и снижать нагрузку на память, сохраняя приемлемое качество в определенных задачах.
ICN Switch 1.0: коммутатор для соединения ускорителей
Кроме вычислительного процессора, T-Head показала ICN Switch 1.0 — чип-коммутатор. Он заявлен как решение для межсоединений внутри инфраструктуры: устройство обеспечивает суммарную пропускную способность до 25.6 Tbps.
Главная практическая цель — возможность подключения ускорителей с полной пропускной способностью. В компании уточняют, что это позволяет осуществлять полноскоростное взаимосоединение для 64 ускорителей.
В завершение T-Head привела производственные и рыночные ориентиры: на данный момент поставлено более 560,000 устройств Zhenwu, при этом свыше 400 внешних клиентов из 20 отраслей используют эти чипы в своих проектах.
Зачем бизнесу важны эти анонсы
Традиционно внедрение AI-агентов упирается сразу в несколько факторов: качество модели, способность работать с инструментами и длительными сценариями, а также вычислительные ресурсы для обучения и повседневного запуска. Предложенный Alibaba пакет — от Qwen3.7-Max до серверов Panjiu AL128 и чипов T-Head — выглядит как попытка закрыть весь контур разработки и развертывания, чтобы компаниям было проще переходить от экспериментов к промышленному использованию.
