Акции компаний, связанных с выпуском памяти, в среду снизились, несмотря на заметный общий оптимизм в технологическом секторе. На настроения инвесторов повлиял анонс от Google: компания представила TurboQuant — алгоритм сжатия, который потенциально способен уменьшить потребности в памяти для систем искусственного интеллекта. На фоне роста индекса Nasdaq 100 бумаги производителей памяти выглядели слабее рынка, а движение вниз стало реакцией на технологическую новость.
Какие бумаги подешевели
В центре внимания оказались несколько крупных игроков отрасли:
- SanDisk Corporation (NASDAQ:SNDK) — минус 5,7%.
- Micron Technology (NASDAQ:MU) — минус 3%.
- Western Digital (NASDAQ:WDC) — минус 4,7%.
- Seagate Technology (NASDAQ:STX) — минус 4%.
При этом индексы широкого рынка росли: Nasdaq 100 в среду прибавлял, что подчеркивает именно «отраслевую» природу реакции — инвесторы переоценивали перспективы спроса на память.
Что такое TurboQuant и почему это важно
Google объявила TurboQuant как технологию сжатия, ориентированную на снижение объема памяти, необходимого для крупных языковых моделей и для систем векторного поиска. В таких задачах ключевую роль играет key-value cache — область хранения часто используемой информации внутри AI-систем. Проще говоря, это «быстрый буфер», который помогает модели не пересчитывать одно и то же при обработке запросов, тем самым ускоряя работу.
По заявлению Google, TurboQuant способен сжимать key-value cache до 3 бит без необходимости дополнительного обучения или тонкой настройки (fine-tuning), при этом сохраняя точность модели. Компания также приводит результаты тестов на открытых моделях, включая Gemma и Mistral: там достигалось сокращение объема key-value памяти в 6 раз.
Эффект на производительность на H100
Помимо экономии памяти, Google указывает на ускорение вычислений. В частности, алгоритм демонстрировал до 8 раз рост производительности по сравнению с вариантами без квантования (то есть с использованием «несжатых» ключей) на ускорителях H100 — это класс чипов, широко применяемых в дата-центрах для задач обучения и инференса.
Как работает алгоритм: PolarQuant и Quantized Johnson-Lindenstrauss
TurboQuant, по описанию компании, реализован в два связанных шага:
- PolarQuant — метод высококачественного сжатия за счет поворота векторов данных. Идея в том, чтобы подготовить представление так, чтобы последующее сжатие теряло меньше полезной информации.
- Quantized Johnson-Lindenstrauss — применение квантованного преобразования, которое помогает убрать остаточные ошибки после первого шага.
Google отдельно отмечает проблему, с которой сталкиваются традиционные подходы к квантованию: такие методы могут добавлять от 1 до 2 дополнительных бит на каждое число в виде накладных расходов на хранение. В результате выгода от сжатия частично нивелируется — именно поэтому новый подход, вероятно, делает акцент на балансе между степенью компрессии и «ценой» за нее.
Где и когда представят результаты
Технические детали и результаты будут вынесены на научные площадки:
- TurboQuant планируют представить на ICLR 2026.
- PolarQuant — на AISTATS 2026.
Для подтверждения работоспособности Google тестировала алгоритмы на бенчмарках, включая LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval. Эти наборы задач в целом используются для проверки качества моделей в условиях сложных контекстов, а также для оценки устойчивости и точности.
За пределами ИИ: векторный поиск и поиск по смыслу
Заявленный потенциал TurboQuant выходит за рамки «только» языковых моделей. Векторное сжатие и уменьшение footprint для key-value cache могут оказаться полезными и в векторном поиске, который лежит в основе многих крупных поисковых систем. В таких сценариях данные хранятся и сравниваются в виде векторов, а значит экономия памяти и ускорение обработки запросов напрямую влияют на стоимость и масштабируемость инфраструктуры.
Почему рынок отреагировал именно сейчас
Акции компаний памяти заметно выросли в текущем году — именно поэтому любые новости, потенциально уменьшающие потребность в памяти на единицу вычислений, воспринимаются особенно болезненно. Даже если новые алгоритмы не заменят память полностью, снижение требований к объему хранения для ключевых компонентов AI-систем может изменить ожидания инвесторов относительно будущего спроса на чипы и накопители.
В итоге на фоне общего укрепления технологического сектора бумаги SanDisk, Micron, Western Digital и Seagate оказались под давлением: рынок заранее закладывает сценарий, при котором эффективность инфраструктуры искусственного интеллекта растет быстрее, чем спрос на традиционные объемы памяти.
