Новый алгоритм Google сокращает расход памяти в шесть раз. Дорогому железу — конец?

Google Железо и технологии Искусственный интеллект НОВОСТИ GOOG

26.03.2026 - 13:51

Сейчас читают: 432

vgtimes.ru:

Google Research опубликовал работу о технологии TurboQuant — алгоритме, который сокращает объём памяти, необходимый для работы ИИ, как минимум в шесть раз, при этом точность ответов не снижается, а дополнительное обучение модели не требуется.

В процессе генерации текста модели используют так называемый KV-кеш — область памяти, где хранятся ранее вычисленные данные механизма внимания, что позволяет не пересчитывать их заново на каждом шаге, но чем длиннее контекстное окно, тем больше разрастается этот кеш. На определённом этапе он начинает занимать десятки гигабайт, и даже мощные видеокарты с большим объёмом VRAM оказываются бессильны. Традиционные методы квантизации (сжатия) данных давно используются для уменьшения размера кеша, но у них есть скрытый недостаток: вместе со сжатыми данными приходится хранить так называемые константы квантизации — что-то вроде словаря, как в архиваторах ZIP или RAR.

Исследователи протестировали TurboQuant на открытых моделях Gemma и Mistral, используя наборы бенчмарков с длинным контекстом: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval. В простых задачах алгоритм показал идеальные результаты, сократив объём KV-кеша минимум в шесть раз, а более сложных сценариях (ответах на вопросы, генерации кода и создании сводок) разница ьыла не столь гигантской, но лучше существующего алгоритма сжатия KIVI. На ускорителях NVIDIA H100 4-битная версия TurboQuant продемонстрировала восьмикратный прирост производительности.

Рынок уже отреагировали на анонс и акции крупнейших производителей памяти просели, что отражает изменение ожиданий инвесторов и если массовое внедрение TurboQuant снизит требования к объёму VRAM, компании смогут либо сократить аппаратные затраты, либо увеличить контекстные

Читать на vgtimes.ru

Все новости от vgtimes.ru

Об этом же в других СМИ

Вышел новый комикс Overwatch – «Новые высоты» про Сьерру noob-club.ru /2 месяца назад

Новая Fable может выйти позже запланированного: ее разработчики боятся GTA 6 tech.onliner.by /2 месяца назад

«Какой будет аудитория у этой игры?» Геймеры разнесли новый файтинг Invincible VS, потому что разработчики не продумали очевидную деталь vgtimes.ru /3 месяца назад

Сайт playerone.cc - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Новый алгоритм Google сокращает расход памяти в шесть раз. Дорогому железу — конец?

Похожие новости

Викторина Николая Пегасова «Ноль Семь» вернулась в стильном дизайне и компактной коробке

Tears of Metal расширяет фронт: кооперативный рогалик про шотландский батальон заглянет на Xbox и в Game Pass

Мне кажется, больше игроки боятся проиграть самим себе, а не сопернику — Aui_2000 о поражениях в Dota 2

Русскоязычная версия MMORPG AION Classic получила обновление с новым классом Инквизитор

Чипсет Z970 заменит B860 и Z890 для будущих процессоров Nova Lake в массовом сегменте, а B960 станет бюджетным вариантом

Сценаристом нового сюжетного контента для Assassin's Creed: Black Flag Resynced выступил Дерби Макдевитт

Assassin's Creed: Black Flag Resynced получит фоторежим

Вице-президент Intel объяснил отставание Core Ultra 200S в играх плохой оптимизацией со стороны разработчиков

Новый спин-офф Vampire Survivors стремительно набирает популярность в Steam

Богатеют за наш счёт? Intel отчиталась о квартальной выручке в $13 млрд

Стрим по Zenless Zone Zero (ZZZ) 2.8: новые промокоды

Даже несмотря на отсутствие финансовой поддержки, мы всё равно продолжаем совершенствоваться — DarkMago о SAR

Ahilles про BetBoom Team: «Хейтеры Булка, думаю, плотно рты закрыли. Команда прям норм так набрала»

В новом тизере показали ключевую локацию космического экшена Exodus от авторов Mass Effect

В The Settlers: New Allies удалось обойти защиту Denuvo при помощи гипервизора

Вышла OpenShorts — бесплатная ИИ-монтажка, которая делает за автора почти все

Патч 12.0.5 для World of Warcraft: Midnight обернулся масштабной катастрофой из-за критических багов и нерабочих механик

В релизной версии Assassin's Creed: Black Flag Resynced будет кровь, социальный стелс и меньше визуальных эффектов в бою

Открыт новый сервер «S136: Ифнир»!

Инсайдер: ASUS, MSI и другие производители выпустят свои собственные версии мощной консоли Xbox Project Helix

Босс Google Cloud: генеративный ИИ уже в ответе за ваши любимые игры, просто вы об этом не знаете