Накануне ежегодной конференции NVIDIA GTC 2026 появляются новые подробности о возможных анонсах NVIDIA. По данным источников, компания может представить значительные изменения в своей стратегии вычислений, отказавшись от подхода, при котором почти все задачи выполняются исключительно графическими процессорами.
В последние годы инфраструктура для искусственного интеллекта быстро развивается. Если ранее основное внимание уделялось обучению моделей, для чего активно использовались архитектуры Hopper и Blackwell, то теперь индустрия постепенно смещается в сторону так называемых «агентных» вычислений — более сложных задач, связанных с автономными ИИ-системами.
Одним из ключевых шагов может стать интеграция технологий компании Groq. Ожидается, что их специализированные ускорители LPU будут работать совместно с системами на базе архитектуры Vera Rubin. Такие решения могут появиться в составе гибридных вычислительных платформ, где разные типы процессоров будут отвечать за отдельные этапы обработки запросов ИИ.
Предполагается, что в серверных конфигурациях будут использоваться блоки LPU с различным количеством модулей — например, 64, 128 или 256. Они смогут взаимодействовать с графическими ускорителями через технологию NVLink Fusion. Такой подход позволит распределять нагрузку между специализированными компонентами и повысить эффективность обработки задач.
Кроме того, компания может подробнее рассказать о следующем поколении архитектуры — Feynman. По слухам, новые чипы будут производиться по техпроцессу A16 от TSMC и получат более сложную компоновку с использованием технологий 3D-упаковки. Некоторые источники также допускают использование гибридных соединений кристаллов и новых методов интеграции ускорителей.
В центре внимания
