Anthropic впервые в своей истории запустила модели Claude на оборудовании NVIDIA. Произошло это в облаке Microsoft Azure: в сервисе Microsoft Foundry стали общедоступны Claude Opus 4.8 и Claude Haiku 4.5, работающие на новейших ускорителях NVIDIA GB300 Blackwell Ultra. До сих пор Anthropic ни разу не разворачивала свои модели на чипах NVIDIA, так что это заметная веха для компании.
Переход на свежее железо сразу дал прирост в скорости. По замерам Microsoft, Claude Sonnet на GB300 генерирует токены примерно на 40% быстрее, чем на узлах предыдущего поколения H100 — то есть почти в полтора раза. Для моделей с большим контекстным окном это означает меньшие задержки даже при высокой нагрузке от множества одновременных пользователей.
Цифры самой системы впечатляют: одна стойка GB300 NVL72 объединяет 72 ускорителя Blackwell Ultra и 36 процессоров Grace, несёт 37 ТБ быстрой памяти и выдаёт до 1440 петафлопс в режиме FP4. Связывает всё это сеть NVIDIA Quantum-X800 InfiniBand — именно она позволяет запускать сложные агентные системы, где десятки специализированных Claude-агентов работают параллельно над разными бизнес-задачами.
Главный смысл запуска — корпоративный. Теперь компании могут подключать Claude прямо из каталога Azure, не выходя за пределы привычной инфраструктуры Microsoft: с её аутентификацией, биллингом и управлением доступом. Запускать агентов помогает архитектура NVIDIA Secure Agent Workspace Reference Design, где контроль над идентификацией, доступом и политиками вынесен на уровень инфраструктуры — это критично для финансов, медицины и юридического сектора с их жёсткими требованиями к данным.
Любопытно, что в каталоге Foundry уже значатся 11 моделей Claude — среди них Opus 4.8, Sonnet 4.6 и даже пока недоступные