Компания Nvidia представила новое поколение ускорителей Blackwell Ultra, которые обещают стать ключевым элементом в эпоху развития сложных ИИ-моделей. Анонс состоялся в рамках конференции GTC 2025, где были представлены не только сами чипы, но и готовые системы на их основе. Эти решения предназначены для работы с крупными языковыми моделями (LLM), требующими огромных вычислительных ресурсов. В этой статье мы рассмотрим ключевые особенности Blackwell Ultra, его производительность и возможности применения.

Особенности Blackwell Ultra

Архитектура и память

  • 288 Гбайт HBM3e: Новый ускоритель оснащён увеличенным объёмом памяти благодаря использованию 12-ярусных стеков HBM3e.
  • Связка CPU и GPU: Grace Blackwell Ultra GB300 сочетает Arm-процессор Grace с 72 ядрами Neoverse V2 и двумя графическими процессорами Blackwell Ultra.
  • NVLink 5-го поколения: Интерконнект с пропускной способностью 1,8 Тбайт/с на GPU обеспечивает высокую скорость передачи данных между чипами.

Производительность

  • 15 Пфлопс для FP4: Производительность Blackwell Ultra в 1,5 раза выше по сравнению с предыдущим поколением.
  • 30 Пфлопс для разреженных вычислений: Оптимизация для работы с разреженными данными делает его идеальным для современных ИИ-моделей.

Готовые системы на базе Blackwell Ultra

GB300 NVL72

  • 72 GPU и 36 CPU: Серверная стойка объединяет 72 графических процессора Blackwell Ultra и 36 центральных процессоров Grace.
  • Жидкостное охлаждение: Обеспечивает эффективное управление теплом при высоких нагрузках.
  • 1400 Пфлопс: Максимальная производительность в разреженных вычислениях.

Blackwell Ultra DGX SuperPOD

  • 576 GPU и 288 CPU: Кластер из восьми стоек NVL72 с объединённой производительностью до 11,5 Экзафлопс.
  • 300 Тбайт памяти HBM3e: Подходит для обработки самых крупных ИИ-моделей.

HGX B300 NVL16

  • x86-совместимая архитектура: Решение для тех, кто предпочитает использовать процессоры от AMD или Intel.
  • 16 GPU: Компактная система с высокой производительностью для специализированных задач.

Преимущества и перспективы

«Blackwell Ultra создан для эпохи рассуждений», — отмечают в Nvidia. Новинка не только увеличивает производительность, но и упрощает масштабирование систем благодаря NVLink 5-го поколения. Это позволяет соединять до 576 GPU в одном кластере, что ранее требовало использования InfiniBand со значительно меньшей скоростью. Ускорение таких процессов открывает новые горизонты для разработчиков ИИ и облачных провайдеров.

*Все системы на базе Blackwell Ultra появятся на рынке во второй половине 2025 года.*

*Источник изображений: Nvidia*

Читатели этой статьи узнают о ключевых особенностях нового поколения ускорителей Nvidia Blackwell Ultra, их производительности и готовых решениях для центров обработки данных. Эти знания помогут оценить потенциал технологий для реализации сложных ИИ-проектов.

Поделиться статьей