Компания Nvidia представила новое поколение ускорителей Blackwell Ultra, которые обещают стать ключевым элементом в эпоху развития сложных ИИ-моделей. Анонс состоялся в рамках конференции GTC 2025, где были представлены не только сами чипы, но и готовые системы на их основе. Эти решения предназначены для работы с крупными языковыми моделями (LLM), требующими огромных вычислительных ресурсов. В этой статье мы рассмотрим ключевые особенности Blackwell Ultra, его производительность и возможности применения.
Особенности Blackwell Ultra
Архитектура и память
- 288 Гбайт HBM3e: Новый ускоритель оснащён увеличенным объёмом памяти благодаря использованию 12-ярусных стеков HBM3e.
- Связка CPU и GPU: Grace Blackwell Ultra GB300 сочетает Arm-процессор Grace с 72 ядрами Neoverse V2 и двумя графическими процессорами Blackwell Ultra.
- NVLink 5-го поколения: Интерконнект с пропускной способностью 1,8 Тбайт/с на GPU обеспечивает высокую скорость передачи данных между чипами.
Производительность
- 15 Пфлопс для FP4: Производительность Blackwell Ultra в 1,5 раза выше по сравнению с предыдущим поколением.
- 30 Пфлопс для разреженных вычислений: Оптимизация для работы с разреженными данными делает его идеальным для современных ИИ-моделей.
Готовые системы на базе Blackwell Ultra
GB300 NVL72
- 72 GPU и 36 CPU: Серверная стойка объединяет 72 графических процессора Blackwell Ultra и 36 центральных процессоров Grace.
- Жидкостное охлаждение: Обеспечивает эффективное управление теплом при высоких нагрузках.
- 1400 Пфлопс: Максимальная производительность в разреженных вычислениях.
Blackwell Ultra DGX SuperPOD
- 576 GPU и 288 CPU: Кластер из восьми стоек NVL72 с объединённой производительностью до 11,5 Экзафлопс.
- 300 Тбайт памяти HBM3e: Подходит для обработки самых крупных ИИ-моделей.
HGX B300 NVL16
- x86-совместимая архитектура: Решение для тех, кто предпочитает использовать процессоры от AMD или Intel.
- 16 GPU: Компактная система с высокой производительностью для специализированных задач.
Преимущества и перспективы
«Blackwell Ultra создан для эпохи рассуждений», — отмечают в Nvidia. Новинка не только увеличивает производительность, но и упрощает масштабирование систем благодаря NVLink 5-го поколения. Это позволяет соединять до 576 GPU в одном кластере, что ранее требовало использования InfiniBand со значительно меньшей скоростью. Ускорение таких процессов открывает новые горизонты для разработчиков ИИ и облачных провайдеров.
*Все системы на базе Blackwell Ultra появятся на рынке во второй половине 2025 года.*
*Источник изображений: Nvidia*
Читатели этой статьи узнают о ключевых особенностях нового поколения ускорителей Nvidia Blackwell Ultra, их производительности и готовых решениях для центров обработки данных. Эти знания помогут оценить потенциал технологий для реализации сложных ИИ-проектов.