Ускорители Blackwell компании NVIDIA опередили в бенчмарках MLPerf Training 4.1 чипы H100 более чем в 2,2 раза, сообщил The Register. По словам NVIDIA, более высокая пропускная способность памяти в Blackwell также сыграла свою роль. Тесты были проведены с использование собственного суперкомпьютера NVIDIA Nyx на базе DGX B200. Новые ускорители имеют примерно в 2,27 раза более высокую пиковую производительность в вычисления FP8, FP16, BF16 и TF32, чем системы H100 последнего поколения. B200 показал в 2,2 раза более высокую производительность при тюнинге модели Llama 2 70B и в два раза большую производительность при предварительном обучении (Pre-training) модели GPT-3 175B. Для рекомендательных систем и генерации изображений прирост составил 64% и 62% соответственно.
Подробнее https://7ooo.ru/group/2024/11/14/376-google-i-nvidia-pokazali-pervye-rezultaty-tpu-v6-i-b200-v-ii-benchmarke-mlperf-training-grss-356135212.html
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев