Новое монстрозное GPU Nvidia Blackwell не сильно превосходит GH100 по количеству вычислительных блоков

Компания Nvidia вчера представила чудовищный GPU поколения Blackwell для ускорителей для ИИ, но не раскрыла ряда параметров. Сегодня кое-что в Сети появилось. 

Новое монстрозное GPU Nvidia Blackwell не сильно превосходит GH100 по количеству вычислительных блоков

К примеру, ресурс WCCF Tech утверждает, что новый графический процессор содержит 40 960 ядер CUDA, то есть 20 480 ядер на каждый кристалл. Напомним, новый GPU является двухчиповым решением. Для сравнения, у GH100 имеется 18 432 ядра CUDA, то есть прирост не особо велик. Впрочем, половинку нового GPU компания всё равно никак отдельно не использует, так что всё же речь идёт именно о почти 41 000 ядер. На сайте Nvidia этой информации пока нет. 

Этот же источник говорит о поддержке PCIe 6.0, чего также нет в пресс-релизе или у других больших источников.  

Ресурс Tom’s Hardware, в свою очередь, говорит о двух вариациях нового GPU: B100 и B200. Технически это один и тот же графический процессор, но с немного разными параметрами. Что именно там отличается, точно неясно, и пока есть данные только о TDP — 700 Вт и 1000 Вт соответственно. При этом производительность у этих вариантов разная, но это может достигаться как разницей в частотах, так и урезанием вычислительных блоков. 

В любом случае, у B100 производительность в новом формате FP4 составляет 7 либо 14 PFLOPS в зависимости от режима, а у B200 это 9 либо 18 PFLOPS. В случае ускорителя GB200 Grace Blackwell Superchip, где имеются два новых GPU, производительность составляет 20 либо 40 PFLOPS, а это значит, что именно в этой форме новый GPU представлен в полной своей версии, так как на каждый процессор приходится уже по 10/20 PFLOPS.  

Данных о чистой производительности в режимах FP32 и FP64 до сих пор нет. Но, к примеру, в режиме FP64 Tensor показатель для B100, B200 и GB200 составляет соответственно 30, 40 и 90 PFLOPS.  

 

Источник: iXBT

Читайте также