Блок-схема LG200 от Loongson изображает графический процессор, организованный из четырёх кластеров, каждый из которых содержит 16 малых арифметико-логических устройств (ALU), четыре больших ALU и один огромный блок ALU.
Известно, что LG200 поддерживает целочисленный формат INT8 для рабочих нагрузок ИИ, а также операции на числах с плавающей запятой FP32 и FP64 для вычислительных задач.
По заявлению разработчика, вычислительная производительность LG200 составляет от 256 Гфлопс до 1 Тфлопс на узел. Правда, компания не уточняет, о каких показателях точности вычислений идёт речь. Даже если заявления касаются FP64-производительности, то её показатель значительно ниже, чем у современных специализированных GPU. Например, NVIDIA H100 обеспечивает FP64-производительность на уровне 67 Тфлопс.
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев