Любая информация о графическом процессоре AMD Vega вызывает у энтузиастов огромный интерес, ведь карты Radeon RX Vega обещают сделать на рынке графических решений то, что сделал в секторе пользовательских центральных процессоров AMD Ryzen. Благодаря обновлению графического драйвера AMD для Linux мы теперь точно знаем конфигурацию графического ядра Vega 10 — количество и соотношение функциональных блоков. По этим параметрам Vega 10 близка к Fiji, но, разумеется, обладает новой архитектурой и такими новшествами, отсутствовавшими у первенца с памятью HBM, как уникальные механизмы кеширования.
Информация, почерпнутая из обновлённого драйвера, выглядит следующим образом:
- case CHIP_VEGA10:
- adev->gfx.config.max_shader_engines = 4;
- adev->gfx.config.max_tile_pipes = 8;
- adev->gfx.config.max_cu_per_sh = 16;
- adev->gfx.config.max_sh_per_se = 1;
- adev->gfx.config.max_backends_per_se = 4;
- adev->gfx.config.max_texture_channel_caches = 16;
- adev->gfx.config.max_gprs = 256;
- adev->gfx.config.max_gs_threads = 32;
- adev->gfx.config.max_hw_contexts = 8;
Сомнений нет — это действительно Vega 10. Всего в новом чипе будет 4096 процессоров с архитектурой NGCU (Next Generation Compute Units), делиться они будут на четыре шейдерных движка по 1024 процессора в каждом. Каждый такой движок (engine) получит два блока асинхронных вычислений, один блок RBE и четыре блока текстурных операций, при этом каждый блок RBE будет состоять из 16 блоков ROP (Render Output Unit), а каждый текстурный блок — включать в себя 16 модулей наложения текстур. В сумме это дает 64 ROP и 256 TMU. Можно было бы посетовать на малое количество ROP, но пропускная способность подсистемы памяти у Vega останется прежней, 512 Гбайт/с количество блоков растровых операций, вероятно, увеличивать нет смысла. Объём памяти в игровом варианте составит 8 Гбайт HBM2, для моделей иного назначения эта характеристика неизвестна.
Кроме того, Vega 10 получит поддержку выполнения одновременно до 8 независимых потоков (work threads). Для сравнения, первая из новых графических архитектур AMD, Polaris 10, имеет вдвое меньше потоковых процессоров (в случае с Radeon RX 470), вдвое меньше текстурных блоков и вдвое меньше ROP. Количество одновременно выполняемых потоков тоже вдвое меньше — всего четыре. Если ориентироваться на данные AMD, приведённые для ускорителя Radeon Instinct MI25, также базирующегося на ядре Vega 10, то чипу придётся работать на частоте более 1,5 ГГц, чтобы достичь описываемых разработчиком 12,5 Тфлопс при одинарной точности вычислений (FP32). Что касается особенностей архитектуры Vega 10, то они нами уже описывались, а о производительности рассуждать рано — следует дождаться полноценной продажной версии Radeon RX Vega в тестовой лаборатории.
Источник: 3DNews