Ну что же. Давненько не было новостей о технической части PS5 и XSX. Все уже смирились с RDNA 1.5 в первой и полном превосходстве второй… Но. Появились максимально детальные рентгенографии чипов PS5 и XSX. И вот, что в итоге получается (со слов @Locuza и @FritzchensFritz в Twitter).
А начиналось всё с первых die-shot’ов, относительно которых были даны следующие заключения: 1) Интересно, что Sony, возможно, сократила 256-битные FP-каналы до 128-битных. 2) Нет Infinity Cache / L3, также нет на Xbox Series. 3) Возможно, нужны более свежие рентгенографии с более высоким разрешением, чтобы сказать наверняка. 4) WGP устроены аналогично с GPU на основе RDNA1 с двумя подмассивами. То же самое и с Xbox Series. Navi21/22/23, Van Gogh и Rembrandt имеют только один подмассив для всех WGP. 5) Действительно, необходимо более высокое разрешение для более детального анализа FPU, анализа графического процессора на уровне фронтэнд-дизайна и таких деталей, как движок Tempest Audio.
Теперь же, с появлением новых die-shot’ов, были сделаны некоторые новые заключения относительно архитектурных особенностей PS5 и XSX/S.
Так, @Locuza отмечает, что с его стороны было преждевременно утверждать, что Sony сократила FP-каналы с 256б до 128б (на основе темных участков первых рентгенографий).
«Мне следовало описывать это более аккуратно, потому что некоторые люди иногда принимали это как факт»
Кастомный FPU в PS5 поддерживает те же инструкции, что и обычное ядро Zen2 (4700S использует SoC, схожий с PS5). Некоторые части логики и FP-Scheduler кажутся одинаковыми. Здесь же @Locuza отмечает следующее:
Zen2 Vanilla FPU = 0,773 мм² (на ~56% больше по сравнению с PS5);
Zen2 Custom FPU = 0,497 мм² (на 36% меньше).
Как указано выше, FP-Scheduler и Execution Logic 1 и 2, вероятно, одинаковы, но Execution Logic 3 и 4, похоже, несколько «порезаны».
И даже регистровый файл FP мог быть в основном без изменений, если бы AMD смогла разместить топологию на меньшей площади.
У PS5 меньше места посередине, и блоки сдвинуты друг к другу. Может быть, имеется меньше регистров (но больше 120) и гораздо ниже тепловая плотность, что нормально на более низких частотах. Масштаб приблизительно согласован с использованием блоков L1D для справки.