Суперкомпьютер Frontier, который возглавил список Top500 и стал первой системой с производительностью свыше 1 exaFLOPS, на самом деле до сих пор нормально не работает.
В интервью источнику программный директор Ок-Риджской национальной лаборатории, где установлен суперкомпьютер, рассказал, что система страдает от многочисленных аппаратных проблем.
Многие проблемы связаны с этими графическими процессорами, но это не большинство проблем, которые мы наблюдаем. Это довольно большой разброс среди обычных виновников отказов деталей. Я не думаю, что на данный момент нас сильно беспокоят продукты AMD
Тут нужно отметить, что уже были слухи, что ускорители Instinct MI250X оказались не столь надёжными, как ожидалось, но, как видим, причина в первую очередь не в них, хотя и с ними не всё гладко. К примеру, были также данные о проблемах с межсоединениями HP Slingshot.
Как бы там ни было, по итогу сейчас суперкомпьютер пока ещё не доступен для учёных.
Источник: iXBT