Согласно недавно опубликованным неофициальным данным, семейство графических процессоров на базе архитектуры Pascal может стать одним из наиболее полных модельных рядов компании NVIDIA в последние годы. Буквально за несколько месяцев фирма представила четыре GPU на основе Pascal и при этом не собирается останавливаться на достигнутом. По словам главы компании, далеко не все микросхемы Pascal, не говоря уже о реальных продуктах, были представлены. Судя по всему, в ближайшее время нас ждут новые анонсы.
NVIDIA Pascal: восемь продуктов за четыре месяца
Начиная с апреля этого года NVIDIA представила четыре микросхемы на основе Pascal: GP100 c 16 Гбайт памяти HBM2, GP102 c поддержкой GDDR5X, GP104 и GP106. При этом компания анонсировала восемь продуктов на основе указанных GPU (если не считать за отдельные продукты разного рода специальные редакции указанных ниже, а также специализированные устройства типа DGX-1): GeForce GTX 1080/1070 (GP104), GeForce GTX 1060 (GP106), TITAN X (GP102 + 12 Гбайт GDDR5X), Quadro P5000 (GP104GL + 16 Гбайт GDDR5X), Quadro P6000 (GP102GL + 24 Гбайт GDDR5X), Tesla P100 SXM и Tesla P100 PCIe (обе на базе GP100 + 16 Гбайт HBM2).
Хотя четыре GPU и восемь продуктов за четыре месяца это весьма выдающееся достижение, заметно, что компания не представила ни одного нового решения для ноутбуков, а также ни одной новой графической карты дешевле $250. По словам главы NVIDIA, компания готовит новые GPU на базе Pascal, они уже существуют в кремнии, но на рынок выйдут лишь через некоторое время.
NVIDIA: Все Pascal готовы, но не все представлены
«Мы спроектировали, верифицировали и начали производство всех GPU на базе архитектуры Pascal», — сказал Дженсен Хуанг (Jen-Hsun Huang), исполнительный директор NVIDIA, в ходе телеконференции с инвесторами и финансовыми аналитиками. «Однако мы пока не представили все эти графические процессоры».
Принимая во внимание утечки из базы данных AIDA64 (новые данные вводятся в БД программы на основании заявленной поддержке в драйверах NVIDIA), помимо GP100, GP102, GP104 и GP106, в семейство Pascal также будут входить процессоры GP107 и GP108. Последние два — GPU относительно небольшого размера с уменьшенным энергопотреблением, которые будут использоваться для ноутбуков, а также для массовых графических карт (ценой ниже $250). Таким образом, модельный ряд микросхем Pascal будет включать в себя шесть GPU. Для сравнения, семейство Maxwell состояло из пяти микросхем (GM107, GM108, GM200, GM204, GM206), из такого же количества состояло и семейство Kepler (GK104, GK107, GK110, GK208 и GK220, который был использован исключительно для ускорителей вычислений).
GP102: микросхема-загадка
Как несложно заметить, из типичного модельного ряда NVIDIA несколько выбивается микросхема GP102 (иcпользуется для TITAN X и Quadro P6000), которая обладает 3840 потоковыми процессорами и сравнимой с GP100 вычислительной мощностью с одинарной точностью (single precision/SP, FP32). Данный GPU не поддерживает нативных вычислений с двойной точностью (double precision/DP, FP64), не поддерживает ускорения вычислений при половинной точности (half precision, FP16), не совместим с интерфейсом NVLink, использует память GDDR5X вместо HBM2 (что подразумевает некоторое упрощение контроллера с одновременным увеличением размеров физических интерфейсов работы с DRAM), но поддерживает аппаратное кодирование/декодирование видео в различных современных форматах (HEVC/H.265, H.264 и т. д.).
Тем не менее, разница между GP100 и GP102 может быть куда более существенной, чем кажется на первый взгляд: GP102 состоит из 12 млрд транзисторов, тогда как GP100 включает в себя 16,3 млрд транзисторов; площадь ядра GP102 составляет 470 мм2 против 610 мм2 у GP100. Разницу в 4,3 млрд транзисторов и 140 мм2 площади (транзисторный бюджет и размеры ядра высокопроизводительного мобильного микропроцессора) сложно объяснить исключительно возможностями в области вычислений и способностью взаимодействовать с процессорами IBM POWER8+.
Судя по всему, дело в том, что GP102 имеет другую (по сравнению с GP100) конфигурацию потоковых мультипроцессоров (streaming multiprocessors, SMs), аналогичную той, что использует GP104: 128 потоковых процессоров (stream processors, SPs) на один SM у GP102/GP104, против 64 SP на один SM у GP100. Подобная конфигурация в два раза увеличивает площадь, которую занимает управляющая логика для каждого SM (буфер инструкций, планировщик задач, диспетчер и т. д.), а заодно даёт возможность вдвое увеличить размер регистрового файла, доступного для SP, что имеет смысл для суперкомпьютерных вычислений, но будет иметь минимальные преимущества в графических задачах. Кроме того, GP100 может обладать некими скрытыми возможностями, которые пока не были раскрыты. Возможно, речь идёт о неких дополнительных инструкциях (и специализированных ускорителях внутри GPU), внедрённых в микросхему для нужд конкретных заказчиков (мы видели такой подход у процессоров Intel Xeon) из мира суперкомпьютеров.
При всём этом, для высокой производительности в графических приложениях — как игровых, так и профессиональных — отлично подходит GP102, используемый на TITAN X и Quadro P6000. Судя по всему, мы наблюдаем ситуацию, когда NVIDIA создала похожие микросхемы для супервычислений (high-performance computing, HPC) и графики, которые базируются на одной архитектуре, но имеют принципиально разное внутреннее строение и, соответственно, возможности.
Имеет ли финансовый смысл проектировать отдельную микросхему (пусть и, по сути, на базе другой) для двух–четырёх продуктов (два на базе GP102 и два на базе GP102GL) — это вопрос к NVIDIA. Однако очевидно, что создание специализированных процессоров для HPC и графических задач принесло ряд преимуществ для обоих типов приложений. Так, суперкомпьютеры получили лучшие возможности в области исполнения кода общего назначения (с учётом специфики HPC), а пользователи игровых карт получили меньшее энергопотребление и более высокий потенциал для разгона.
Новые конфигурации
Впрочем, интерес для любителей игр и энтузиастов производительности представляют не столько GP107, GP108 и внутреннее строение GP102, сколько тот факт, что каждая микросхема Pascal будет существовать по меньшей мере в двух базовых конфигурациях (с точки зрения идентификатора PCIe ID, который использует драйвер NVIDIA). Это открывает возможности для создания массы новых продуктов на базе микросхем GP100, GP102, GP104 и GP106.
Так, GP104 существует в конфигурации GP104-A и GP104-B, а также в виде версий с включённым ускорением для профессиональных приложений — GP104GL-A и GP104GL-B. Мы не знаем, чему именно соответствуют литеры «A» и «B», но можем предположить, что «A» обозначает микросхему в максимальной конфигурации. Таким образом, GP104-A может соответствовать GeForce GTX 1080, а GP104-B — GeForce GTX 1070.
Принимая во внимание, что микросхемы GP102 и GP106 также существуют в двух конфигурациях (во всяком случае, об этом говорят база данных AIDA64 и драйверы NVIDIA), но при этом на их базе имеется лишь по одному продукту (GeForce GTX 960 и TITAN X), мы вполне можем ожидать появления новых решений на их основе. Будут ли эти карты быстрее или медленнее имеющихся — покажет время. Во всяком случае, GP102 может масштабироваться как «вверх» (до 3840 потоковых процессоров), так и «вниз». При этом, разумеется, нельзя исключать гипотетической возможности появления третьей версии GP102-С, в случае, если она понадобится NVIDIA.
Так или иначе, очевидно, что NVIDIA планирует расширять семейство графических карт на базе Pascal. Хотя ближайшие планы явно должны включать в себя мобильные и массовые GPU, очень вероятно, что в будущем нас ждут новые решения для высокопроизводительных игровых ПК.
Источники: