Несмотря на свой восьмилетний возраст, графический ускоритель Nvidia Tesla V100 доказывает, что его рано списывать со счетов. В задачах локального инференса нейросетей эта ветеранская видеокарта демонстрирует более высокую производительность, чем современные потребительские решения, такие как RTX 3060 с 12 ГБ видеопамяти и Radeon RX 7800 XT на 16 ГБ.

Исследование провёл автор YouTube-канала Hardware Haven, собравший уникальную рабочую станцию на базе Tesla V100 в форм-факторе SXM2. В прошлом данные ускорители стоили целое состояние и предназначались для дата-центров, но сегодня их можно приобрести на вторичном рынке за скромные $100.
Интеграция подобного серверного железа в домашний ПК требует определенных усилий: энтузиасту потребовался переходник с SXM на PCIe, организация индивидуального питания и кастомная система охлаждения, включающая вентилятор и распечатанный на 3D-принтере кожух. Суммарные затраты на такую сборку составили порядка $235.
Результаты тестирования оказались весьма впечатляющими. Так, в бенчмарке GPT-oss 20B карта показала быстродействие около 130 токенов в секунду, опередив Radeon RX 7800 XT с ее 90 токенами/с. При работе с моделью Gemma4:e4b ускоритель Tesla V100 выдал 108 токенов/с, уверенно обойдя RTX 3060 12 ГБ, чей результат составил 76 токенов/с.
Поражает не только скорость: старый серверный чип продемонстрировал отличную энергоэффективность. Даже при ограничении энергопотребления до 100 Вт, V100 сохраняет преимущество над RTX 3060 как по темпам генерации, так и по показателю количества токенов на ватт.
Этот эксперимент наглядно демонстрирует, что специализированные серверные GPU прошлых поколений остаются крайне выгодным решением для локального запуска нейросетей, при условии готовности пользователя к техническим трудностям с адаптацией оборудования.
Ключевыми преимуществами данных карт являются высокая пропускная способность памяти HBM2 и узкая специализация на вычислительных нагрузках, что зачастую оказывается важнее игровых технологий для энтузиастов в области ИИ.
Особый интерес представляет 32-гигабайтная модификация Tesla V100. При текущей стоимости около $400–500 эти ускорители могут стать отличным бюджетным инструментом для запуска требовательных больших языковых моделей (LLM), составляя серьезную конкуренцию дорогостоящим актуальным видеокартам серии RTX.
Источник: iXBT


