DeepSeek V4 без чипов Nvidia: компания полностью переходит на процессоры Huawei

Китайский ИИ-стартап DeepSeek активно разрабатывает следующую итерацию своей языковой модели — V4. Согласно инсайдам от The Information, проект может быть полностью реализован на аппаратных мощностях Huawei.

Речь идет о стратегическом переходе: предполагается, что архитектура модели будет целиком базироваться на специализированных ускорителях китайского гиганта. К слову, такие лидеры рынка, как Alibaba Group, ByteDance и Tencent, уже закупили крупные партии чипов Ascend 950PR для своих нужд.

По предварительным оценкам, DeepSeek V4 получит почти триллион параметров, а для обеспечения ее работы задействуют сотни тысяч процессоров Ascend 950PR.

DeepSeek V4 без чипов Nvidia: компания полностью переходит на процессоры Huawei

Данные указывают на то, что инженеры DeepSeek в течение нескольких месяцев тесно сотрудничали с Huawei и разработчиком микросхем Cambricon. Совместными усилиями они переписывали и оптимизировали программный код для достижения максимальной производительности на отечественном железе.

Официальных комментариев от DeepSeek или Huawei пока не поступало, однако эксперты считают этот сценарий весьма правдоподобным. Стартап уже имеет опыт интеграции решений Ascend, и полный переход на платформу Huawei выглядит логичным шагом на фоне санкционных ограничений на поставку продукции Nvidia в КНР.

Ожидается, что релиз DeepSeek V4 состоится уже в ближайшие недели. Кроме того, до конца текущего года компания планирует представить еще две обновленные версии своих моделей.

DeepSeek — это передовая экосистема искусственного интеллекта и серия больших языковых моделей (LLM) от разработчиков из Ханчжоу, которая позиционируется как серьезный конкурент ChatGPT. Система демонстрирует выдающиеся успехи в написании программного кода, сложных математических вычислениях и логическом анализе, а также обеспечивает качественную генерацию текстов, в том числе на русском языке.

 

Источник: iXBT

Читайте также