Nvidia разрабатывает новый ускоритель вычислений для китайского рынка, несмотря на санкции. По данным Financial Times, генеральный директор Nvidia Дженсен Хуанг планирует визит в Китай на следующей неделе. Там он примет участие в отраслевой конференции и проведет встречи с высокопоставленными китайскими чиновниками, а сам Хуанг, по некоторым данным, рассчитывает на встречу с премьер-министром Китая Ли Цяном.
Основной целью визита называется «подтверждение приверженности Nvidia китайскому рынку», а также обсуждение возможностей продолжения поставок ускорителей вычислений, которые соответствуют правилам экспортного контроля США. Nvidia оценивает рынок Китая в 50 миллиардов долларов, и логично, что компания не готова отказываться от него.
Экспортные ограничения США привели к тому, что сначала Nvidia лишилась возможности поставлять в Китай высокопроизводительные ИИ-решения. Когда компания попыталась сделать ускоритель H20, разработанный специально под Китай, экспортные ограничения вновь были ужесточены – таким образом, H20 уже не проходил их. Это привело как к крупным издержкам (на уровне 5.5 миллиардов долларов), так и к потере Nvidia доминирующего положения на китайском рынке – санкции привели к снижению доли компании на рынке Китая с 95% до 50%.
Больше статей и видео в нашем Дзен-канале
Пустующую нишу заполняют китайские ускорители от Huawei и Baidu, однако, по словам покупателей, они уступают решениям Nvidia по энергоэффективности. К тому же, уже построенная под архитектуру CUDA система, в случае перехода на другие модели ускорителей, потребует переделок и доработок, а большие игроки, такие как ByteDance или Tencent, идут на это крайне неохотно.
Решением может стать новый ускоритель под кодовым названием B30. Он будет заметно слабее, чем H20 – основан на архитектуре Blackwell (H20 основан на Hopper), а также получит память типа GDDR7 вместо HBM (High-Bandwidth Memory), а также, вероятно, он будет лишен интерфейса NVLink, который используется для соединения нескольких ускорителей между собой для масштабирования производительности в кластерах. Также, вероятно, Nvidia будет по-иному упаковывать чипы – с меньшей плотностью, соответственно, и производительностью. Все эти меры нужны для того, чтобы соответствовать требованиям экспортного контроля.
Аналитики отмечают, что даже такой «урезанный» ускоритель может быть востребован. Китайским компаниям проще нести дополнительные издержки, связанные с большим расходом энергии у кластеров с менее производительными ускорителями, чем полностью перестраивать всю систему, например, на ускорителях Huawei Ascend 910. Пока что Nvidia пытается балансировать между интересами самого прибыльного рынка и экспортным контролем США.