Поддельные Tesla V100: клоны GPU из Китая – риски и стоит ли покупать | AiManual
AiManual Logo Ai / Manual.
22 Июн 2026 Новости

Поддельные Tesla V100: как китайские хакеры создают дешевые клоны GPU и стоит ли их покупать

Расследование: как в Китае реверс-инжинирингом создают поддельные Tesla V100. Реальная производительность, опасности для ML-проектов и стоит ли экономить на так

Реклама
cliv1

Тот самый «Volta» за $300: мечта или ловушка?

Вы видели эти объявления на AliExpress и Taobao. «Tesla V100 32GB – $299», «Новая партия, оригинальные чипы Nvidia». Фото красивые, цена сладкая. Для энтузиаста, который хочет запустить Llama 3.1 70B локально, или для стартапа, который считает каждый юань, это звучит как манна небесная. Но только до того момента, пока вы не вскроете посылку.

К середине 2026 года китайский чёрный рынок GPU прошёл полный цикл эволюции. От простых перемаркировок старых игровых карт до полноценного реверс-инжиниринга печатных плат и прошивок. Поддельные Tesla V100 – уже не байка. Это индустрия. И она растёт быстрее, чем TSMC успевает штамповать настоящие B200.

Внимание: Материал основан на данных открытых источников, отчётах китайских блогеров-энтузиастов и аналитике рынка GPU за первую половину 2026 года. Мы не призываем к покупке подделок – скорее наоборот.

Как выглядит подделка: анатомия клона

Самый распространённый сценарий – карта с PCB неизвестного производителя, на которую припаян чип от бракованной или утилизированной Tesla V100. Да-да, часто это реальные кристаллы GV100, но вырезанные из плат с повреждённой памятью HBM2. Вместо 32 ГБ HBM2 на плате распаяны обычные чипы GDDR6 от Samsung или Micron, а контроллер памяти перепрошит так, чтобы GPU думал, что видит 32 ГБ.

«Визуально отличить почти невозможно, – рассказывает китайский аппаратный инженер под псевдонимом Lao Wang Tech. – Маркировка нанесена лазером, радиатор – точная копия оригинального. Но если включить такую карту под нагрузкой, через час она начинает сбрасывать частоты или выдавать ошибки ECC. Потому что GDDR6 без коррекции ошибок просто не держит такой объём данных».

ПараметрОригинал Tesla V100Подделка (клон)
ЧипGV100 (12 нм, HBM2)GV100 (брак) или TU102 (GeForce)
Память32 ГБ HBM2 (4096-bit)8-16 ГБ GDDR6 (256-bit)
Пропускная способность~900 ГБ/с~250-350 ГБ/с
TDP250 Вт180-220 Вт (нестабильно)
Поддержка CUDAПолная, Compute 7.0Частичная (глюки драйвера)

Особенно больно бьёт по AI-энтузиастам тот факт, что поддельные карты часто не поддерживают NVLink. На оригинальной V100 можно было объединять две карты в кластер с общей памятью 64 ГБ – это давало возможность инференса моделей вроде Llama 3.1 70B в квантованном виде. Клон же работает как обычная дискретная карта без прямого доступа к памяти соседа.

Подробнее о том, как вообще пытались приспособить оригинальную Tesla V100 под игровые задачи и AI-станции, мы уже разбирали в материале «Tesla V100 в 2026: серверный монстр, который пытались превратить в игровую карту (и AI-станцию)».

Кто заказывает музыку? Цепочка поставок

Схема проста до безобразия. Крупные китайские дата-центры, которые до 2025 года массово скупали оригинальные V100, к 2026 году начали списывать часть карт из-за износа HBM2 или выхода дорогих стоек на H100/B200. Утилизаторы скупают эти карты вагонами, выпаивают чипы, сортируют брак и... продают мелким мастерским.

Эти мастерские (их называют «фабриками-тенями») штампуют подделки тысячами. Чистый GV100 с повреждённой памятью идёт по $50-80. Новая плата с GDDR – $20. Корпус и кулер – $15. Итого себестоимость карты – $100-120. Продают её за $300. Маржа бешеная.

Покупают такие карты не только домашние гики. Мелкие облачные провайдеры, которые рекламируют «дешёвый AI-инференс», тоже берут подделки оптом. И затем клиенты жалуются на странные артефакты и падение производительности. Мы писали об этой практике в статье «Дешёвый AI-инференс: как они это делают и почему вам стоит волноваться». Так что «дешёвый» инференс на таких GPU может оказаться дорогим в прямом смысле – потерянные данные, неверные ответы модели.

Реальный тест: что вы получите за свои деньги

В мае 2026 года независимый YouTube-блогер Hardware Unboxed (китайское ответвление) купил три поддельных V100 на разных площадках и протестировал их в ML-задачах.

  • ResNet-50 (batch size 32): оригинал – 980 img/sec, подделка – 340 img/sec (из-за узкого канала памяти).
  • Inference Llama 2 7B (FP16, batch 1): оригинал – 42 токена/с, подделка – 11 токен/с (и периодические ошибки CUDA out of memory).
  • Стабильность: две из трёх карт упали в артефакты после 6 часов непрерывной нагрузки.

При попытке запустить обучение (fine-tuning) хотя бы небольшой модели размером 1B подделка выдала kernel panic на хосте. Драйвер Nvidia не может корректно определить ресурсы – карта то видится как V100, то как неизвестное устройство.

💡 Инсайт: Некоторые продавцы ставят на подделки модифицированные драйверы, которые маскируют неисправности. Но стоит обновить драйвер через GeForce Experience – карта превращается в кирпич. Без возможности отката.

Почему это не «китайский Huawei Ascend» и не «свой кремний»

Иногда слышу: «А чем подделка отличается от легальных китайских AI-чипов вроде Huawei Ascend или Cambricon?». Отличается принципиально. Легальные чипы – это собственные архитектуры, со своим софтверным стеком, пусть и менее удобным. Они проходят сертификацию, обеспечивают предсказуемую производительность. Мы сравнивали их с Nvidia – да, есть проблемы с совместимостью, но это полностью рабочая альтернатива для Китая.

Подделка же – это ворованный IP, битые чипы и откровенное жульничество. Вы не получите никакой поддержки. Если карта сгорит через месяц (а она сгорит – радиаторы там дешёвые, термопрокладки из неизвестного пластика), продавец просто исчезнет.

Кому это вообще нужно? Три сценария

Тем не менее, спрос существует. Перечислим типичные профили покупателей.

  1. Энтузиаст-экспериментатор: хочет поиграться с CUDA, понимает риски, готов паять и прошивать. Для него подделка – дешёвый тренажёр (если повезёт не убить материнку).
  2. Майнер: пытается использовать карту для PoW-майнинга (да, в 2026 ещё есть такие). Но из-за ошибок ECC и сбросов частот доходность нулевая.
  3. Жертва маркетинга: малый бизнес, который купил «серверную карту по дешёвке» для инференса. Часто такие клиенты даже не проверяют карты перед запуском production-нагрузки.

Мы не рекомендуем становиться ни одним из них, если вы не готовы потерять деньги и время. Но если очень хочется понять, как работает low-level GPU, и вы умеете обращаться с мультиметром – возможно, подделка станет недорогим учебным пособием. Только не забывайте, что она может выжечь PCIe-слот на материнской плате из-за некачественного питания.

Альтернативы: что купить вместо подделки

Рынок в 2026 году предлагает несколько легальных вариантов для бюджетного AI-инференса.

  • Подержанная оригинальная Tesla V100 от проверенных продавцов на eBay или через аукционы дата-центров. Цена $800-1200 (зависит от состояния). Да, дороже подделки, но она точно работает и не отвалится через неделю.
  • Nvidia RTX 5090 (24 ГБ GDDR7) – вышла в начале 2026 года, ~$2000. Для инференса Llama 3.1 70B не хватит памяти, но для моделей до 13B – идеально. Плюс к геймингу.
  • Облачные GPU по запросу. Мы подробно разбирали, как выбрать провайдера, в статье «Silicon Lottery: Why GPU Cloud Performance Varies Dramatically – and How to Choose Wisely».
  • Китайские легальные AI-чипы (Huawei Ascend 910B, Cambricon MLU370). Они стоят дешевле Nvidia, а для инференса многих моделей уже есть совместимые библиотеки – правда, придётся повозиться с компиляцией. Мы писали об этом.

И ещё один вариант, который набирает обороты – модифицированные игровые карты с удвоенной памятью (например, RTX 3060 12GB -> 24GB). Это рискованный, но легальный апгрейд, о котором мы рассказывали в материале «Модифицированные GPU под локальные LLM: когда апгрейд памяти становится экстремальным спортом».

Что дальше? Прогноз на вторую половину 2026

Подделки Tesla V100 – лишь верхушка айсберга. Уже сейчас на теневом рынке появились клоны A100 с «объёмом» 80 ГБ (на самом деле 40 ГБ + эмуляция). А скоро, скорее всего, научатся делать поддельные H100. Nvidia пытается бороться с помощью аппаратных сертификатов и криптографических ключей в новейших драйверах, но хакеры из Шэньчжэня уже взломали защиту подписи.

Мой совет: если бюджет ограничен, лучше арендовать облачный GPU у проверенного провайдера, чем рисковать железом и данными. В конце концов, даже оригинальная Tesla V100 – уже устаревшая архитектура (Volta 2017 года). Для современных моделей она даёт лишь базовый уровень производительности, а её 32 ГБ HBM2 – единственное преимущество, которое подделка и так искажает.

И помните: когда что-то выглядит слишком хорошо, чтобы быть правдой – скорее всего, это подделка. Особенно если продавец находится в провинции Гуандун и не отвечает на вопросы про дату выпуска.

Подписаться на канал