Представьте себе: вы копите полгода на сборку для локальных LLM. Подбираете железо, считаете бюджет, мечтаете о запуске 70B-моделей дома. И тут - бац. Supermicro официально объявляет: "Мы прекращаем продажи материнских плат на Epyc Milan в розницу".
Конец мечтам? Не совсем. Но начало очень дорогого кошмара для всех, кто собирал серверы для AI.
Что на самом деле произошло с Supermicro
Supermicro - это не просто бренд. Это кислород для энтузиастов локального AI. Их платы на EPYC 7002/7003 серий (Rome/Milan) с поддержкой 8-16 слотов DDR4 были золотым стандартом.
Почему? Цена. Производительность. И главное - доступность. За 600-800 долларов получал материнку под два процессора и кучу памяти. Идеально для тех, кто запускал LLM на домашнем железе.
Теперь этот канал закрыт. Supermicro переключается на корпоративных клиентов и OEM-поставки. Розничные продажи материнских плат отдельно от серверных систем - закончены.
Почему это бьет именно по "хомякам"
"Хомяки" - это не оскорбление. Это самоназвание сообщества r/LocalLLaMA и аналогичных форумов. Люди, которые собирают системы из того, что есть. Которые ищут баланс между ценой и производительностью.
И вот что они теряют:
- Доступ к DDR4 в больших объемах. Epyc Milan поддерживает до 4TB DDR4 на систему. DDR5 для сравнения - в 2-3 раза дороже за тот же объем.
- Слоты PCIe 4.0 x16. Много слотов. Для тех, кто собирал 4-GPU фермы, это был единственный нормальный вариант.
- Совместимость с б/у процессорами. Рынок завален б/у EPYC 7742 (64 ядра) за 1000-1500 долларов. Теперь под них не будет новых плат.
DDR4 против DDR5: где реальная разница для AI
Все кричат о DDR5. Мол, быстрее, современнее, эффективнее. Но для локальных LLM есть нюанс, о котором не говорят маркетологи.
| Параметр | DDR4 (EPYC Milan) | DDR5 (EPYC Genoa) | Что важно для LLM |
|---|---|---|---|
| Цена за 128GB | 250-300$ | 600-800$ | Разница в 2.5-3 раза |
| Пропускная способность | ~200 GB/s | ~400 GB/s | Для 70B моделей DDR4 хватает |
| Задержки | Выше | Ниже | Влияет на tokens/s, но не критично |
| Энергопотребление | ~3W на модуль | ~5W на модуль | +60-80W на систему с 512GB |
Суть проста: DDR5 быстрее, но для загрузки весов 70B-модели в RAM разница незначительна. А вот цена - огромная. Особенно если собираешь систему с 512GB+ памяти.
Рынок б/у серверов: готовьтесь к аду
С исчезновением новых плат Supermicro рынок б/у взлетит до небес. Уже сейчас вижу на eBay:
- Supermicro H12SSL-i (новая) - от 1200$ (было 700$)
- Dell R7525 (б/у) - от 2500$ (было 1800$)
- HPE ProLiant DL385 - от 3000$ (было 2200$)
Проблема в том, что б/у серверы - это лотерея. Кто-то успешно запускает LLM на старом железе, а кто-то получает систему с убитыми вентиляторами и сгоревшими VRM.
Совет: не покупайте б/у серверы без тестирования на месте. Или готовьтесь к ремонту за 30-50% от стоимости системы.
Альтернативы? Их почти нет
Изучаю рынок последние две недели. Вот что осталось для энтузиастов:
- ASRock Rack. Еще продают платы на EPYC Milan. Но цены уже на 50% выше Supermicro. И качество... спорное.
- Gigabyte. У них есть решения, но поддержка вендора для не-OEM клиентов - смехотворна.
- Самодельные решения на Threadripper Pro. Дорого. Очень дорого. За систему с 256GB DDR5 и TR Pro 5995WX просят 5000$+.
- Старые платформы Xeon. Можно найти б/у Dell/HP с 1-2TB DDR3. Но производительность на ядро в 2-3 раза ниже.
Честно? Все варианты плохие. Это как выбирать между ударом молотком по пальцам или по колену.
Что делать, если вы в середине сборки
Ситуация знакома многим: купил процессор, память, видеокарты. Ждал скидку на материнку. И тут - облом.
1Ищите на местных форумах
Не eBay. Не Amazon. Местные IT-форумы, доски объявлений. Иногда люди продают системы, даже не зная, что у них золото. Видел историю: купил Supermicro H12SSL за 400$ потому что "не запускается". Оказалось - сброс CMOS решает.
2Рассмотрите переход на другую платформу
Да, продать EPYC и купить что-то другое. Например, сборку на 3× RTX 3090 с меньшим объемом RAM. Или систему на Xeon Scalable второго поколения (дешевле, но медленнее).
3Ждите китайские клоны
Китайские производители уже клонируют платы Supermicro. Качество? Ужасное. Но работают. Появятся через 3-6 месяцев по цене на 30% выше оригинала. Будет выбор между оригиналом б/у и китайским новым.
Большая картина: почему это происходит
Это не случайность. Это часть общего железного голода для ИИ.
Производители видят: спрос на серверное железо для AI растет на 200-300% в год. Прибыль от корпоративных продаж в 5-10 раз выше, чем от розницы. Логично? С точки зрения бизнеса - да.
Но есть и другой аспект. Круговая порука больших игроков создает искусственный дефицит. Nvidia, AMD, Supermicro - все ориентируются на крупные дата-центры. Энтузиасты для них - статистическая погрешность.
Ирония в том, что многие прорывы в локальных LLM сделаны именно "хомяками". Теми, кто экспериментировал дома на доступном железе.
Прогноз на 2025: что будет с ценами
Сделал анализ рынка за последние 5 лет. Тренды пугающие:
- Б/у Supermicro платы: +100-150% к концу 2025
- Б/у EPYC Milan процессоры: +50-80% (спрос упадет из-за отсутствия плат)
- DDR4 ECC RDIMM: +30-50% (будут скупать для существующих систем)
- Готовые б/у серверы: +70-100% (единственный способ получить платформу)
Что это значит для вас? Если планировали апгрейд - делайте сейчас. Или готовьтесь платить в 2 раза больше через полгода.
Особенно больно ударит по тем, кто рассчитывал на окупаемость железа против API. Срок окупаемости вырастет с 12-18 месяцев до 24-36 месяцев. Многие проекты станут экономически невыгодными.
Есть ли свет в конце тоннеля?
Парадоксально, но да. Кризис рождает инновации.
Уже вижу три тренда:
- Рост популярности меньших моделей. Если 70B-модели требуют 512GB RAM, а железо дорожает - сообщество оптимизирует 30B-40B модели. Уже есть 34B модели, которые работают почти так же хорошо, как 70B, но требуют в 2 раза меньше памяти.
- Возврат к распределенным вычислениям. Вместо одного мощного сервера - несколько слабых систем. Сети из 4-5 машин с 128GB каждая. Сложнее настраивать, но дешевле в сборке.
- Эксперименты с альтернативным железом. AMD против NVIDIA - это только начало. Появятся решения на ARM, RISC-V. Медленнее, но дешевле в производстве.
Мой совет? Не паникуйте. Не покупайте по завышенным ценам из страха. Сообщество локального AI переживало и не такие кризисы. Помните, когда NVIDIA прекратила поддержку Pascal? Казалось, конец. Но появились обходные пути.
То же самое будет и здесь. Появятся китайские клоны. Кто-то освоит ремонт б/у плат. Появятся софтверные оптимизации, снижающие требования к памяти.
А пока - смотрите на б/у серверные стойки на Avito. Иногда там попадаются жемчужины по цене металлолома. И учитесь паять. Умение заменить конденсатор на материнской плате скоро станет бесценным навыком.
Когда все официальные каналы закрываются, открываются неофициальные. История IT повторяется. Снова.