Ошибка POST 21 ASRockRack: диагностика, коды a300, a2a2, сборка сервера | AiManual
AiManual Logo Ai / Manual.
18 Фев 2026 Гайд

POST 21 на ASRockRack: когда сервер для LLM превращается в дорогой кирпич

Полный гайд по диагностике ошибки POST 21 на материнских платах ASRockRack. Разбираем коды a300, a2a2, проблемы с памятью в сборках dual EPYC для LLM. Инструкци

Тот самый POST 21: когда дорогая железка отказывается работать

Собираешь монстра для локальных LLM. Два EPYC 9754, 512 ГБ DDR5, пара RTX 6000 Blackwell. Включаешь - и на дисплее POST-кодов материнской платы ASRockRack загорается "21". Система молчит. Вентиляторы крутятся, но загрузки нет. Знакомо? Добро пожаловать в клуб.

POST 21 на серверных платах ASRockRack - это не просто ошибка. Это полноценный кризис инициализации памяти, который может стоить недель отладки. Особенно обидно, когда собираешь систему под бюджетного монстра для Deepseek V3.2 или аналогичный проект.

Важно: POST 21 - это код фазы инициализации памяти. Система прошла начальные тесты процессора, чипсета, но споткнулась на RAM. Не путать с проблемами PCIe, как в случае с RTX 6000 Blackwell.

Что на самом деле означает POST 21?

Код 21 в шестнадцатеричной системе (0x21) соответствует фазе "Memory Initialization" в AMI BIOS, который использует ASRockRack. Конкретно - это этап настройки контроллера памяти процессора (IMC).

Но вот загвоздка: один только код 21 ничего не говорит. Нужны дополнительные коды, которые появляются до или после. Именно они - ключ к диагностике.

Код до/после 21Что означаетТипичная причина
A300Ошибка инициализации памяти CPU0Проблемы с первым процессором или его памятью
A2A2Ошибка инициализации памяти CPU1Проблемы со вторым процессором в dual-конфигурации
55Memory not installedПамять не обнаружена вообще
53Memory size mismatchНесовпадение размеров или типов памяти

Почему это происходит в сборках для LLM?

Сборки под большие языковые модели - особый случай. Ты используешь нестандартные конфигурации:

  • Максимальное количество слотов памяти (обычно 16 на dual EPYC)
  • Непарные модули (покупаешь что есть в наличии)
  • Разные производители RAM в одной системе
  • Частоты выше спецификации (потому что хочется быстрее)

Именно здесь проявляются все слабые места платформы. Контроллер памяти EPYC Genoa (и особенно Bergamo) крайне чувствителен к:

  1. Таймингам
  2. Напряжениям
  3. Термическому режиму памяти
  4. Порядку установки модулей
💡
Интересный факт: проблемы с памятью в серверных сборках часто маскируются под другие ошибки. Например, ошибки Xid на PCIe 5.0 иногда возникают из-за нестабильной памяти, а не из-за кабелей.

Пошаговая диагностика: от простого к сложному

1Базовые проверки без разборки

Сначала исключи очевидное. Подключись к BMC через IPMI (обычно 192.168.1.100 по умолчанию). В KVM-консоли смотри:

  • Какие именно коды появляются перед 21
  • Зависает ли система на 21 или проходит дальше
  • Есть ли сообщения на экране (если подключен монитор)

Проверь версию BIOS. На февраль 2026 года актуальна версия 2.30 для большинства плат ASRockRack EPYC 7004. Старые версии (до 2.20) имеют критические баги с памятью.

2Минимальная конфигурация

Вытащи все, кроме:

  • Одного процессора (CPU0 в сокете ближе к тыловой панели)
  • Одного модуля памяти в слоте A1 (смотри руководство к плате!)
  • Блока питания (только 24-pin и CPU power)

Не подключай:

  • Видеокарты (особенно проблемные вроде RTX 6000 Pro Blackwell)
  • NVMe накопители
  • PCIe устройства
  • Второй процессор

Включи. Если POST 21 исчез - проблема в конфигурации памяти или дополнительном оборудовании.

3Тест памяти по слотам

Возьми один заведомо рабочий модуль (если есть). Протестируй все слоты CPU0:

  1. A1 (первый от процессора)
  2. B1
  3. C1
  4. D1
  5. Повтори для остальных каналов

Если в каком-то слоте система не стартует - возможна проблема с самим слотом или трассировкой на плате.

Внимание: порядок слотов критически важен! Для EPYC 7004 обычно работают слоты: A1, B1, C1, D1, затем A2, B2 и т.д. Но проверь конкретно свою модель платы - у ASRockRack бывают исключения.

4Добавление второго процессора

Если с одним CPU все работает, установи второй. Без памяти во втором процессоре система должна загрузиться. Если появляется POST 21 с кодом A2A2 - проблема может быть в:

  • Самом процессоре (редко, но бывает)
  • Сокете (загрязнение, погнутые контакты)
  • Системе охлаждения (неравномерное давление)

Добавляй память во второй процессор по одному модулю, тестируя каждый слот.

Самые частые ошибки и их решения

Ошибка: "Все работало, добавил память - POST 21"

Классика. Добавляешь еще 4 модуля к уже работающим 4 - и система не стартует. Причина: разные ранки (rank) памяти.

Решение: используй модули одинаковой конструкции. 1Rx4, 2Rx8, 1Rx8 - все это должно совпадать. Смешивать можно, но BIOS может не справиться с автоматической настройкой.

Ошибка: "После обновления BIOS появился POST 21"

Новые версии BIOS часто меняют тайминги по умолчанию или напряжения. Особенно после выхода микрокода AGESA.

Решение: сбрось BIOS к заводским настройкам. Если не помогает - откатись на предыдущую стабильную версию. И да, делай бэкап конфигурации перед обновлением.

Ошибка: "Периодический POST 21 при перезагрузке"

Система то загружается, то нет. Особенно после полного выключения. Это может быть:

  • Проблема с тренировкой памяти (memory training)
  • Нестабильное напряжение VDDIO или VDDQ
  • Термические проблемы (память перегревается при тренировке)

Решение: вручную установи напряжение памяти на 0.05V выше стандартного. Отключи быструю загрузку (Fast Boot) - пусть система каждый раз проходит полную тренировку.

Настройка BIOS для стабильной работы

Когда система наконец загрузилась, не расслабляйся. Нужно настроить BIOS под твою конкретную память:

  1. Включи Memory Context Restore (MCR) - ускоряет последующие загрузки
  2. Установи частоту памяти вручную (не Auto)
  3. Для смешанных наборов увеличь tRFC на 20-30%
  4. Проверь, что Power Down Enable отключен (для серверной памяти)
💡
Профилактика: перед сборкой проверь память на другой системе. Даже новые модули могут быть бракованными. Особенно актуально для бюджетных сборок из китайских компонентов.

Когда виновата не память

Иногда POST 21 - это симптом другой проблемы:

  • Блок питания: недостаточная мощность по линии 12V для процессоров
  • Охлаждение: процессор перегревается во время инициализации памяти
  • Прошивка BMC: устаревшая версия конфликтует с новым BIOS
  • Сам процессор: дефект контроллера памяти (очень редко, но бывает)

Особенно внимательно проверяй блок питания в сборках с несколькими GPU. Каждая RTX 6000 Blackwell потребляет до 600W, и если ты собираешь систему на 3x V620, мощности должно хватать с запасом.

Профилактика для будущих сборок

Чтобы не столкнуться с POST 21 в следующий раз:

  1. Покупай память одним набором (kit), а не по отдельности
  2. Проверяй QVL (Qualified Vendor List) для твоей платы
  3. Обновляй BIOS и BMC до актуальных версий перед сборкой
  4. Используй термопрокладки на память, если планируешь высокие нагрузки
  5. Тестируй систему поэтапно, а не всю сразу

И помни: серверное железо - не десктопное. Оно более капризное, но и более надежное в долгосрочной перспективе. Особенно сейчас, когда Supermicro прекращает продажи материнских плат, альтернативы вроде ASRockRack становятся еще важнее.

Финальный совет: не экономь на тестировании

Потрать лишний день на диагностику. Протестируй каждый модуль памяти отдельно. Проверь все слоты. Обнови прошивки. Это сэкономит недели потом.

И если система все же не заводится - не стесняйся обратиться в поддержку ASRockRack. У них есть доступ к внутренним кодам ошибок, которые не отображаются на POST-дисплее. Иногда проблема решается одной строкой в скрытых настройках BIOS.

Удачи с сборкой. И пусть твой сервер для LLM POSTится с первого раза. (Хотя, будем реалистами, обычно со второго или третьего).