Апгрейд RTX 4090 до 48 ГБ VRAM: гайд Northridge Fix для локальных LLM | AiManual
AiManual Logo Ai / Manual.
25 Янв 2026 Гайд

RTX 4090 48GB: Хардверный хак от Northridge Fix, который NVIDIA скрывает

Пошаговое руководство по замене памяти на RTX 4090 до 48 ГБ. Модификация для запуска Llama 3.3 405B локально. Все риски, инструменты и тесты производительности.

Зачем вообще это делать? (Потому что 24 ГБ в 2026 году — это смешно)

Вы купили RTX 4090 за безумные деньги. Думали, что 24 ГБ видеопамяти хватит на годы вперед. А потом появился Llama 3.3 405B в 4-битном квантовании, который требует 82 ГБ. Или Stable Diffusion 4.0 с текстурами 8K. Или тренировка собственной модели на датасете размером с библиотеку Конгресса.

Ваша карта внезапно превратилась в дорогую игрушку. NVIDIA выпускает RTX 5090 с 32 ГБ за цену нового автомобиля. А вам нужно решение здесь и сейчас.

Northridge Fix — канал на YouTube, где парень с паяльником делает то, о чем инженеры NVIDIA даже думать боятся. Он взял RTX 4090 и заменил 24 чипа памяти GDDR6X по 2 ГБ на 24 чипа по 2 ГБ? Нет. Он поставил 12 чипов по 4 ГБ. Да, такие существуют. И да, это работает.

Предупреждение: Это не инструкция для новичков. Один неверный шаг — и у вас на руках останется красивая, но бесполезная печатная плата за 2000 долларов. Если вы никогда не держали в руках термовоздушную паяльную станцию — остановитесь прямо сейчас.

Что на самом деле происходит с памятью RTX 4090?

RTX 4090 использует память Micron GDDR6X. Стандартная конфигурация — 12 чипов по 2 ГБ каждый, расположенных по обе стороны платы. Шина памяти — 384-битная (32-бит на чип × 12 чипов).

А теперь ключевой момент: контроллер памяти на чипе AD102 (ядро 4090) поддерживает чипы плотностью 16Gb (2GB), 24Gb (3GB) и 32Gb (4GB). Да, технически можно поставить чипы по 4 ГБ. Но NVIDIA этого не делает по одной простой причине — segmentation.

Зачем продавать 4090 с 48 ГБ, если есть профессиональная линейка RTX 6000 Ada с тем же AD102, но уже за 7000 долларов? Правильно — незачем.

Параметр RTX 4090 (сток) RTX 4090 48GB (мод) RTX 6000 Ada
VRAM 24 ГБ GDDR6X 48 ГБ GDDR6X 48 ГБ GDDR6X
Чипы памяти MT61K512M32K2B-021 (2GB) MT61K1T32K2B-021 (4GB) MT61K1T32K2B-021 (4GB)
Шина 384-бит 384-бит 384-бит
Примерная стоимость 2000$+ (новый) 2000$ + 300$ за чипы + работа 6800$+

Что вам понадобится (список, от которого упадут в обморок)

Забудьте про отвертку и термопасту. Здесь нужен другой уровень инструментов.

  • RTX 4090 — очевидно. Лучше брать версию с reference дизайном, у них проще разводка. ASUS TUF, FE Edition подойдут.
  • Чипы памяти Micron MT61K1T32K2B-021 — 12 штук. Ищите на AliExpress или у проверенных поставщиков типа DigiKey. Цена около 25-35$ за штук. Все 12 должны быть из одной партии.
  • Термовоздушная паяльная станция с точным контролем температуры. Quick 861DW или аналог. Без этого — даже не начинайте.
  • Инфракрасный предподогрев — обязательно. Плата RTX 4090 многослойная, без равномерного прогрева она покоробится.
  • Паяльная паста с бессвинцовым припоем — SAC305 или подобная. Температура плавления около 220°C.
  • Флюс — качественный, неагрессивный. Amtech NC-559 или аналоги.
  • Микроскоп или лупа с увеличением 10-20x. Без него вы не увидите мостики.
  • Трафарет для нанесения пасты — можно заказать по размерам чипов.
  • Оловоотсос или оплетка для демонтажа старых чипов.
  • Антистатический браслет и коврик — чипы памяти GDDR6X чувствительны к статике.
💡
Где брать чипы? На AliExpress ищите продавцов с рейтингом 98%+. Проверяйте отзывы — много подделок. Альтернатива — официальные дистрибьюторы типа DigiKey, но там дороже и могут быть ограничения на продажу физическим лицам.

Шаг за шагом: как не превратить 2000$ в пресс-папье

1 Подготовка: разборка карты и очистка

Снимите систему охлаждения. Открутите все винты — их будет много. Запомните расположение термопрокладок. Особое внимание — винты вокруг GPU, они часто закручены с разным моментом.

Очистите старую термопасту с GPU и подложек памяти. Используйте изопропиловый спирт 99%. Никакого ацетона — он растворяет маркировку.

Сфотографируйте все. Каждый шаг, каждый проводок, каждую прокладку. Потом будете собирать по фотографиям.

2 Демонтаж старых чипов памяти

Закрепите плату в держателе. Настройте инфракрасный предподогрев на 150°C снизу платы. Это критично — без предподгрева верхние слои платы отвалятся вместе с чипами.

Нанесите флюс вокруг чипа. Установите температуру термовоздуха на 300-320°C. Не больше! Держите сопло на расстоянии 1-2 см, двигайте по кругу.

Когда припой расплавится (через 30-60 секунд), аккуратно подденьте чип пинцетом. Не дергайте! Если не отходит — добавьте флюс и прогрейте еще.

Повторите для всех 12 чипов. Очистите контактные площадки от остатков припоя оплеткой.

Самая частая ошибка: Перегрев. Вы думаете "дольше прогрею — лучше отойдет". Нет. PCB RTX 4090 имеет 12-14 слоев. При длительном нагреве выше 300°C внутренние слои деформируются. Карта превращается в мусор.

3 Подготовка новых чипов и нанесение пасты

Очистите новые чипы памяти изопропиловым спиртом. Проверьте маркировку — все должны быть MT61K1T32K2B-021.

Используйте трафарет для нанесения паяльной пасты. Толщина слоя должна быть равномерной. Без трафарета почти гарантированно получите перекос или мостики.

Аккуратно разместите чипы на пасту. Ориентация важна — метка в виде точки или выреза должна совпадать с маркировкой на плате.

4 Пайка новых чипов

Снова предподогрев снизу — 150°C. Затем термовоздух сверху — 280-300°C. Наблюдайте через микроскоп.

Когда паста расплавится, чипы "сядут" на площадки. Вы увидите небольшое движение. Не давите на них!

Дайте плате остыть естественным образом. Не используйте сжатый воздух для охлаждения — это создаст термические напряжения.

5 Проверка и чистка

Под микроскопом проверьте каждый чип. Нет ли мостиков между контактами? Все ли чипы ровно стоят?

Промойте плату изопропиловым спиртом от остатков флюса. Тщательно просушите.

Проверьте мультиметром в режиме прозвонки короткие замыкания между соседними контактами. Особое внимание — питание памяти (обычно 1.35V).

6 Сборка и первый запуск

Замените термопрокладки на памяти. Старые уже не подойдут — они сжаты. Нужны новые, толщиной по замерам (обычно 1.5-2mm).

Нанесите свежую термопасту на GPU. Соберите систему охлаждения в обратном порядке.

Момент истины. Подключите карту к системе. Не ставьте сразу в корпус — запустите на открытом стенде.

Включите питание. Если видите дым или почувствуете запах гари — немедленно выключайте. Значит, где-то короткое замыкание.

Прошивка BIOS и драйверы: где собака зарыта

Вот здесь начинается самое интересное. Карта определилась в системе? Отлично. Но видит она все равно 24 ГБ. Потому что BIOS карты "зашит" на 24 ГБ.

Нужно модифицировать BIOS. И нет, стандартные инструменты типа nvflash не помогут — они только перепрошивают существующий BIOS.

Вам нужен CH341A программатор с зажимом SOIC8. Выпаивать BIOS чип не нужно — можно прошить через контакты на плате.

  1. Скачайте оригинальный BIOS вашей карты через GPU-Z
  2. Откройте его в редакторе BIOS (например, Kepler BIOS Editor)
  3. Найдите параметры памяти — обычно в разделе Memory Timings
  4. Измените Density per chip с 2GB на 4GB
  5. Обновите checksum (редактор сделает это автоматически)
  6. Прошейте модифицированный BIOS через программатор
⚠️
Внимание! Неправильная модификация BIOS может "заблокировать" карту. Убедитесь, что делаете бэкап оригинального BIOS. И да, это аннулирует гарантию окончательно.

Тестирование: что получилось в итоге?

После успешной прошивки система должна видеть 48 ГБ VRAM. Проверьте в GPU-Z, HWiNFO64.

Запустите стресс-тест памяти: FurMark или OCCT. Наблюдайте за температурой памяти — она может быть выше из-за более плотной компоновки чипов.

А теперь главное — тесты с локальными LLM. Установите oobabooga или llama.cpp.

# Проверка доступной памяти в PyTorch
python -c "import torch; print(torch.cuda.get_device_properties(0).total_memory / 1024**3)"

# Должно показать ~48.0 ГБ

Попробуйте запустить модель, которая раньше не влезала. Например, Llama 3.3 70B в 8-битном формате требует около 70 ГБ. С двумя модифицированными RTX 4090 (через NVLink или просто в режиме dual GPU) вы сможете ее запустить.

Альтернативы: может, не стоит рисковать?

Если после прочтения у вас холодный пот на спине — это нормально. Есть менее рискованные способы получить больше VRAM:

  • Добавить вторую карту — Tesla M60 или еще одну RTX 4090. Дешевле, безопаснее, но требует больше слотов и питания.
  • NVLink для двух RTX 3090 — 48 ГБ объединенной памяти без модификаций.
  • Купить серверную карту — NVIDIA RTX 6000 Ada уже имеет 48 ГБ, но стоит как три RTX 4090.
  • Собрать кластер из нескольких карт — например, 4×RTX 4090 дадут 96 ГБ распределенной памяти.

FAQ: вопросы, которые вы хотели задать, но боялись

Снизится ли производительность памяти после апгрейда?

Теоретически — нет. Память GDDR6X работает на тех же частотах (21-23 Gbps). Но на практике могут потребоваться небольшие adjustments в таймингах через модифицированный BIOS.

Будет ли работать гарантия?

Нет. Вы нарушили пломбы и физически изменили устройство. Это односторонний билет.

Можно ли поставить 8 чипов по 4 ГБ вместо 12?

Нет. Контроллер памяти AD102 ожидает 12 каналов. Если оставить пустые места — карта не запустится.

Какая реальная прибавка в LLM-задачах?

Если раньше вы не могли запустить модель вообще, а теперь можете — прибавка бесконечная. В числовом выражении — вы получаете возможность работать с моделями в 2 раза больше. Для Llama 3.3 405B в 4-битном формате это разница между "не запускается" и "работает со скоростью 2 токена в секунду".

Что делать, если после замены карта не запускается?

Проверьте в порядке: 1) Короткие замыкания мультиметром 2) Все чипы правильно ориентированы 3) Нет мостиков 4) BIOS прошит корректно. Если ничего не помогает — скорее всего, вы повредили PCB при демонтаже.

Итог: стоит ли игра свеч?

Если вы профессионально работаете с локальными LLM и 24 ГБ — это bottleneck, который стоит вам денег каждый день — да. Стоимость апгрейда (300-400$ за чипы + работа) несопоставима с покупкой новой RTX 6000 Ada за 7000$.

Если вы энтузиаст с паяльной станцией и хотите попробовать — да, но будьте готовы к потере карты. Шансы успеха у опытного мастера — 70-80%. У новичка — меньше 10%.

Если вам просто хочется поиграть в игры — нет, абсолютно нет. Игры не используют больше 16 ГБ даже в 8K.

Главный урок здесь не в том, как паять чипы памяти. А в том, что искусственные ограничения со стороны NVIDIA — это просто прошивка. И иногда достаточно сменить железо и прошивку, чтобы получить то, за что другие платят втрое больше.

Но помните: следующий шаг после такой модификации — это уже сборка сервера на китайских GPU. А там и до создания собственного датацентра недалеко.