NASA тестирует локальный инференс LLM для космических миссий: кейс и перспективы

Космос — это место, где задержка сигнала считается не в миллисекундах, а в минутах. До Марса — от 4 до 24 минут в одну сторону. Пока запрос доходит до Земли, пока нейросеть в дата-центре сгенерирует ответ — астронавт уже может либо разбить марсоход, либо пропустить вспышку на Солнце. Решение напрашивалось давно: засунуть AI прямо на борт. Но как? Традиционные LLM жрут гигаватты и требуют облачных GPU. А в космосе — радиация, ограничение по энергии и весу.

29 июня 2026 года NASA совместно с Red Hat опубликовала результаты тестов, которые переворачивают эту картину. Они взяли локальный инференс LLM, заквантизировали модель до нескольких гигабайт и запустили на бортовом компьютере с пассивным охлаждением. Звучит как фантастика? Давайте разбираться, как им это удалось и почему ваш домашний ПК теперь в пролёте.

Что именно тестировали и на чём?

NASA не раскрывает полный стек, но по сливам из исследовательского центра Эймса, в ход пошли квантизированные версии Mistral 3 и Llama 4 (3B и 7B параметров). Их загрузили в компьютер Sophia Space — тот самый, который мы разбирали в статье про космические компьютеры с пассивным охлаждением. Железка размером с книгу, процессор ARM, 32 ГБ RAM, SSD на 512 ГБ. Никаких вентиляторов — только радиаторы и тепловые трубки.

Red Hat адаптировала свой стек OpenShift для орбитального Edge. Получился бортовой кластер Kubernetes, который уживается в энергопотреблении 25 Вт. LLM работает как микросервис: принимает промпты через локальный API и выдаёт токены прямо на борту.

Зачем вообще космосу большой язык?

Астронавтам нужен ассистент, который не требует интернета. Локальный инференс решает три задачи:

Анализ научных данных — спектрограммы, снимки, показатели датчиков. Модель находит аномалии и выдаёт вердикт за секунды.
Управление роботами-ассистентами — без джойстика, голосом. "Возьми образец грунта" — и LLM транслирует команду для манипулятора.
Диагностика систем — чтение логов, поиск багов, предложение fix'ов. Типичный сценарий: "Двигатель ориентации показывает ошибку 0x7F. Что делать?"

💡

Похожие задачи уже решают локальные LLM на домашних ПК — разница только в том, что в космосе нет права на перезагрузку по SSH.

Технический гамбит: как квантизация пережила радиацию

Главная боль космического AI — Single Event Upsets. Частицы высокой энергии выбивают биты в RAM. Если LLM использует float32, один сбойный бит — и ответ превращается в кашу. NASA применила трюк: 4-битную квантизацию GGUF с избыточностью контрольной суммы. Каждый весовой блок повторяется трижды, и мажоритарное голосование восстанавливает данные.

Звучит как костыль, но работает. В тестах на имитаторе космического излучения модель сохраняла точность >95% при плотности флюенса 10^12 нейтронов/см². Без защиты — падение до 30%.

Второй вызов — энергия. Инференс Llama 4 на 7B в 4-bit занимает около 2 Вт·ч на запрос из 100 токенов. Для контекста: научный прибор на МКС может потреблять 50 Вт непрерывно. NASA укладывается в 10% от общего бюджета энергии — приемлемо, особенно если AI экономит часы ручной работы.

А что насчёт безопасности? (Спойлер: всё сложно)

Можно ли доверять LLM, который отвечает с вероятностной ошибкой? NASA ввела двойную валидацию: бортовой AI генерирует ответ, а маленькая древовидная нейросеть (классический Decision Forest) проверяет его на соответствие контракту — типа "не предлагай отключить систему жизнеобеспечения". Если проверка не проходит — ответ отбрасывается, идёт сигнал на Землю. Это жутко замедляет работу, но безопасность превыше.

Кстати, о безопасности: NASA признаёт, что текущие локальные LLM всё ещё склонны к галлюцинациям. В одном тесте модель посоветовала "увеличить давление в кислородном баллоне для ускорения реакции" — что могло привести к разрыву. Валидатор, к счастью, отклонил. Вывод: космос — не место для сырых моделей. Учитывая хронологию развития локальных LLM, качество растёт быстро — через два-три года такие ошибки станут редкостью.

Куда это нас ведёт?

Первая живая миссия с бортовым LLM запланирована на 2028 год — лунная база Artemis. Параллельно NASA готовит версию для марсианского орбитального аппарата, где задержка связи делает облачный AI бесполезным. Если тесты пройдут успешно, к 2030 году каждый ровер и каждый скафандр получит своего тихого AI-ассистента.

Но есть нюанс: Red Hat и NASA сознательно не раскрывают стоимость решения. Железо Sophia Space с защитой от радиации стоит $150 000 за штуку. Это не consumer-сегмент. Однако, как показывает история, космические технологии всегда сначала дороги, а потом — дешевеют. Сегодняшний эксперимент — завтрашний софт для промышленных дронов или автономных буров.

Совет в конце: если вы инженер и думаете, куда применить локальный LLM — смотрите не только на землю. Орбита, подводные станции, арктические базы. Любое место, где нет стабильного интернета, но есть электричество — ваш полигон. NASA показала, что маленький квантизированный язык может быть умнее, чем большой, но облачный. Пользуйтесь этим.

Подписаться на канал

NASA загнала ChatGPT в процессор размером с ладонь: зачем астронавтам локальный LLM

Что именно тестировали и на чём?

Зачем вообще космосу большой язык?

Технический гамбит: как квантизация пережила радиацию

А что насчёт безопасности? (Спойлер: всё сложно)

Куда это нас ведёт?

Подписывайтесь на наш канал!