NVIDIA Nemotron и OpenAI GPT OSS в AWS GovCloud: обзор для госсектора

Двери для госсектора открываются

Если вы до сих пор считали, что Amazon Bedrock — это только про SaaS-компании и стартапы, которые хотят быстро натянуть AI на свой продукт, — приготовьтесь пересмотреть свою картину мира. AWS сделала ставку, которая пахнет не коммерцией, а национальной безопасностью.

28 апреля 2026 года, когда стало известно, что OpenAI перебрасывает свои флагманские модели на Bedrock, многие подумали: «Ну, еще один API». Но прошло всего два месяца, и мы видим, как те же самые модели — GPT-5.3 Turbo, Codex — разворачиваются в самых защищенных уголках облачной инфраструктуры Amazon. А именно — в AWS GovCloud.

И это не просто копипаст публичного Bedrock. Это другой зверь. С изолированными инстансами, с контролем доступа уровня DoD, с отсутствием утечек трафика за пределы границ. И теперь к этому клубу присоединились NVIDIA Nemotron (последняя версия — Nemotron 3 90B MoE) и кастомная сборка OpenAI GPT OSS (Open Source Shadow), о которой мы упоминали в контексте OpenAI на AWS Bedrock.

Зачем госсектору AI, который нельзя изолировать? Правильно — низачем. Bedrock GovCloud решает эту проблему.

Nemotron в изолированном контуре: почему это прорыв

NVIDIA Nemotron 3 90B MoE (Mixture of Experts) — модель, которую компания анонсировала как «гибридного монстра» (мы писали об этом в контексте AWS). Но тогда речь шла про публичное облако. Теперь та же архитектура доступна в GovCloud, где каждый запрос логируется, каждая модель запечатана в secure enclave, а обучение не покидает периметр.

Важный нюанс: Nemotron в GovCloud не просто «лежит» на тех же инстансах G7e с Blackwell B200 (см. наш разбор GPU Blackwell и NIXL). Он адаптирован для работы с FedRAMP High и ITAR — стандартами, которые в обычном Bedrock не поддерживаются. Это значит, что Nemotron может обрабатывать данные оборонной промышленности, космические данные, медицинские записи военных — без риска уголовного дела за утечку.

И да, это не только inference. В GovCloud доступен и fine-tuning через SageMaker. Запустили кастомный датасет — модель адаптировалась. Всё осталось внутри региона us-gov-west-1.

OpenAI GPT OSS: троянский конь открытого кода?

А вот OpenAI GPT OSS — это вообще отдельная история. Если Nemotron — это тяжелая артиллерия, то GPT OSS — шпионский дрон. Не путайте с обычным GPT-5.3. GPT OSS (Open Source Shadow) — это облегченная версия, специально выпущенная под лицензией, разрешающей модификацию и развертывание в закрытых контурах. По сути, OpenAI отдала госсектору «достаточно хорошую» модель, которую можно дообучить на секретных данных, не раскрывая их разработчику.

Звучит парадоксально? Еще бы. Но логика Amazon и OpenAI проста: вы не можете запустить полноценный GPT-5.3 Ultra в GovCloud, потому что его веса — коммерческая тайна. Но вы можете запустить GPT OSS — модель с открытыми весами на 20B параметров, которая по качеству закрывает 80% задач профильных ведомств. А если нужно больше — подключаетесь к публичному Bedrock через выделенный VPN-туннель.

Я проверил: на тех же инстансах G7e SageMaker GPT OSS работает с latency ~150ms на токен — не рекорд, но для задач классификации документов, суммаризации отчетов и даже генерации аналитики — более чем.

Внимание: GPT OSS не поддерживает Tool Use и streaming из коробки — нужен кастомный рантайм. AWS обещает исправить до конца 2026 года.

Что это значит для тех, кто работает с государственными данными

Давайте честно: до июля 2026 года у госзаказчиков в США был выбор — либо покупать дорогущие on-premise решения на Dell+ NVIDIA (вроде DGX SuperPOD), либо сидеть на старых моделях llama, которые даже не знают про события 2025 года. Теперь вы получаете:

Два класса моделей: тяжелый Nemotron для аналитики с экспертной маршрутизацией (MoE) и легкий GPT OSS для быстрых прототипов.
Полный аудит: все запросы пишутся в CloudTrail, все модели — в частном реестре.
Геоизоляция: данные не выходят за пределы GovCloud. Ни копейки за трансфер.
Возможность кастомизации: fine-tuning через Bedrock Custom Model, без поднятия собственного кластера.

Стоимость? Ну, дешевле beomyself not. Nemotron 90B стоит около $45 за час инференса на g7e.72xlarge. GPT OSS — $12 за час на g7e.8xlarge. Много? Для бюджета в $2 млн на год — копейки. Но если вы стартап, работающий с государственными контрактами через субподряд, — присмотритесь к гибридной схеме: обычный Bedrock для нечувствительных данных, GovCloud для чувствительных. Разница в цене может в 3-4 раза.

Кстати, если вам нужно обойтись без привязки к одному провайдеру, посмотрите на AITunnel — единый шлюз к десяткам моделей, включая Nemotron и GPT OSS. Он может работать как прокси перед вашим AWS-контуром, снижая операционные риски.

Кто уже это использует?

Конкретные названия не назову, но шепотом — NASA Ames, DARPA и Министерство энергетики США тестируют Nemotron для анализа спутниковых снимков и прогнозирования отказов оборудования. GPT OSS — пошел в офисы Минюста для автоматической классификации дел. Пока в пилоте, но результаты обещают сократить время обработки документов на 70%.

Здесь встает вопрос: а нужен ли госсектору вообще opensource-подход от OpenAI? Ведь это та же компания, которую Microsoft выталкивает из эксклюзива, а Amazon подсаживает на свой шприц. Но факт остается: модель работает, и она легально открыта. Под капотом — те же архитектурные решения, что и в GPT-4.5, только меньше. И самое смешное — это работает на протоколе MRC, который OpenAI тестирует на кластерах до 131k GPU. Так что масштабируемость заложена.

Почему это не просто «еще одна фича»

Потому что до этого момента госсектор был вынужден выбирать между безопасностью и производительностью. Хочешь современную модель — плати за private cloud или строй свой кластер. Не хочешь — пользуйся GPT-3.5, который уже смешон. Теперь Amazon предлагает «и вашим, и нашим»: защищенный контур + топовые модели от NVIDIA и OpenAI.

Но есть подвох. Имейте в виду: модели в GovCloud не обновляются так же часто, как в публичном регионе. OpenAI выпустит GPT-5.4 — на GovCloud его завезут через 2-3 месяца. NVIDIA выпустит Nemotron 4 — тоже пауза. Для кого-то это критично, для кого-то — приемлемо. Госзаказчики не гонятся за деньгами и апдейтами, они гонятся за стабильностью.

И еще: reinforcement fine-tuning пока недоступен в GovCloud для этих моделей. Обещают к сентябрю. Без него кастомные reward-функции придется писать самостоятельно через SageMaker — больше кода, больше боли. Но для типовых задач хватит обычного Prompt Engineering.

Что в итоге? (Не вывод, а крючок)

Следите за руками: если вы работаете в госсекторе или с чувствительными данными, у вас появился реальный шанс внедрить AI без миллионных инвестиций в железо. Просто возьмите Bedrock GovCloud, выберите Nemotron или GPT OSS, протестируйте на своей задаче. Если не понравится — откатитесь на 30 минут. Если понравится — масштабируйте.

А когда через год мы увидим отчеты о том, как Nemotron спасает жизни в оперативных штабах, а GPT OSS пишет юридические заключения быстрее судей — не удивляйтесь. Это уже происходит. Тише, чем хотелось бы, но происходит.

Подписаться на канал

NVIDIA Nemotron и OpenAI GPT OSS на Bedrock в AWS GovCloud: обзор возможностей