DeepMind и Boston Dynamics: Spot с AI-рассуждениями – видео (10.05.2026) | AiManual
AiManual Logo Ai / Manual.
10 Май 2026 Новости

DeepMind и Boston Dynamics: как AI-рассуждения делают робота Spot умнее (видео)

Робот Spot от Boston Dynamics научился рассуждать благодаря модели Gemini от DeepMind. Видео-демонстрация, технические детали и влияние на промышленную инспекци

Ваш робопес теперь работает аналитиком, а не курьером

Помните старого Spot — послушную железную собаку, которая бегала по командам и транслировала картинку оператору? Забудьте. DeepMind и Boston Dynamics выкатили совместное видео, от которого у инженеров на заводах случается когнитивный диссонанс. Spot больше не ждет инструкций. Он сам решает, что именно ему осмотреть, где искать проблему и как на нее реагировать. Без скриптов. Без удаленного оператора. Просто включил — и он начал думать.

Видео длится три минуты, но за ними — годы работы. В ролике Spot заходит на компрессорную станцию. Камера зависает на панели управления: десяток датчиков, один из которых показывает нештатное давление. Робот подходит ближе, меняет угол обзора, считывает данные, а затем... отворачивается и направляется к выходу. Он понял, что проблема не критична, но требует вмешательства — и в отчете появится пометка «вызвать инженера до конца смены». Это не запрограммированная реакция. Это цепочка рассуждений, развернутая внутри встроенной модели Gemini Robotics-ER 1.6.

Spot не просто фиксирует отклонение. Он строит гипотезу: «Это давление — случайный выброс или авария? Нужно перепроверить соседний манометр. Совпадает? Значит, не ошибка. Тогда какой протокол — остановка или наблюдение?». Каждый шаг — это внутренний монолог модели, который длится около 200 миллисекунд.

1Что изменилось под капотом?

Если раньше Spot был четвероногим исполнителем с жесткой логикой «если-то», то теперь внутри него живет мультимодальная модель, которая понимает контекст. Gemini Robotics-ER 1.6 запускается прямо на бортовом компьютере Spot — никакого облака, никаких задержек. Модель получает сырые потоки: облако точек с лидара, стереоизображение с камер, показания гироскопов. И превращает этот хаос в последовательность осмысленных действий.

Ключевой ингредиент — так называемый «режим размышления», позаимствованный из Gemini App (если вы не видели, как Deep Think работает в чате, представьте его как медленный, но глубокий анализ). Spot активирует его, когда сталкивается с неоднозначной ситуацией. Например, видит лужу на полу: это вода от конденсата или масло от утечки? Он меняет позицию, чтобы увидеть отражение, сличает с архивными сканами — и только тогда принимает решение.

Старый SpotНовый Spot с Gemini
Ждет команды оператораСтавит цели сам, исходя из контекста
Следует заданному маршрутуАдаптирует траекторию под обнаруженные аномалии
Транслирует картинку, решение за человекомФормирует отчет с рекомендациями
Не может объяснить свои действияСохраняет лог рассуждений (chain-of-thought)

Почему это не очередное «посмотрите, как мы научили робота ходить»

Честно: за последние два года мы видели десятки демонстраций, где роботы открывают двери, собирают кубики или танцуют. Разница в том, что эти трюки — результат жесткого программирования или поведения, вызубренного в симуляции. А Spot из нового видео импровизирует. Он никогда не видел именно эту панель датчиков, именно этот разводной ключ, оставленный на полу, именно эту комбинацию показателей. Он строит модель ситуации на лету.

Это прямое следствие подхода, который DeepMind развивает уже два года: embodied reasoning — способность AI рассуждать о физическом мире. В отличие от LLM, которые жуют текст и выдают текст, Gemini Robotics учится на реальных действиях и сенсорных данных. И результаты на пилотных проектах впечатляют: за первые три месяца тестов на нефтехимическом заводе в Роттердаме Spot с Gemini обнаружил 14 потенциальных инцидентов, пропущенных людьми, в том числе микротрещину в сварочном шве, которую нельзя было заметить без инфракрасной камеры.

💡
Для сравнения: подход Figure AI с моделью Helix 02 (мы писали о нем) делает упор на скорость моторных команд — 50 мс. А Gemini Robotics-ER жертвует скоростью ради глубины анализа. Spot может потратить целых 2 секунды на раздумья перед сложным маневром. И это осознанный выбор: безопасность на заводе важнее скорости.

Кому это нужно (спойлер: не только нефтяникам)

Да, первый очевидный рынок — промышленная инспекция. Но DeepMind и Boston Dynamics уже анонсировали SDK для Gemini Robotics-ER, которое позволит любому разработчику обучить Spot новым сценариям рассуждений. Например, на складах: робот не просто сканирует штрихкоды, а проверяет, не повреждена ли упаковка, не нарушены ли условия хранения. В логистике: Spot может оценивать загруженность проходов и оперативно перестраивать маршруты, не дожидаясь команды диспетчера.

Более того, эта же технология ляжет в основу новых версий Atlas — гуманоидного робота Boston Dynamics. На CES 2026 компания показывала Atlas с Gemini, но тогда это был прототип. Теперь, когда модель обкатана на тысячах часов реальной эксплуатации на Spot, порог внедрения на гуманоидов резко снижается.

Есть и обратная сторона: чем умнее робот, тем сложнее предсказать его поведение. Видео не показывает, как Spot ошибается. А такое обязательно будет. Gemini может неверно интерпретировать тень как трещину, или пройти мимо реальной утечки, решив, что «это нормально». Инженеры Boston Dynamics заявляют, что модель автоматически записывает сомнительные решения в журнал для ревью — но насколько оператор сможет доверять такой самостоятельности?

Что дальше? (я знаю, вы ждали прогноз)

Лично меня больше всего цепляет не сам факт «умной собаки», а то, как меняется наше отношение к роботам. Мы перестаем смотреть на них как на сложные дрели и начинаем видеть в них младших коллег. Они могут ошибаться, но могут и спасти от аварии. Через год Spot с Gemini будет стандартом для всех новых заводов в Европе и Азии. А через три — любой инженер-технолог сможет загрузить свою модель рассуждений под конкретное оборудование, как загружает приложение на телефон.

Так что совет всем, кто следит за этой темой: не зацикливайтесь на железе. Boston Dynamics делает лучшие в мире ноги. Но настоящий прорыв — в голове. И DeepMind только что показал, что эта голова умеет не просто считать, а думать. Как бы страшно и круто это ни звучало.

Подписаться на канал