Вы нажимаете кнопку. ИИ начинает «мычать»
В Gemini App появилась новая кнопка – Deep Think. Нажимаете её, задаёте сложный вопрос вроде «спланируй двухнедельную поездку в Японию с учётом сезона дождей и моей аллергии на морепродукты», и вместо мгновенного ответа вы видите, как в окне чата появляются строчки текста. Медленно. С паузами. «Подумаю…», «Сначала нужно учесть географию…», «Июнь – действительно сезон цую…», «Альтернативные источники белка…».
Это не баг. Это фича. Google официально называет это «режимом глубокого размышления» (Deep Thinking Mode), и это самая заметная попытка за последний год визуализировать «цепочку рассуждений» (Chain-of-Thought) модели для обычного пользователя. Не в академической статье, а в приложении, которое стоит у вас на телефоне.
Актуальность на 01.02.2026: Режим Deep Think развёрнут в основной ветке Gemini App (версия 2026.01) и использует вычислительные ресурсы флагманской модели Gemini 3 Ultra. Ранее аналогичный режим тестировался в экспериментальном интерфейсе Gemini Advanced под названием «Пошаговое рассуждение».
Что на самом деле происходит под капотом? (Подсказка: это не мышление)
Когда вы видите эти «размышления», Gemini 3 не открывает глаза и не чешет затылок. Включается специальный конвейер обработки. Запрос пользователя проходит через несколько итеративных циклов внутри модели.
- Декомпозиция: Модель разбивает ваш монолитный запрос на подзадачи. Не «спланируй поездку», а «1. Определить регионы Японии, 2. Учесть погоду в июне, 3. Подобрать гипоаллергенное питание…».
- Поиск и верификация: Для каждого пункта активируется поиск в реальном времени (через Google Search API) и проверка внутренних знаний. Тот самый момент «Июнь – действительно сезон цую» – это сверка с актуальными погодными данными.
- Генерация промежуточных шагов: Системный промпт заставляет модель формулировать не только ответ, но и путь к нему, в формате, понятном человеку. Это и есть те самые строчки в чате.
- Синтез: Финальный этап – сборка всех проработанных блоков в связный, персонализированный ответ.
По сути, Deep Think – это UX-обёртка для техник Reasoning, прорыв в которых стал ключевым аргументом в релизе Gemini 3 против Gemini 2.5. Только теперь это не сухие баллы на графике, а то, что вы можете потрогать.
Психология доверия: зачем показывать «кухню»?
Раньше ИИ-ассистент был чёрным ящиком. Вопрос – пауза в 2 секунды – развёрнутый ответ. Магия? Шарлатанство? Пользователь не мог отличить глубокий анализ от красивого статистического подбора слов. Это убивало доверие к сложным ответам.
Deep Think ломает эту парадигму. Показывая процесс, Google решает сразу несколько проблем:
- Снижает ожидание мгновенного чуда. Видя, что ИИ «работает», пользователь готов ждать 15-20 секунд для сложного ответа. Это кардинально меняет планку задач, которые мы ему делегируем.
- Даёт возможность вмешаться. Заметили, что ИИ пошёл по неверному пути? («Нет, моя аллергия не на все морепродукты, только на моллюсков!»). Можно остановить генерацию, уточнить и запустить процесс заново. Это превращает диалог в коллаборацию.
- Создаёт иллюзию прозрачности. Да, это именно иллюзия – вы видите лишь сгенерированные для вас тезисы, а не настоящие «мысли» модели. Но этого достаточно, чтобы ответ воспринимался как обоснованный, а не высосанный из пальца.
Это прямой путь к тому самому Personal Intelligence AI Mode, где ассистент должен принимать решения на основе ваших личных данных. Кому вы доверите анализ своей почты и фото – магическому ящику или процессу, ход которого можно отследить?
Обратная сторона медали: когда «думать» раздражает
Не всё так радужно. После недели использования режим начинает бесить в двух случаях.
Первый – когда он включается для простых вопросов. Спросили «сколько будет 2+2?», а Gemini впадает в глубокомысленные раздумья: «Проанализирую базовую арифметику… Сложение целых чисел…». Это смешно первые два раза. Потом хочется кричать «Да отвечай уже!».
Второй случай хуже – когда процесс идёт по явно тупиковому пути, но ты не можешь его скорректировать точечно. Ты видишь, как ИИ упорно ищет рейсы в неверный аэропорт, и понимаешь, что проще всё отменить и переформулировать запрос с нуля. Потенциал для интерактивного исправления «на лету» есть, но реализован пока робко.
И главный вопрос – цена. Каждое такое «размышление» сжигает в разы больше вычислительных токенов, чем обычный ответ. Пока Google включает это в подписку Gemini Advanced. Но если этот режим станет мейнстримом, готовы ли мы платить за «честность» ИИ деньгами или рекламой? Или нас ждёт будущее, где быстрота ответа станет премиум-фичей, а «бесплатно» – только медленные раздумья?
Что дальше? От кнопки к автоматическому детектору сложности
Сейчас Deep Think – это ручной режим. Вы решаете, нужно ли модели «подумать». Следующий логичный шаг – чтобы ИИ сам определял сложность запроса и включал режим автоматически. Это уже прорабатывается в рамках агентных workflow Gemini 3 Flash.
Но настоящая революция начнётся, когда эта логика рассуждений станет кросс-платформенной. Представьте, что вы работаете в сайдбаре Gemini в Chrome, и он не просто ищет информацию, а в реальном времени показывает вам цепочку: «Вот статья X, но её данные устарели. Вот свежее исследование Y, однако выборка мала. Следовательно, наиболее вероятный ответ – Z». Это убьёт слепое доверие к первой ссылке в поиске.
Или возьмём Gemini Computer Use. Вместо того чтобы молча кликать по интерфейсу, ассистент мог бы комментировать: «Ищу кнопку экспорта. Не нахожу в меню «Файл». Проверю панель инструментов. Вот она, но она неактивна. Значит, сначала нужно выделить данные…».
Прогноз: К концу 2026 года «режимы размышления» станут стандартом для всех премиум-ассистентов. Но их главным вызовом будет не технология, а дизайн. Как показывать сложные процессы, не перегружая пользователя? Как отличать полезную прозрачность от назойливого шума? Ответа пока нет. Но ясно одно – эпоха ИИ как мгновенного оракула заканчивается. Начинается эра ИИ как медленного, но внятного коллеги, который не прочь показать черновик.
Так что в следующий раз, нажимая Deep Think, помните: вы наблюдаете не за мышлением машины. Вы наблюдаете за рождением нового языка взаимодействия между человеком и алгоритмом. Языка, где скорость больше не главная валюта. Главная валюта теперь – понятная, пусть и медленная, логика.