Google снова перекроил собственную табличку с моделями. На Google I/O 2026 показали Gemini 3.5 Flash и её не менее интересную сестру Spark. Обе заточены под одно — агенты. Но если Flash — это молниеносный исполнитель, то Spark — нечто другое: always-on агенты, которые живут в фоне и таскают инструменты через MCP. Звучит как научная фантастика? Почти.

MCP — Model Context Protocol — это новый способ общения модели с внешним миром. Вместо того чтобы вбивать в промпт кучу контекста, агент сам находит нужные инструменты (API, базы, сервисы) и использует их на лету. Spark — первая модель, которая делает это в фоновом режиме.

Flash vs Spark: в чём разница?

Gemini 3.5 Flash по сути — эволюция прошлогодней Gemini 3 Flash. Она быстрее, дешевле и, как мы уже разбирали, сильно «выпрямлена» под агентные бенчмарки. Если вам нужно быстро сгенерировать JSON, дернуть API или распарсить документ — Flash справится за копейки. Но общение с ней напоминает разговор с очень вежливым роботом: правильно, сухо, без души.

А вот Gemini Spark — принципиально новая сущность. Это не просто модель, а платформа для always-on агентов. Spark работает в подписке (Google One AI Premium или отдельный тариф «Spark Agent»). Агент висит в фоне, подписан на события (например, новые письма, коммиты в репозиторий, изменения в таблице) и при появлении триггера выполняет цепочку действий через MCP-инструменты.

MCP: как это работает

Представьте, что ваш ассистент получил доступ к десяткам разных сервисов — Slack, Jira, Google Sheets, кастомные API. Обычная модель упирается в лимит контекста. Агент на MCP не тащит весь контекст в окно — он просто знает, что есть доступ к инструменту «search_jira» или «send_slack_message». Когда нужно, он вызывает его через протокол, получает результат и использует дальше.

💡

Spark может жить сутками. Вы настроили правило: «Если в GitHub появился PR от разработчика X и тесты провалились — отметь человека в Slack и создай задачу в Jira». Агент не забудет, не устанет, не перепутает. И всё это без вашего участия.

В предыдущей статье мы уже обсуждали, почему Google считает Flash лучшей для автономных агентов. Spark идёт дальше — она не просто модель, а полноценный рантайм для агентов с собственным API и SDK.

Сравнение с альтернативами

Характеристика	Google Gemini Spark	Claude 4 (Anthropic)	GPT-5 Agents (OpenAI)
Always-on работа	Да, нативно	Только через сторонние рантаймы	Через функции и ассистентов (не always-on)
MCP tool support	Полный, стандарт Google	Собственный протокол (не MCP совместимый)	Только кастомные функции
Цена за агентский час	~$0.50 (в подписке)	~$1.20	~$1.50
Качество диалога	Сухое, но предсказуемое	Естественное, эмоциональное	Близкое к человеческому
Простота настройки агента	Высокая (Google Agent Studio)	Средняя (API ручками)	Средняя (Assistants API)

Как видите, Spark выигрывает в нише фоновых автономных агентов. Но платит за это «роботизированностью» — модель не умеет шутить и креативить. Если вам нужен AI для творчества — берите Claude 4 или GPT-5. Для скучных, но важных операций — Spark незаменим.

Примеры использования

1 Мониторинг конкурентов в соцсетях

Spark висит и слушает Twitter, Reddit, новости. Как только появляется упоминание вашего бренда — модель анализирует тональность, ключевые слова и, если нужно, отправляет уведомление в Telegram. Всё через MCP-инструменты «search_social_media», «sentiment_analysis», «send_telegram».

2 Автоматизация DevOps-рутины

Агент подключается к GitLab/GitHub, Jira, Grafana. При падении теста на CI — собирает логи, открывает баг в Jira, тегает ответственного. Всё без участия человека. Раньше это делали пайплайны, но они были «глухими». Spark понимает причину ошибки (она же LLM!) и формулирует осмысленное описание.

3 Персональный ассистент по расписанию

Вы даёте Spark доступ к календарю, почте и CRM. Агент анализирует встречи, подготавливает краткие summary, проверяет конфликты, самостоятельно переносит неважные встречи (если настроено разрешение). И никогда не спит.

Не пытайтесь заставить Spark писать креативные тексты или генерировать дизайн. Это как таскать рояль на стройку — можно, но есть инструменты получше. Файнтюн под агентов сильно уродует диалог — Spark и Flash идеальны для работы, а не для бесед.

Что под капотом: технические детали

Gemini 3.5 Flash построен на новой архитектуре с улучшенным Mixture-of-Experts. Контекстное окно — 2 миллиона токенов (как у Gemini 2.5 Flash), но скорость выше в 2.5 раза благодаря квантованию и оптимизации внимания. Spark же — это не одна модель, а инференс-движок, который умеет держать в памяти состояние нескольких агентов одновременно, используя MCP для выноса контекста во внешние хранилища (например, Firestore или Postgres).

В обзоре Cactus Hybrid Router мы видели, как можно имитировать работу больших моделей маленькими. Со Spark такой номер не пройдёт — она специфична именно для долгоживущих агентов. Но если вам нужно просто дёшево обрабатывать много запросов — берите Flash, она дешевле.

Кому это нужно (и не нужно)

Spark подойдёт командам, которые хотят автоматизировать рутинные процессы: DevOps, техподдержка, мониторинг, интеграции. Особенно если у вас много кастомных сервисов — MCP легко расширяется. Flash подойдёт всем, кто пишет агентные workflow и хочет экономить на токенах: её цена и скорость — лучшие на рынке.

Не подойдёт, если вам нужен AI-собеседник или инструмент для творчества. Тут лучше посмотреть в сторону Gemini 2.5 Computer Use для управления экраном или на полноценные GPT-5, Claude 4. Но для «скучных» задач Spark — настоящее открытие.

🤖

Главный совет: не пытайтесь заставить Spark писать романы. Её сила — в терпении. Она будет снова и снова дёргать Jira, проверять логи, слать уведомления. Человек так не может (или не хочет). Позвольте агенту делать скучную работу — и вы увидите, насколько продуктивнее станет команда.

Подписаться на канал

Google Gemini 3.5 Flash и Spark: агенты, которые не спят. MCP на стероидах