Google снова перекроил собственную табличку с моделями. На Google I/O 2026 показали Gemini 3.5 Flash и её не менее интересную сестру Spark. Обе заточены под одно — агенты. Но если Flash — это молниеносный исполнитель, то Spark — нечто другое: always-on агенты, которые живут в фоне и таскают инструменты через MCP. Звучит как научная фантастика? Почти.
MCP — Model Context Protocol — это новый способ общения модели с внешним миром. Вместо того чтобы вбивать в промпт кучу контекста, агент сам находит нужные инструменты (API, базы, сервисы) и использует их на лету. Spark — первая модель, которая делает это в фоновом режиме.
Flash vs Spark: в чём разница?
Gemini 3.5 Flash по сути — эволюция прошлогодней Gemini 3 Flash. Она быстрее, дешевле и, как мы уже разбирали, сильно «выпрямлена» под агентные бенчмарки. Если вам нужно быстро сгенерировать JSON, дернуть API или распарсить документ — Flash справится за копейки. Но общение с ней напоминает разговор с очень вежливым роботом: правильно, сухо, без души.
А вот Gemini Spark — принципиально новая сущность. Это не просто модель, а платформа для always-on агентов. Spark работает в подписке (Google One AI Premium или отдельный тариф «Spark Agent»). Агент висит в фоне, подписан на события (например, новые письма, коммиты в репозиторий, изменения в таблице) и при появлении триггера выполняет цепочку действий через MCP-инструменты.
MCP: как это работает
Представьте, что ваш ассистент получил доступ к десяткам разных сервисов — Slack, Jira, Google Sheets, кастомные API. Обычная модель упирается в лимит контекста. Агент на MCP не тащит весь контекст в окно — он просто знает, что есть доступ к инструменту «search_jira» или «send_slack_message». Когда нужно, он вызывает его через протокол, получает результат и использует дальше.
В предыдущей статье мы уже обсуждали, почему Google считает Flash лучшей для автономных агентов. Spark идёт дальше — она не просто модель, а полноценный рантайм для агентов с собственным API и SDK.
Сравнение с альтернативами
| Характеристика | Google Gemini Spark | Claude 4 (Anthropic) | GPT-5 Agents (OpenAI) |
|---|---|---|---|
| Always-on работа | Да, нативно | Только через сторонние рантаймы | Через функции и ассистентов (не always-on) |
| MCP tool support | Полный, стандарт Google | Собственный протокол (не MCP совместимый) | Только кастомные функции |
| Цена за агентский час | ~$0.50 (в подписке) | ~$1.20 | ~$1.50 |
| Качество диалога | Сухое, но предсказуемое | Естественное, эмоциональное | Близкое к человеческому |
| Простота настройки агента | Высокая (Google Agent Studio) | Средняя (API ручками) | Средняя (Assistants API) |
Как видите, Spark выигрывает в нише фоновых автономных агентов. Но платит за это «роботизированностью» — модель не умеет шутить и креативить. Если вам нужен AI для творчества — берите Claude 4 или GPT-5. Для скучных, но важных операций — Spark незаменим.
Примеры использования
1 Мониторинг конкурентов в соцсетях
Spark висит и слушает Twitter, Reddit, новости. Как только появляется упоминание вашего бренда — модель анализирует тональность, ключевые слова и, если нужно, отправляет уведомление в Telegram. Всё через MCP-инструменты «search_social_media», «sentiment_analysis», «send_telegram».
2 Автоматизация DevOps-рутины
Агент подключается к GitLab/GitHub, Jira, Grafana. При падении теста на CI — собирает логи, открывает баг в Jira, тегает ответственного. Всё без участия человека. Раньше это делали пайплайны, но они были «глухими». Spark понимает причину ошибки (она же LLM!) и формулирует осмысленное описание.
3 Персональный ассистент по расписанию
Вы даёте Spark доступ к календарю, почте и CRM. Агент анализирует встречи, подготавливает краткие summary, проверяет конфликты, самостоятельно переносит неважные встречи (если настроено разрешение). И никогда не спит.
Не пытайтесь заставить Spark писать креативные тексты или генерировать дизайн. Это как таскать рояль на стройку — можно, но есть инструменты получше. Файнтюн под агентов сильно уродует диалог — Spark и Flash идеальны для работы, а не для бесед.
Что под капотом: технические детали
Gemini 3.5 Flash построен на новой архитектуре с улучшенным Mixture-of-Experts. Контекстное окно — 2 миллиона токенов (как у Gemini 2.5 Flash), но скорость выше в 2.5 раза благодаря квантованию и оптимизации внимания. Spark же — это не одна модель, а инференс-движок, который умеет держать в памяти состояние нескольких агентов одновременно, используя MCP для выноса контекста во внешние хранилища (например, Firestore или Postgres).
В обзоре Cactus Hybrid Router мы видели, как можно имитировать работу больших моделей маленькими. Со Spark такой номер не пройдёт — она специфична именно для долгоживущих агентов. Но если вам нужно просто дёшево обрабатывать много запросов — берите Flash, она дешевле.
Кому это нужно (и не нужно)
Spark подойдёт командам, которые хотят автоматизировать рутинные процессы: DevOps, техподдержка, мониторинг, интеграции. Особенно если у вас много кастомных сервисов — MCP легко расширяется. Flash подойдёт всем, кто пишет агентные workflow и хочет экономить на токенах: её цена и скорость — лучшие на рынке.
Не подойдёт, если вам нужен AI-собеседник или инструмент для творчества. Тут лучше посмотреть в сторону Gemini 2.5 Computer Use для управления экраном или на полноценные GPT-5, Claude 4. Но для «скучных» задач Spark — настоящее открытие.