Какая самая важная AI-модель от Google в 2025 году?

Семейство Gemini 2.0, особенно Gemini Ultra 2.0 — первая модель, преодолевшая барьер в 90% по тесту MMLU благодаря инновационной архитектуре «модульной экспертизы».

Что такое TPU Ironwood?

TPU Ironwood — это процессор пятого поколения Google для ускорения AI-вычислений. Он использует 3нм техпроцесс, архитектуру «вода-чип» для охлаждения и обеспечивает производительность 1.5 эксафлопс на стойку, что в 8 раз быстрее предыдущего поколения.

Как изменился Google Search в 2025 году?

Google Search полностью интегрирован с Gemini, превратившись из поисковой выдачи в диалогового AI-агента. Он теперь может синтезировать ответы из множества источников, выполнять многошаговые рассуждения и генерировать контент прямо в интерфейсе.

Итоги года Google AI 2025: 60 ключевых анонсов Gemini, TPU и Gemma

Q: Что такое Project Astra?

Project Astra — это внутренний проект Google по созданию универсального AI-агента, способного понимать контекст через камеру и микрофон, запоминать взаимодействия и выполнять задачи в реальном мире на основе мультимодального восприятия.

2025: Год, когда Google перезагрузил AI-ландшафт

Если 2023 год запомнился как год ChatGPT, а 2024 — как год мультимодальности, то 2025 однозначно войдет в историю как «год Google». Компания из Маунтин-Вью обрушила на рынок настоящий шквал инноваций, представив за 12 месяцев более 60 значимых AI-анонсов. От фундаментальных прорывов в архитектуре моделей до революции в пользовательских продуктах — мы проанализировали всё, что изменило правила игры.

Контекст: Этот взрывной год для Google стал ответом на растущее давление со стороны OpenAI, Microsoft и ряда успешных стартапов. Как показало исследование провала Copilot, рынок стал невероятно конкурентным, заставляя гигантов действовать быстрее и смелее.

Ядро революции: Модели Gemini нового поколения

Семейство Gemini стало центральным элементом стратегии Google. Вместо единого крупного релиза компания представила целый портфель специализированных моделей.

Gemini 2.0: Архитектурный прорыв

Gemini Ultra 2.0: Первая модель, преодолевшая барьер в 90% по тесту MMLU (Massive Multitask Language Understanding). Ключевая инновация — «модульная экспертиза», где разные части сети активируются для разных типов задач, что резко снижает вычислительные затраты на инференс.
Gemini Pro 2.0: Оптимизирована для разработчиков и предприятий. Поддержка контекста увеличена до 2 млн токенов, что эквивалентно 1500 страницам текста. Именно эта модель легла в основу революции в Google Translate.
Gemini Nano+: Модель для устройств на краю сети (edge). Может работать полностью офлайн на флагманских телефонах Pixel, обеспечивая приватность и мгновенный отклик.

Модель	Параметры	Ключевая особенность
Gemini Ultra 2.0	~3.2 трлн (оценка)	Модульная экспертиза, 90%+ MMLU
Gemini Pro 2.0	~700 млрд	Контекст 2M токенов, API для бизнеса
Gemini Nano+	~20 млрд	Полностью офлайн-работа на устройстве

Gemma 2: Открытые модели для всех

Продолжая стратегию открытости, Google выпустила Gemma 2 в трех размерах (2B, 7B, 70B параметров). Модели с 70B параметрами показали результаты, сопоставимые с Llama 3 70B, но с существенно более низкими требованиями к памяти благодаря новой технике сжатия «Sparse MoE».

# Пример запуска Gemma 2 7B локально с помощью transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-7b-it")
model = AutoModelForCausalLM.from_pretrained("google/gemma-2-7b-it", device_map="auto")

input_text = "Объясни квантовые вычисления простыми словами:"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids, max_length=200)
print(tokenizer.decode(outputs[0]))

Железо будущего: TPU Ironwood и Axion

Аппаратные анонсы Google в 2025 году произвели эффект разорвавшейся бомбы, особенно на фоне новостей о том, что Nvidia поглощает Groq. Google ответил собственными суперчипами.

💡

TPU Ironwood — это пятое поколение тензорных процессоров Google. Чип использует 3нм техпроцесс и архитектуру «вода-чип» для охлаждения. Производительность: 1.5 эксафлопс (FP16) на стойку. Это в 8 раз быстрее TPU v4. Ключевая особенность — встроенная поддержка смешанной точности (FP8, INT4) для сверхбыстрого инференса.

Параллельно был анонсирован процессор Google Axion — первый ARM-чип компании, созданный специально для AI-инференса в облаке. Он предлагает на 40% лучшее соотношение производительности к ватту по сравнению с аналогичными x86-процессорами.

Экспертное мнение: «С выпуском Ironwood и Axion Google впервые создала полноценный, закрытый стек для AI — от чипов до моделей и облачной платформы. Это прямая угроза доминированию Nvidia в аппаратном обеспечении для AI», — отмечает аналитик SAR Insight.

Поиск, который думает: «Project Astra» и новый Google Search

Самый заметный для миллиардов пользователей анонс — полная интеграция Gemini в Google Search. Теперь поиск — это не просто выдача ссылок, а диалоговый агент, способный:

Синтезировать ответы из десятков источников в реальном времени.
Выполнять многошаговые рассуждения (например, планировать путешествие с учетом бюджета, предпочтений и текущих цен).
Генерировать контент (код, тексты, изображения) прямо в интерфейсе поиска.

Внутренний «Project Astra» — это попытка создать универсального AI-агента, который может понимать контекст через камеру и микрофон, запоминать взаимодействия и выполнять задачи в реальном мире (например, «найди, где я оставил ключи, основываясь на вчерашнем видео с камеры»).

Рабочая станция будущего: Google Workspace × Gemini

В ответ на растущую популярность Copilot (несмотря на его проблемы) Google глубоко интегрировала Gemini в Gmail, Docs, Sheets и Meet. Новые функции включают:

«Писать за меня» в Gmail: AI не просто предлагает ответы, а ведет всю переписку, адаптируясь к стилю пользователя.
Анализ данных в Sheets через естественный язык: «Покажи сезонные тренды продаж и спрогнозируй выручку на следующий квартал».
AI-модератор встреч в Google Meet, который автоматически создает итоги, назначает задачи и отслеживает их выполнение.

Это напрямую повлияло на рабочие привычки миллионов людей, сместив фокус с создания контента на его редактирование и стратегическое планирование.

Облако как AI-суперкомпьютер: Google Cloud Platform

Для разработчиков и предприятий Google представила «AI Hypercluster» — распределенную сеть дата-центров, объединенных оптическими линиями связи со скоростью 1.6 Тбит/с. Это позволяет обучать модели размером с Gemini Ultra 2.0 в 2 раза быстрее, чем раньше.

1 Vertex AI Agent Builder

Новый фреймворк для создания специализированных AI-агентов без глубоких знаний в ML. Поддерживает подключение к более чем 200 корпоративным системам (Salesforce, SAP, Oracle) из коробки.

2 Gemini API с предсказуемой стоимостью

Google ввела модель ценообразования «Cost Guard», которая гарантирует, что стоимость инференса не превысит заданный бюджет, автоматически переключаясь между моделями разного размера.

# Пример использования нового Gemini API с Cost Guard
from google.cloud import aiplatform
from google.cloud.aiplatform_v1.types import content

client = aiplatform.gapic.PredictionServiceClient()

request = content.GenerateContentRequest(
    model="gemini-2.0-pro",
    contents=[...],
    cost_guard={
        "max_cost_usd": 0.50,  # Максимум 50 центов за запрос
        "fallback_model": "gemini-2.0-nano"  # Автоматический переход на более дешевую модель
    }
)
response = client.generate_content(request)

Что это значит для индустрии? Пять ключевых выводов

Конец эры монолитных моделей. Будущее за портфелями специализированных моделей (разных размеров, для разных задач), как показали Gemini 2.0 и Gemma 2.
Гонка аппаратного обеспечения вышла на новый уровень. С появлением TPU Ironwood и чипов Axion Google бросила прямой вызов Nvidia. Это может ускорить планы IPO других AI-компаний, стремящихся снизить зависимость от одного поставщика чипов.
AI становится невидимым. Самые мощные инновации (в поиске, Workspace) встроены прямо в существующие продукты. Пользователи получают AI-возможности, даже не задумываясь об этом.
Открытые vs. закрытые модели. Google играет на двух полях одновременно: мощные закрытые модели Gemini для продуктов и открытые Gemma для сообщества. Эта гибридная стратегия может стать новым стандартом.
Фокус смещается на инференс. Большинство анонсов 2025 года (от TPU Ironwood до Gemini Nano+) направлены на то, чтобы сделать запуск AI-моделей быстрее, дешевле и доступнее на любом устройстве.

Взгляд в 2026: Что дальше?

Сделав в 2025 году больше анонсов, чем за предыдущие три года вместе взятых, Google задала невероятно высокий темп. Ожидается, что в 2026 году фокус сместится на:

AI-агенты, способные действовать автономно (платить счета, бронировать рейсы, управлять умным домом).
Персонализацию в реальном времени — модели, которые адаптируются к конкретному пользователю за несколько взаимодействий.
Решение проблемы «галлюцинаций» раз и навсегда, возможно, через гибридные нейро-символьные архитектуры.

Одно можно сказать точно: после 60 трансформационных анонсов 2025 года Google вернула себе титул самого инновационного AI-игрока. И битва только начинается.

Google в 2025: 60 главных AI-анонсов, которые изменили всё