Американский завтрак закончился
Еще год назад разговор про ИИ начинался с "GPT или Claude?" Теперь это звучит как вопрос про выбор между iPhone и Nokia в 2010. Пока OpenAI и Google делили рынок закрытыми API, китайские компании делали ставку на открытость. И в январе 2026 года мы видим результат: MiMo V2 Flash от Xiaomi и Kimi K2.5 от Moonshot AI не просто догнали западные аналоги — они переписали правила.
На 28.01.2026 обе модели доступны с полностью открытыми весами. MiMo V2 Flash работает локально на потребительском железе, Kimi K2.5 предлагает бесплатный API с контекстом до 1 млн токенов. OpenAI с GPT-4.5 за $20 в месяц и ограниченным API выглядит архаично.
MiMo V2 Flash: математик в кармане
Xiaomi сделала то, что не смогли (или не захотели) американские гиганты — создала модель, которая действительно понимает математику. Не просто генерирует формулы по шаблону, а решает задачи уровня магистратуры по физике и компьютерным наукам.
В нашем предыдущем обзоре MiMo V2 Flash мы уже писали про ее архитектурные особенности. Но за последние месяцы модель получила критическое обновление — оптимизацию под потребительские GPU. Теперь она работает на RTX 4090 с полной скоростью, потребляя вдвое меньше памяти, чем аналогичные модели от Meta.
| Модель | Разработчик | Цена API (за 1M токенов) | Открытые веса | MATH бенчмарк |
|---|---|---|---|---|
| MiMo V2 Flash | Xiaomi AI | Бесплатно (локально) | Да | 92.3% |
| GPT-4.5 | OpenAI | $15-60 | Нет | 89.7% |
| Gemini Ultra 2.1 | $7.50-37.50 | Нет | 88.1% | |
| Kimi K2.5 | Moonshot AI | Бесплатно (ограничения) | Да | 85.4% |
Цифры говорят сами за себя. Но главное не в процентах, а в подходе. Xiaomi выпустила документацию, где подробно объясняет, как дообучить модель под свои задачи. Не через закрытый fine-tuning API за дополнительные деньги, а прямо на своем железе. Это меняет все для исследовательских групп и стартапов.
Kimi K2.5: триллион параметров, которые не стоят денег
Moonshot AI пошла другим путем. Вместо специализации на математике они сделали ставку на архитектуру Mixture of Experts (MoE) с 384 экспертами и 1 трлн параметров. Звучит как что-то, что требует дата-центр стоимостью с бюджет небольшой страны. Но нет.
Что действительно бесит в подходе американских компаний? Они берут деньги за доступ к API, но не дают контроля над данными. Kimi K2.5 решает это радикально — открытые веса плюс бесплатный API с лимитом 10 млн токенов в месяц для некоммерческого использования. Для сравнения: у OpenAI бесплатный доступ закончился в 2023 году.
Технические детали архитектуры мы разбирали в отдельной статье про Kimi K2.5. Но здесь важно другое: Moonshot AI публикует не только модель, но и инструменты для ее развертывания. Интеграция с vLLM и SGLang решает проблемы, которые месяцами игнорировали в OpenAI.
Почему это работает сейчас, а не раньше?
Три фактора, которые изменили игру к январю 2026:
- Китайские датасеты стали лучше западных. Раньше это был секрет полишинеля — китайские модели тренировали на переведенных английских данных. Теперь у них собственные корпуса на китайском, японском, корейском объемом в десятки триллионов токенов. И да, они включают русский.
- Аппаратное ускорение перестало быть проблемой. Ascend 910B от Huawei и другие китайские чипы теперь конкурируют с NVIDIA на равных. Локальное развертывание стало дешевле в 3-4 раза по сравнению с 2024 годом.
- Бизнес-модель "закрытый API" устарела. Крупные компании хотят контролировать свои данные. Стартапы не хотят платить 70% выручки за токены. Открытые модели решают обе проблемы.
Не обольщайтесь — китайские модели имеют свои ограничения. Политическая цензура встроена на уровне данных. Запросы про Тайвань, Тибет или критика китайского правительства будут либо отклонены, либо дадут "нейтральный" ответ. Это цена за доступ к технологиям.
Что делать, если вы разработчик в 2026 году?
Забудьте про выбор между OpenAI и Anthropic. Теперь у вас есть реальные альтернативы:
- Для математики и научных расчетов — MiMo V2 Flash локально. Модель весит 62 ГБ в формате GPTQ, работает на RTX 4090. Не платите за API, который все равно хуже справляется с уравнениями.
- Для общего чата и работы с документами — Kimi K2.5 через их API или локально, если есть H100/H200. Контекст в 1 млн токенов означает, что вы можете загрузить целую книгу и задавать вопросы по ней. GPT-4.5 дает максимум 128к.
- Для нишевых задач — дообучайте китайские модели под свои нужды. Веса открыты, инструменты есть. В статье про квантование Kimi есть детали, как оптимизировать модель под конкретное железо.
Самый болезненный момент для американских компаний? Китайские модели показывают, что можно делать качественный ИИ без ежемесячной подписки за $20. Moonshot AI зарабатывает на корпоративных решениях и оптимизации инфраструктуры, а не на продаже токенов студентам и разработчикам.
Что будет дальше? (Спойлер: война только начинается)
На конференции AGI-NEXT в декабре 2025 уже было ясно — китайские компании не собираются останавливаться. DeepSeek анонсировала V4, MiniMax готовит M2.2, а Baidu обновляет Ernie.
Но настоящая битва будет не между моделями, а между экосистемами. Xiaomi интегрирует MiMo V2 Flash в свои смартфоны и умные устройства. Представьте: математический помощник, который решает задачи по фото, работает оффлайн и не отправляет данные в облако. Google с Gemini этого не предлагает.
Moonshot AI строит экосистему вокруг Kimi — от чат-интерфейса до API для предприятий. Их AMA-сессия с разработчиками показала амбиции: они хотят стать стандартом для азиатского рынка, как OpenAI для западного.
Что делать вам? Перестаньте думать, что "настоящий ИИ" только у OpenAI. Скачайте MiMo V2 Flash, попробуйте Kimi K2.5 API. Через месяц вы поймете, что платить $20 за ChatGPT Plus — это как покупать воду в бутылках, когда из крана течет артезианская.
И да, следите за гонкой китайских LLM в 2025-2026. Там будет жарче, чем в противостоянии OpenAI и Google. Потому что когда конкурируют несколько сильных игроков с разными подходами, выигрывают все. Кроме тех, кто продолжает платить за устаревшую монополию.