Февраль 2026 года стал точкой невозврата. OpenRouter — тот самый барометр индустрии, к которому прикованы взгляды тысяч разработчиков, — впервые выкатил топ-4 из одних open-weight моделей. GPT-5, Claude 4 и Gemini Ultra 2 рухнули вниз. Мы тогда писали, что это не случайность, а новый тренд. Прошло три месяца. Что изменилось? Короткий ответ: open-source не просто догнали закрытых гигантов — они их переехали по доле рынка.
Согласно свежим данным OpenRouter, на 18 июня 2026 года доля open-source моделей в общем объёме запросов составляет 54,7%. Проприетарные модели — 45,3%. Ещё в марте соотношение было 47% против 53% в пользу закрытых API. За три месяца открытый код откусил почти 8 процентных пунктов. Тенденция ускоряется.
Цифры: OpenRouter обработал за апрель-июнь 2026 года 12,3 триллиона токенов. Из них 6,73 триллиона пришлись на open-source модели — это больше, чем вся генерация проприетарных моделей вместе взятых.
Где собака зарыта? Три кита, на которых стоит рост
Первое — цена. Проприетарные API не дешевеют, а open-source становится доступнее. Провайдеры вроде Together AI или Groq режут цены на хостинг открытых моделей, потому что конкуренция растёт. Скажем, Qwen 2.5 MoE 32B стоит на OpenRouter $0.15 за миллион токенов — в 8 раз дешевле, чем GPT-5 Turbo. А качество — вровень. С такой разницей разработчикам не нужны отчеты Gartner, чтобы принять решение.
Второе — скорость. Z.AI выдаёт 431 токен/сек, обгоняя большинство закрытых API. А для real-time приложений это критично. Никто не хочет ждать, пока GPT-5 соизволит сгенерировать ответ.
Третье — прозрачность. Помните, как в феврале OpenRouter ввёл фактор прозрачности в алгоритм ранжирования? Теперь он штрафует модели без открытых весов. За три месяца это подстегнуло миграцию: разработчики поняли, что open-source можно форкать, дообучать и адаптировать под свои задачи. С закрытыми API такой номер не пройдёт.
Китайский фактор и новые инструменты
Отдельно стоит сказать про китайские модели. Ещё в начале года они были на вторых ролях, а сегодня MiniMax M2.7, Qwen и Ring 2.6 1T занимают три из пяти мест в топ-10 по объёму токенов. Ring 2.6 1T — open-weight модель с триллионом параметров — вышла в апреле и всего за два месяца набрала 15% всей генерации open-source. Да, триллион параметров. И её может запустить любой, у кого есть сервер с восемью H100.
Параллельно появились инструменты, которые помогают ориентироваться в этом зоопарке моделей. ModelGrep — утилита, которая фильтрует OpenRouter и других провайдеров по цене, скорости и качеству. Без неё выбор среди сотен open-source моделей превращается в лотерею. С ней — в осознанный поиск.
Не верьте тем, кто говорит, что open-source — это всегда компромисс по качеству. Парето-фронт 2026 года (карта цена/качество) показывает: лучшие open-source модели лежат на той же кривой, что и проприетарные. Деньги встречают интеллект — и open-source выигрывает по совокупности факторов.
Что это значит для вас (разработчика, стартапа, энтузиаста)
Если вы до сих пор льёте всё в GPT-5 — вы переплачиваете. Проверьте: Qwen 2.5 MoE, Mixtral 12x22B v2, Arcee Trinity Large — каждая из этих моделей выдаёт результат не хуже, а стоит в разы меньше. И вы не привязаны к одному API — переключились на провайдера с более низкой ценой или подняли модель у себя на сервере.
Да, есть задачи, где без проприетарных не обойтись — например, GPT-5 всё ещё лучше пишет сложные юридические документы или код на редких языках. Но это капля в море по сравнению с массовым использованием: чат-боты, суммаризация, перевод, генерация контента, RAG. Там open-source уже доминирует.
И главное — сообщество. Open-source модели обновляются каждую неделю. Команды вроде Qwen, Mistral, Arcee выкатывают новые версии быстрее, чем OpenAI успевает переписать промпты для GPT. Это не соревнование — это захват территории.
Прогноз на осень 2026: доля open-source перевалит за 60%. Проприетарные модели останутся в нишах — эксклюзивные сценарии, где нужна абсолютная точность или строгая модерация. Но в массовом сегменте закрытые API будут догонять открытые, как это уже случилось с ранжированием. И это не гипотеза — это уже реальность.