Почему цены на AI не падают: скрытые затраты больших моделей в 2026

Обещали дешевый ИИ. Получили $150 за миллион токенов

Помните 2023? Тогда все говорили о дефляции ИИ. Мол, софт станет дешевле электричества. GPT-4 тогда стоил $0.06 за 1K токенов. Сегодня Claude 3.7 Sonnet с его улучшенным reasoning просит $15 за тот же объем входных данных и $60 за выходные. Это не падение. Это рост в 10 раз за три года. Что случилось?

Цифра дня: $150. Именно столько сегодня стоит 1 миллион токенов для сложного анализа с использованием последней модели Anthropic Claude 3.7 Opus. Для сравнения: в 2023 году аналогичная задача обошлась бы в $60.

Вот парадокс: вычислительная мощность дешевеет (спасибо, Microsoft Maia 200 и другим специализированным чипам), но цена API-запросов ползет вверх. OpenAI, Google, Anthropic — все ведут себя как картель, хотя формально конкурируют. Почему? Потому что реальные затраты — это не только электричество для серверов.

Счет за мечту: из чего складывается цена токена в 2026

Разложим $150 за миллион токенов Claude 3.7 Opus по полочкам. Это не абстрактная цифра. Это сумма конкретных статей расходов, которые компании скрывают за красивым словом «инфраструктура».

Статья затрат	Доля в цене	Комментарий
Инференс (энергия + амортизация железа)	~35% ($52.5)	Даже с новыми чипами. Облачные провайдеры диктуют цены.
Покрытие расходов на обучение (R&D)	~40% ($60)	Обучение Claude 3.7 оценивают в $500M+. Эти деньги нужно отбить.
Контекстное окно и память	~15% ($22.5)	Поддержка 200K токенов контекста — это не бесплатный сыр. Оперативная память для этого стоит безумных денег.
Прибыль и наценка	~10% ($15)	Anthropic — не благотворительность. Инвесторам нужна отдача.

Самое смешное? Эта таблица — упрощение. Сюда не вошли затраты на безопасность (постоянные атаки на API), юридическое сопровождение (регуляторы ЕС и США дышат в спину), и зарплаты 500+ инженеров, которые поддерживают систему в рабочем состоянии 24/7. Когда у OpenAI финансовый кризис, они не могут просто снизить цены. Они выживают.

Миф о дешевом железе: почему новые чипы не спасают

«Вот выйдут Cerebras CS-4 или следующее поколение Maia — и все подешевеет!» — говорят оптимисты. Циничная реальность 2026 года другая.

💡

Эффект Джевонса в ИИ: когда технология становится эффективнее, ее общее потребление не падает, а растет. Дешевый инференс? Отлично, давайте запустим в 10 раз больше агентов, с бОльшим контекстом. Общие затраты остаются прежними или растут.

Проект Stargate от OpenAI с бюджетом в $100 миллиардов — не про снижение стоимости для пользователя. Это про создание супер-интеллекта для избранных. Экономия на масштабе съедается аппетитами моделей. GPT-5 (или как там его называют) потребует в 100 раз больше ресурсов, чем GPT-4. И кто будет платить? Мы. Через те же API.

Вспомните сенсацию про DeepSeek R1 и конец эпохи миллиардных затрат. Сенсацией она и осталась. Китайские модели дешевле? Да. Но их цена для западного бизнеса — это цена плюс риски санкций, плюс проблемы с локализацией данных, плюс сомнительная поддержка. Бесплатный сыр только в мышеловке.

Тактика выживания: как компании маскируют настоящую стоимость

Вы не платите $150 за миллион токенов напрямую. Вам продают эту стоимость по частям, в красивой упаковке.

Подписки с лимитами: «Всего $20 в месяц!» Но за эти $20 вы получаете 100 запросов к слабой модели. Хотите Claude Opus? Доплатите. Идеальный пример — AI в играх. Месячная подписка кажется мелкой тратой, пока не посчитаешь годовой бюджет.
Слоуланинг (Slow-laning): Бесплатный тариф? Конечно! Только ваш запрос будет обработан через 30 секунд, когда серверы наименее загружены. Платите — получите приоритет. Это не скидка. Это искусственное создание дефицита.
Fine-tuning как ловушка: Вам говорят: «Настройте модель под себя, будет дешевле!» Но сам процесс тонкой настройки на платформе вроде CompactAI — это отдельная статья расходов. А потом вы оказываетесь привязаны к их инфраструктуре. Выйти дороже, чем остаться.

Крупные игроки вроде Amazon и Google тратят сотни миллиардов на инфраструктуру (гонка AI Capex в действии). Эти инвестиции не делают ИИ дешевле для конечного разработчика. Они создают барьер для входа. Теперь только у них есть ресурсы для обучения моделей-монстров. А раз конкуренции нет — цены диктует тот, у кого серверы.

Что будет дальше? Прогноз на 2027-2028

Цены не упадут. Они станут сложнее.

Дифференциация по качеству ответа: Уже сейчас Anthropic тестирует биллинг не только за токены, но и за «качество reasoning». Сложный многошаговый ответ будет стоить в 3-5 раз дороже простого перефразирования. Цена перестанет быть прозрачной.
Пакетные сделки с привязкой: Как в мобильной связи 2000-х. «Купите 10 миллионов токенов на год вперед со скидкой 20%». Скидка будет, но вы застрянете с одним провайдером. Выйти — потерять деньги.
Смерть среднего игрока: Небольшие компании, предлагающие API (раньше их называли «агрегаторами»), либо будут поглощены, либо закроются. Останутся 3-4 гиганта: OpenAI (Microsoft), Anthropic (Amazon/Google), возможно, Meta и один китайский. Картель усилится.

Единственный свет в конце тоннеля — специализированные, узкие модели. Не пытайтесь запускать GPT-5 для проверки орфографии в блоге. Возьмите маленькую, эффективную модель за $0.10 за миллион токенов. Но для этого нужна экспертиза. И она тоже стоит денег.

Итог: ИИ стал коммунальной услугой, как вода или электричество. Цена определяется не стоимостью производства, а монополией поставщиков и нашими растущими аппетитами. Готовьтесь платить больше. Или учитесь жить с меньшим.

Пока Tesla жжет миллиарды на роботов, а финансовая модель OpenAI трещит по швам, простым разработчикам остается одно: считать каждый токен. Потому что дешевле не станет. Никогда.

Цена на токены: почему ИИ никогда не станет дешевым

Обещали дешевый ИИ. Получили $150 за миллион токенов

Счет за мечту: из чего складывается цена токена в 2026

Миф о дешевом железе: почему новые чипы не спасают

Тактика выживания: как компании маскируют настоящую стоимость

Что будет дальше? Прогноз на 2027-2028

Подписывайтесь на наш канал!