Обещали дешевый ИИ. Получили $150 за миллион токенов
Помните 2023? Тогда все говорили о дефляции ИИ. Мол, софт станет дешевле электричества. GPT-4 тогда стоил $0.06 за 1K токенов. Сегодня Claude 3.7 Sonnet с его улучшенным reasoning просит $15 за тот же объем входных данных и $60 за выходные. Это не падение. Это рост в 10 раз за три года. Что случилось?
Цифра дня: $150. Именно столько сегодня стоит 1 миллион токенов для сложного анализа с использованием последней модели Anthropic Claude 3.7 Opus. Для сравнения: в 2023 году аналогичная задача обошлась бы в $60.
Вот парадокс: вычислительная мощность дешевеет (спасибо, Microsoft Maia 200 и другим специализированным чипам), но цена API-запросов ползет вверх. OpenAI, Google, Anthropic — все ведут себя как картель, хотя формально конкурируют. Почему? Потому что реальные затраты — это не только электричество для серверов.
Счет за мечту: из чего складывается цена токена в 2026
Разложим $150 за миллион токенов Claude 3.7 Opus по полочкам. Это не абстрактная цифра. Это сумма конкретных статей расходов, которые компании скрывают за красивым словом «инфраструктура».
| Статья затрат | Доля в цене | Комментарий |
|---|---|---|
| Инференс (энергия + амортизация железа) | ~35% ($52.5) | Даже с новыми чипами. Облачные провайдеры диктуют цены. |
| Покрытие расходов на обучение (R&D) | ~40% ($60) | Обучение Claude 3.7 оценивают в $500M+. Эти деньги нужно отбить. |
| Контекстное окно и память | ~15% ($22.5) | Поддержка 200K токенов контекста — это не бесплатный сыр. Оперативная память для этого стоит безумных денег. |
| Прибыль и наценка | ~10% ($15) | Anthropic — не благотворительность. Инвесторам нужна отдача. |
Самое смешное? Эта таблица — упрощение. Сюда не вошли затраты на безопасность (постоянные атаки на API), юридическое сопровождение (регуляторы ЕС и США дышат в спину), и зарплаты 500+ инженеров, которые поддерживают систему в рабочем состоянии 24/7. Когда у OpenAI финансовый кризис, они не могут просто снизить цены. Они выживают.
Миф о дешевом железе: почему новые чипы не спасают
«Вот выйдут Cerebras CS-4 или следующее поколение Maia — и все подешевеет!» — говорят оптимисты. Циничная реальность 2026 года другая.
Проект Stargate от OpenAI с бюджетом в $100 миллиардов — не про снижение стоимости для пользователя. Это про создание супер-интеллекта для избранных. Экономия на масштабе съедается аппетитами моделей. GPT-5 (или как там его называют) потребует в 100 раз больше ресурсов, чем GPT-4. И кто будет платить? Мы. Через те же API.
Вспомните сенсацию про DeepSeek R1 и конец эпохи миллиардных затрат. Сенсацией она и осталась. Китайские модели дешевле? Да. Но их цена для западного бизнеса — это цена плюс риски санкций, плюс проблемы с локализацией данных, плюс сомнительная поддержка. Бесплатный сыр только в мышеловке.
Тактика выживания: как компании маскируют настоящую стоимость
Вы не платите $150 за миллион токенов напрямую. Вам продают эту стоимость по частям, в красивой упаковке.
- Подписки с лимитами: «Всего $20 в месяц!» Но за эти $20 вы получаете 100 запросов к слабой модели. Хотите Claude Opus? Доплатите. Идеальный пример — AI в играх. Месячная подписка кажется мелкой тратой, пока не посчитаешь годовой бюджет.
- Слоуланинг (Slow-laning): Бесплатный тариф? Конечно! Только ваш запрос будет обработан через 30 секунд, когда серверы наименее загружены. Платите — получите приоритет. Это не скидка. Это искусственное создание дефицита.
- Fine-tuning как ловушка: Вам говорят: «Настройте модель под себя, будет дешевле!» Но сам процесс тонкой настройки на платформе вроде CompactAI — это отдельная статья расходов. А потом вы оказываетесь привязаны к их инфраструктуре. Выйти дороже, чем остаться.
Крупные игроки вроде Amazon и Google тратят сотни миллиардов на инфраструктуру (гонка AI Capex в действии). Эти инвестиции не делают ИИ дешевле для конечного разработчика. Они создают барьер для входа. Теперь только у них есть ресурсы для обучения моделей-монстров. А раз конкуренции нет — цены диктует тот, у кого серверы.
Что будет дальше? Прогноз на 2027-2028
Цены не упадут. Они станут сложнее.
- Дифференциация по качеству ответа: Уже сейчас Anthropic тестирует биллинг не только за токены, но и за «качество reasoning». Сложный многошаговый ответ будет стоить в 3-5 раз дороже простого перефразирования. Цена перестанет быть прозрачной.
- Пакетные сделки с привязкой: Как в мобильной связи 2000-х. «Купите 10 миллионов токенов на год вперед со скидкой 20%». Скидка будет, но вы застрянете с одним провайдером. Выйти — потерять деньги.
- Смерть среднего игрока: Небольшие компании, предлагающие API (раньше их называли «агрегаторами»), либо будут поглощены, либо закроются. Останутся 3-4 гиганта: OpenAI (Microsoft), Anthropic (Amazon/Google), возможно, Meta и один китайский. Картель усилится.
Единственный свет в конце тоннеля — специализированные, узкие модели. Не пытайтесь запускать GPT-5 для проверки орфографии в блоге. Возьмите маленькую, эффективную модель за $0.10 за миллион токенов. Но для этого нужна экспертиза. И она тоже стоит денег.
Итог: ИИ стал коммунальной услугой, как вода или электричество. Цена определяется не стоимостью производства, а монополией поставщиков и нашими растущими аппетитами. Готовьтесь платить больше. Или учитесь жить с меньшим.
Пока Tesla жжет миллиарды на роботов, а финансовая модель OpenAI трещит по швам, простым разработчикам остается одно: считать каждый токен. Потому что дешевле не станет. Никогда.