Когда 90K токенов - это не роскошь, а необходимость
В феврале 2026 года я получил доступ к Step 3.5 Flash - модели, которая позиционируется как "OpenCode Interpreter на стероидах". Цена вопроса: $0.15 за 1M входных токенов, скорость ответа 800-1200ms, контекстное окно 90,000 токенов. Звучит как маркетинг? Возможно. Но когда тебе нужно проанализировать 50 файлов проекта и написать рабочую миграцию - это уже не маркетинг, а вопрос выживания.
На 13.02.2026 Step 3.5 Flash - одна из немногих моделей с поддержкой OpenCode Interpreter из коробки. Это не просто "умеет писать код", а полноценная среда выполнения с доступом к файловой системе, установкой пакетов и отладкой.
Тестовый стенд: три титана и одна сложная задача
Сравнивал три модели:
- Step 3.5 Flash (последняя версия на 13.02.2026) - через официальный API
- Gemini 3.0 Pro (не Flash версия) - через Vertex AI
- Claude 4.6 (последний стабильный релиз) - через Anthropic API
Задача: миграция legacy Django проекта с Python 3.7 на Python 3.11. В контексте:
- 45 файлов кода (около 12,000 строк)
- requirements.txt с 28 зависимостями
- Dockerfile и docker-compose.yml
- Документация по устаревшим API (8 страниц)
- Инструкция от заказчика с 15 конкретными требованиями
Общий размер контекста: 78,432 токена. Почти под завязку.
| Модель | Время обработки | Точность анализа | Качество кода | Стоимость (за задачу) |
|---|---|---|---|---|
| Step 3.5 Flash | 4 мин 23 сек | 94% | Работающий код с первого запуска | $0.012 |
| Gemini 3.0 Pro | 7 мин 15 сек | 88% | Требовалась ручная доработка | $0.035 |
| Claude 4.6 | 9 мин 42 сек | 91% | Хороший анализ, но консервативные решения | $0.048 |
Step 3.5 Flash: почему она работает, когда другие спотыкаются
Первое, что бросается в глаза - Step 3.5 Flash не пытается быть универсальной моделью. Она заточена под конкретную задачу: анализ кода и его трансформация. В отличие от Gemini 3 Flash, который хорош для всего понемногу, Step специализируется.
Пример промпта, который сработал:
# Миграция с Python 3.7 на 3.11
# Анализируй все файлы проекта
# Особое внимание:
# 1. Устаревшие импорты (особенно из collections)
# 2. Изменения в asyncio API
# 3. Новый синтаксис typing (Python 3.10+)
# 4. Deprecated функции в стандартной библиотеке
# Требования заказчика:
# - Сохранить обратную совместимость где возможно
# - Добавить type hints для публичных API
# - Обновить зависимости с учетом совместимости
# - Не ломать существующие тесты
# Используй OpenCode Interpreter для:
# 1. Построчного анализа каждого файла
# 2. Создания миграционного плана
# 3. Поэтапного применения изменений
# 4. Тестирования после каждой миграции
Что сделал Step 3.5 Flash:
- Просканировал все 45 файлов за 47 секунд
- Выявил 128 проблемных мест (от устаревшего синтаксиса до deprecated API)
- Создал миграционный план с приоритетами
- Применил изменения группами по 5-7 файлов
- После каждой группы запускал тесты
- При ошибке откатывался и предлагал альтернативное решение
Ключевое отличие: Step 3.5 Flash не просто генерирует код. Она его выполняет, проверяет, отлаживает. Это как иметь junior разработчика, который действительно умеет работать с кодом, а не просто его писать.
Gemini 3.0 Pro: мощный, но не специализированный
Gemini 3.0 Pro показал себя достойно в аналитической части. Он лучше понимал бизнес-логику, точнее определял зависимости между модулями. Но когда дело дошло до реального кода...
Проблема в том, что Gemini 3.0 Pro (как и его младший брат Gemini 3 Flash) генерирует код "в вакууме". Он не проверяет его работоспособность. Результат:
- Предложил заменить `collections.Iterable` на `collections.abc.Iterable` - правильно
- Но забыл про `collections.Mapping` и `collections.Sequence`
- Прекрасно описал изменения в asyncio, но в коде использовал устаревший API
- Type hints добавил, но с синтаксическими ошибками для Python 3.10
Пришлось вручную проверять каждый файл. Время, которое сэкономил на анализе, потратил на отладку.
Claude 4.6: осторожность как недостаток
Claude 4.6 - это тот самый перфекционист, который боится сделать ошибку. Он анализировал каждый файл по 3-4 раза, строил сложные ментальные модели проекта, предлагал десятки альтернативных решений для каждой проблемы.
И это убило всю эффективность.
Вместо того чтобы просто заменить устаревший импорт, Claude:
- Анализировал, почему этот импорт используется
- Проверял, нет ли альтернативных путей
- Предлагал рефакторинг всего модуля
- Спрашивал подтверждения для каждого изменения
Для миграционного проекта, где нужно сделать 200+ мелких изменений, такой подход - смерть. Особенно учитывая, что логические способности Claude иногда работают против него.
OpenCode Interpreter: магия или просто хорошая инженерия?
Step 3.5 Flash использует OpenCode Interpreter не как дополнение, а как основную рабочую среду. Вот как это выглядит на практике:
1 Анализ зависимостей
# Step автоматически анализирует requirements.txt
# Проверяет совместимость с Python 3.11
# Предлагает альтернативы для проблемных пакетов
# Пример вывода:
# - django==3.2 → django==4.2 (совместим)
# - celery==4.4 → celery==5.3 (требует изменений в конфигурации)
# - pandas==1.3 → pandas==2.1 (обратная совместимость нарушена)
# Предлагает миграционный путь с тестами
2 Поэтапная миграция
# Step не пытается сделать всё сразу
# Разбивает миграцию на этапы:
# 1. Обновление зависимостей (без изменения кода)
# 2. Замена устаревшего синтаксиса
# 3. Обновление API стандартной библиотеки
# 4. Добавление type hints
# 5. Интеграционное тестирование
3 Откат при ошибках
Самое важное: если тесты падают после изменений, Step откатывает изменения и предлагает другое решение. Не "извините, вот ошибка", а "попробуем по-другому".
90K контекст: где это реально нужно?
Многие думают, что 90K токенов - это для анализа романов "Война и мир". На практике же:
- Миграция legacy проектов - десятки файлов, история изменений, документация
- Анализ инцидентов в production - логи, метрики, трейсы, конфигурации
- Код-ревью больших PR - основной код, тесты, документация, комментарии
- Рефакторинг монолитов - понимание связей между модулями
Step 3.5 Flash использует контекст не для хранения информации, а для работы с ней. Модель постоянно обращается к разным частям контекста, сравнивает, ищет зависимости.
Стоимость vs качество: неочевидная математика
| Параметр | Step 3.5 Flash | Gemini 3.0 Pro | Claude 4.6 |
|---|---|---|---|
| Стоимость за 1M токенов (in) | $0.15 | $0.50 | $0.80 |
| Стоимость за задачу (78K токенов) | $0.012 | $0.035 | $0.048 |
| Время на задачу | 4:23 | 7:15 | 9:42 |
| Ручная доработка | 12 минут | 47 минут | 34 минуты |
| Итоговая стоимость (время разработчика) | $4.20 | $18.50 | $15.80 |
Вот где собака зарыта. Дешевая модель с OpenCode Interpreter экономит часы работы разработчика. Gemini 3.0 Pro в 3 раза дороже в расчете на итоговые трудозатраты.
Где Step 3.5 Flash проигрывает
Не всё так радужно. У модели есть серьезные ограничения:
- Только код - для текстовой аналитики, креатива, диалогов лучше подходят Gemini или Claude
- Английский как основной язык - промпты на русском работают хуже
- Нет мультимодальности - только текст и код
- Ограниченная память между сессиями - каждый запрос начинается с чистого листа
Если вам нужно проанализировать скриншот интерфейса и написать для него код - Gemini 3 справится лучше. Если нужен глубокий диалог с контекстом в 100K+ токенов - Claude вне конкуренции.
Промпт-инжиниринг для Step 3.5 Flash
Модель требует особого подхода. Нельзя просто сказать "напиши код". Нужно давать четкие инструкции:
# ПЛОХОЙ ПРОМПТ
"Мигрируй проект с Python 3.7 на 3.11"
# ХОРОШИЙ ПРОМПТ
"Используй OpenCode Interpreter для анализа и миграции проекта.
Шаги:
1. Просканируй все .py файлы в проекте
2. Составь список проблем для Python 3.11
3. Сгруппируй проблемы по типам:
- Устаревший синтаксис
- Deprecated API
- Изменения в стандартной библиотеке
- Совместимость зависимостей
4. Для каждой группы создай план миграции
5. Применяй изменения постепенно, запускай тесты после каждого шага
6. При ошибках - откатывай и предлагай альтернативы
Ограничения:
- Не меняй логику бизнес-процессов
- Сохраняй обратную совместимость где возможно
- Документируй breaking changes
Отчитывайся после каждого этапа."
Step 3.5 Flash любит структурированные промпты с четкими шагами. Чем подробнее инструкция, тем лучше результат. Модель не додумывает за вас - она выполняет то, что написано.
Агентские workflow: где Step 3.5 Flash сияет
После тестов стало понятно - Step создан для автоматизации рутинных задач разработки:
1 Автоматическое исправление security issues
Модель сканирует код, находит уязвимости (SQL injection, XSS, hardcoded secrets), предлагает и применяет фиксы.
2 Миграция зависимостей
Не просто обновляет версии, а проверяет breaking changes, тестирует совместимость, предлагает workarounds.
3 Генерация boilerplate кода
Создает CRUD endpoints, миграции БД, конфигурационные файлы с учетом лучших практик конкретного фреймворка.
Будущее или нишевое решение?
Step 3.5 Flash - это не замена Gemini или Claude. Это специализированный инструмент для конкретной задачи: работы с кодом в production-среде.
На 13.02.2026 у модели нет прямых аналогов. Есть локальные модели, которые умеют писать код, но не имеют OpenCode Interpreter. Есть облачные гиганты, которые делают всё понемногу, но не специализируются на коде.
Мой прогноз: через 6-12 месяцев мы увидим подобную функциональность у всех крупных игроков. Но пока Step 3.5 Flash держит нишу. И держит уверенно.
Если ваш workflow связан с регулярными миграциями, рефакторингом, анализом legacy кода - попробуйте Step. Первые 100K токенов обычно бесплатные. Просто не ожидайте от неё креативных текстов или философских диалогов. Это рабочий инструмент. Тупой, эффективный, специализированный. Как шуруповерт. Им нельзя забивать гвозди, но для шурупов он идеален.
А для всего остального есть Gemini 3 Flash и компания.