Завтра разработчики StepFun AI отвечают на все вопросы про свою 196-миллиардную модель
16 февраля 2026 года в 15:00 по пекинскому времени команда StepFun AI проводит открытую сессию вопросов и ответов про свою флагманскую модель Step-3.5-Flash. Это не просто очередной анонс - это шанс заглянуть в кухню одной из самых обсуждаемых open-source моделей последних месяцев.
Step-3.5-Flash уже успела нашуметь в сообществе своими 196 миллиардами параметров, которые почему-то работают как 11 миллиардов. Магия? Нет, архитектурные хитрости, которые разработчики обещают раскрыть завтра.
AMA состоится 16 февраля 2026 года в официальном Discord-сообществе StepFun AI. Вопросы можно задавать на английском и китайском языках.
Что мы хотим спросить у создателей
Пока сообщество готовит вопросы, я собрал самые острые темы, которые должны прозвучать на сессии. Если вы планируете участвовать - берите на заметку.
1Архитектурная магия: как 196B превращается в 11B?
Самая большая загадка Step-3.5-Flash - её производительность. На бумаге это монстр с 196 миллиардами параметров, но на практике она работает на уровне моделей в 10-15 миллиардов. В нашем разборе архитектуры мы предположили использование sparse экспертных сетей (MoE), но детали до сих пор под покровом тайны.
Разработчики из GLM уже показывали подобные фокусы с GLM-4.7 Flash, но у StepFun подход явно другой. Или не явно? Завтра узнаем.
2Галлюцинации tool calls: баг или фича?
Сообщество жалуется на нестабильность вызовов инструментов. Модель иногда генерирует вызовы несуществующих функций или неправильно форматирует JSON. В нашем гайде про исправление галлюцинаций мы нашли костыли, но хочется услышать официальную позицию.
Это проблема обучения? Архитектурное ограничение? Или просто нужно подождать следующего патча?
3Планы на Step-4.0: что будет дальше?
Рынок локальных моделей движется быстрее, чем обновления драйверов NVIDIA. Пока мы разбирались с работой Step-3.5-Flash локально, конкуренты уже анонсировали новые архитектуры.
DeepSeek с их MLA, GLM с гибридными подходами - куда пойдет StepFun? Будут ли они внедрять что-то похожее на архитектуру из нашего анализа GLM и MLA?
Чего не стоит ждать от AMA
Реализм прежде всего. Разработчики вряд ли раскроют:
- Точные детали обучения (датасеты, стоимость, инфраструктура)
- Коммерческие планы и монетизацию
- Сравнения с конкретными конкурентами в негативном ключе
- Сроки выхода следующих моделей (если только не готовы их анонсировать)
Но это нормально. Как показало AMA с создателями GLM-4.7, даже общие ответы могут дать ценную информацию о стратегии компании.
Почему это важно для разработчиков
Step-3.5-Flash - не просто очередная модель в Hugging Face. Это тестовый полигон для архитектурных решений, которые могут определить будущее локальных AI.
Когда маленькие LLM бросают вызов гигантам, каждая деталь архитектуры имеет значение. Особенно если учесть, что версия int4 уже работает на Mac с 128 ГБ памяти.
Важный момент: StepFun AI - относительно молодая лаборатория. Их открытость в AMA может быть стратегией для привлечения сообщества. Или настоящей верой в open-source. Завтра поймем.
Что спросить, если вы новичок
Не все разбираются в тонкостях трансформеров. Но есть вопросы, которые интересны всем:
| Вопрос | Почему это важно |
|---|---|
| Будет ли официальная поддержка в Ollama/LM Studio? | Упрощает использование для обычных пользователей |
| Какие железяки рекомендуют для локального запуска? | Помогает выбрать оборудование |
| Планируют ли специализированные версии (код, медицина, юриспруденция)? | Показывает направление развития |
На что обратить внимание во время AMA
Технические детали - это хорошо. Но иногда важнее то, что остается между строк.
Сравните их ответы с тем, что говорили конкуренты в похожих ситуациях. Например, в нашем сравнении с MiniMax 2.1 мы заметили интересную закономерность: быстрые модели часто жертвуют стабильностью.
Слушайте не только что говорят, но и как говорят. Уверены ли они в своей архитектуре? Извиняются ли за недостатки? Обещают ли исправления или предлагают "работать с тем, что есть"?
И главное - записывайте. Потом, когда выйдет Step-4.0, будет интересно сравнить обещания с реальностью.
Завтра в 15:00 по пекинскому времени (10:00 МСК) узнаем, готова ли StepFun AI к диалогу с сообществом. Или это будет очередной PR-ход с уклончивыми ответами.
Я буду там. Список вопросов уже готов. Если увидите в чате кого-то с неудобными техническими вопросами - это, возможно, я.