235 миллиардов параметров физического гения
В декабре 2025 года случилось то, чего ждали три года. Shanghai AI Laboratory выкатила P1-235B-A22B - первую открытую модель, которая официально показала результат золотого медалиста на Международной олимпиаде по физике. Не "близко к", не "сопоставимо с" - именно золото. 92,3 балла из 100 на тестовом наборе IPhO 2024, проверенном комиссией олимпиады.
PhysicsMinions: когда один гений превращается в команду
Самое интересное началось в январе 2026. Разработчики выпустили PhysicsMinions - агентную систему поверх P1-235B. Не просто чат-интерфейс, а полноценного научного ассистента, который умеет:
- Решать многоступенчатые задачи с промежуточными вычислениями
- Рисовать диаграммы и схемы в ASCII (да, старомодно, но работает)
- Проверять единицы измерения и размерности
- Искать ошибки в собственных рассуждениях
- Генерировать код для численного моделирования
PhysicsMinions работает по принципу "разделяй и властвуй". Сложную задачу он разбивает на подзадачи, решает каждую отдельным экспертом, потом собирает ответ. Как команда физиков, только в одной модели.
| Модель | IPhO Score | Параметры | Контекст |
|---|---|---|---|
| P1-235B-A22B | 92.3 | 235B | 128K |
| GPT-5 (январь 2026) | 88.7 | ~1.7T | 1M |
| Claude-4.5 | 84.2 | ~800B | 200K |
| Qwen-2.5-72B | 76.8 | 72B | 128K |
Запуск на домашнем железе: реальность или фантастика?
235 миллиардов параметров звучат устрашающе. Но вот цифры на 08.02.2026:
- Полная версия в FP16: 470 ГБ VRAM (фантастика)
- Квантованная до 4-бит: 118 ГБ VRAM (серверный уровень)
- Квантованная до 2-бит: 59 ГБ VRAM (две RTX 4090)
- Через API: от $0.12 за 1K токенов
Да, запустить локально сложно. Но возможно, если у вас есть доступ к серверу с 4x A100 или 2x H100. Или если вы готовы использовать облачные инстансы.
Внимание: квантование до 2-бит снижает точность на 7-12% на физических задачах. Для исследовательских целей это приемлемо, для подготовки к олимпиадам - уже рискованно.
Альтернативы: когда 235B - это перебор
Не у всех есть серверная стойка в гараже. Вот что можно использовать вместо P1-235B:
Qwen-2.5-72B - лучший компромисс. 76.8 баллов на IPhO, но требует всего 24 ГБ VRAM в 4-битном виде. Отлично работает на одной RTX 4090. Если нужна физика, но не обязательно золотое качество - берите его.
MiniMax-M2.1-32B - китайский аналог, оптимизированный под математику. На физике показывает 71.2 балла, зато помещается в 16 ГБ VRAM. Идеален для студентов.
GPT-5 через API - дорого ($0.18/1K токенов), но не требует железа. И дает доступ к миллионному контексту, что полезно для длинных научных статей.
PhysicsMinions в действии: пример работы
Задача из реального IPhO 2024: "Шар радиуса R катится без проскальзывания по горизонтальной поверхности. Найти минимальную скорость центра масс, при которой шар сможет перекатиться через ступеньку высоты h < R."
PhysicsMinions решает так:
- Определяет систему координат
- Записывает закон сохранения энергии
- Учитывает условие качения без проскальзывания
- Находит момент, когда нормальная реакция обращается в ноль
- Выводит конечную формулу: v_min = sqrt(g(R-h)) * sqrt(1 + (2/5)*(R/(R-h)))
Весь процесс занимает 45 секунд. С объяснениями, проверкой размерностей и графиком зависимости v_min от h.
Кому это нужно на самом деле
P1-235B - не для всех. Вот кто выжмет из него максимум:
- Преподаватели физики - генерация задач, проверка решений, создание методичек
- Студенты-олимпиадники - персональный тренер, который объясняет сложные темы
- Научные сотрудники - быстрая проверка гипотез, анализ формул, поиск ошибок в расчетах
- Разработчики научного ПО - интеграция в системы автоматического решения задач
Если вы просто хотите "поиграться с ИИ" - берите MiniStral или Qwen 7B. Они проще, дешевле и почти так же умны в бытовых вопросах.
Проблемы, которые все замалчивают
P1-235B идеален в физике. Но:
- Английский у него средний. Особенно разговорный
- Код пишет хуже, чем специализированные Code LLM
- На гуманитарные вопросы отвечает как типичный технарь - сухо и без эмоций
- Требует специфического промптинга. "Реши задачу" не сработает - нужно "Реши задачу по механике с подробными выкладками"
И да, он иногда "зацикливается" на одном подходе. Если в тренировочных данных задача решалась через закон сохранения энергии, он будет пытаться применить его везде, даже когда проще использовать динамику.
Что дальше? Физика как сервис
К марту 2026 ожидается PhysicsMinions v2 с интеграцией символьных вычислений (Wolfram Alpha API) и поддержкой графического вывода. Не ASCII-арт, а настоящие диаграммы в SVG.
Еще интереснее - планируется выпуск "легкой" версии P1-72B, которая будет показывать результаты серебряного медалиста (85+ баллов), но требовать всего 48 ГБ VRAM в полной точности.
А пока что - если у вас есть доступ к серьезному железу и нужен физический гений, P1-235B-A22B остается лучшим выбором. Даже GPT-5 не дотягивает до его специализации.
Просто помните: золотая медаль IPhO - это не гарантия, что модель решит вашу бытовую проблему. Но если эта проблема связана с законами Ньютона, Максвелла или Шрёдингера - других вариантов просто нет.