P1-235B PhysicsMinions: запуск модели-чемпиона IPhO 2025, сравнение с GPT-5 | AiManual
AiManual Logo Ai / Manual.
08 Фев 2026 Инструмент

P1-235B: физический гений, который решил IPhO 2025. Как запустить золотого медалиста на своем железе

Полный обзор P1-235B-A22B от Shanghai AI Lab: как работает модель-олимпиадник, установка PhysicsMinions агента, сравнение с альтернативами на 08.02.2026

235 миллиардов параметров физического гения

В декабре 2025 года случилось то, чего ждали три года. Shanghai AI Laboratory выкатила P1-235B-A22B - первую открытую модель, которая официально показала результат золотого медалиста на Международной олимпиаде по физике. Не "близко к", не "сопоставимо с" - именно золото. 92,3 балла из 100 на тестовом наборе IPhO 2024, проверенном комиссией олимпиады.

💡
P1-235B-A22B - это не просто очередная большая модель. Это специализированный инструмент, обученный на 8,5 миллионах примеров из физики, математики и инженерии. Архитектура MoE с 64 экспертами, каждый из которых знает свою узкую область: квантовая механика, термодинамика, электродинамика.

PhysicsMinions: когда один гений превращается в команду

Самое интересное началось в январе 2026. Разработчики выпустили PhysicsMinions - агентную систему поверх P1-235B. Не просто чат-интерфейс, а полноценного научного ассистента, который умеет:

  • Решать многоступенчатые задачи с промежуточными вычислениями
  • Рисовать диаграммы и схемы в ASCII (да, старомодно, но работает)
  • Проверять единицы измерения и размерности
  • Искать ошибки в собственных рассуждениях
  • Генерировать код для численного моделирования

PhysicsMinions работает по принципу "разделяй и властвуй". Сложную задачу он разбивает на подзадачи, решает каждую отдельным экспертом, потом собирает ответ. Как команда физиков, только в одной модели.

МодельIPhO ScoreПараметрыКонтекст
P1-235B-A22B92.3235B128K
GPT-5 (январь 2026)88.7~1.7T1M
Claude-4.584.2~800B200K
Qwen-2.5-72B76.872B128K

Запуск на домашнем железе: реальность или фантастика?

235 миллиардов параметров звучат устрашающе. Но вот цифры на 08.02.2026:

  • Полная версия в FP16: 470 ГБ VRAM (фантастика)
  • Квантованная до 4-бит: 118 ГБ VRAM (серверный уровень)
  • Квантованная до 2-бит: 59 ГБ VRAM (две RTX 4090)
  • Через API: от $0.12 за 1K токенов

Да, запустить локально сложно. Но возможно, если у вас есть доступ к серверу с 4x A100 или 2x H100. Или если вы готовы использовать облачные инстансы.

Внимание: квантование до 2-бит снижает точность на 7-12% на физических задачах. Для исследовательских целей это приемлемо, для подготовки к олимпиадам - уже рискованно.

Альтернативы: когда 235B - это перебор

Не у всех есть серверная стойка в гараже. Вот что можно использовать вместо P1-235B:

Qwen-2.5-72B - лучший компромисс. 76.8 баллов на IPhO, но требует всего 24 ГБ VRAM в 4-битном виде. Отлично работает на одной RTX 4090. Если нужна физика, но не обязательно золотое качество - берите его.

MiniMax-M2.1-32B - китайский аналог, оптимизированный под математику. На физике показывает 71.2 балла, зато помещается в 16 ГБ VRAM. Идеален для студентов.

GPT-5 через API - дорого ($0.18/1K токенов), но не требует железа. И дает доступ к миллионному контексту, что полезно для длинных научных статей.

PhysicsMinions в действии: пример работы

Задача из реального IPhO 2024: "Шар радиуса R катится без проскальзывания по горизонтальной поверхности. Найти минимальную скорость центра масс, при которой шар сможет перекатиться через ступеньку высоты h < R."

PhysicsMinions решает так:

  1. Определяет систему координат
  2. Записывает закон сохранения энергии
  3. Учитывает условие качения без проскальзывания
  4. Находит момент, когда нормальная реакция обращается в ноль
  5. Выводит конечную формулу: v_min = sqrt(g(R-h)) * sqrt(1 + (2/5)*(R/(R-h)))

Весь процесс занимает 45 секунд. С объяснениями, проверкой размерностей и графиком зависимости v_min от h.

Кому это нужно на самом деле

P1-235B - не для всех. Вот кто выжмет из него максимум:

  • Преподаватели физики - генерация задач, проверка решений, создание методичек
  • Студенты-олимпиадники - персональный тренер, который объясняет сложные темы
  • Научные сотрудники - быстрая проверка гипотез, анализ формул, поиск ошибок в расчетах
  • Разработчики научного ПО - интеграция в системы автоматического решения задач

Если вы просто хотите "поиграться с ИИ" - берите MiniStral или Qwen 7B. Они проще, дешевле и почти так же умны в бытовых вопросах.

Проблемы, которые все замалчивают

P1-235B идеален в физике. Но:

  • Английский у него средний. Особенно разговорный
  • Код пишет хуже, чем специализированные Code LLM
  • На гуманитарные вопросы отвечает как типичный технарь - сухо и без эмоций
  • Требует специфического промптинга. "Реши задачу" не сработает - нужно "Реши задачу по механике с подробными выкладками"

И да, он иногда "зацикливается" на одном подходе. Если в тренировочных данных задача решалась через закон сохранения энергии, он будет пытаться применить его везде, даже когда проще использовать динамику.

💡
Совет от тех, кто уже работает с моделью: всегда просите PhysicsMinions проверить ответ альтернативным методом. Это снижает риск ошибок на 40%.

Что дальше? Физика как сервис

К марту 2026 ожидается PhysicsMinions v2 с интеграцией символьных вычислений (Wolfram Alpha API) и поддержкой графического вывода. Не ASCII-арт, а настоящие диаграммы в SVG.

Еще интереснее - планируется выпуск "легкой" версии P1-72B, которая будет показывать результаты серебряного медалиста (85+ баллов), но требовать всего 48 ГБ VRAM в полной точности.

А пока что - если у вас есть доступ к серьезному железу и нужен физический гений, P1-235B-A22B остается лучшим выбором. Даже GPT-5 не дотягивает до его специализации.

Просто помните: золотая медаль IPhO - это не гарантия, что модель решит вашу бытовую проблему. Но если эта проблема связана с законами Ньютона, Максвелла или Шрёдингера - других вариантов просто нет.