Сотни моделей, одна проблема и парадокс SAP
Представьте отдел аналитики крупной компании. Там живут модели для прогноза продаж, оттока клиентов, мошенничества со скидками, вероятности поломки станков и десятки других. Каждая – своя, каждая требует своего дата-инженера, своего мониторинга, своего пайплайна ретрена. Это дорого, медленно и безумно сложно масштабировать. Звучит знакомо? Это и есть тот самый хаос, о котором мы писали в статье про уровни зрелости AI-трансформации.
SAP, гигант корпоративного софта, в начале 2026 года выпустила ответ на эту боль – RPT-1 (Relational Pre-trained Transformer). Это не просто очередной алгоритм. Это заявление о том, что эпоха точечных ML-моделей для табличных данных официально закончилась. Вместо зоопарка специализированных решений – одна фундаментальная модель, обученная на триллионах строк из реальных бизнес-систем.
RPT-1 версии 2.1 (актуально на март 2026) построена на архитектуре трансформера, но со специализированными слоями для кодирования структуры таблиц, отношений между колонками и работы с пропущенными значениями. Модель поддерживает zero-shot и few-shot инференс для десятков типов задач.
Что она умеет делать прямо сейчас
Вместо того чтобы настраивать 50 разных моделей, вы загружаете в RPT-1 свою таблицу с продажами за год и пишете на естественном языке (или через API) запросы. Все.
- Прогноз: "Спрогнозируй выручку по регионам на следующий квартал с учетом сезонности".
- Классификация: "Определи, какие транзакции в этом датасете выглядят аномально для отдела безопасности".
- Генерация признаков: "Создай три новых показателя, которые лучше всего коррелируют с оттоком клиентов".
- Импутация: "Заполни пропущенные значения в колонке 'Срок поставки' на основе истории по этому поставщику".
Она не требует предварительной обработки категориальных переменных (сама разберется), не падает из-за разного масштаба числовых колонок и, что главное, понимает контекст. Колонка "Discount" в таблице продаж и в таблице закупок – это разные сущности, и модель это чувствует. Именно эту проблему контекста мы подробно разбирали в материале про провалы ИИ-ассистентов в бизнесе.
Экономика безумия: почему CFO это понравится
Цифры, которые SAP озвучивает в своих кейсах на 2026 год, заставляют задуматься. Внедрение RPT-1 в пилотном проекте у крупного ритейлера сократило время на развертывание новых аналитических моделей с 3-4 недель до 2-3 дней. Команда из 15 дата-сайентистов, которая раньше только обслуживала старые модели, теперь фокусируется на стратегических задачах.
| Что было | Что стало с RPT-1 |
|---|---|
| 20+ отдельных моделей | 1 универсальная модель |
| Постоянный найм под каждый use-case | Команда сократилась на 40% |
| Падение accuracy при сдвиге данных | Автоматическая адаптация к дрейфу |
| Необъяснимые предсказания (black box) | Встроенная интерпретация решений |
Это идеально ложится на тренд автономных ИИ-агентов 2026, где система сама ставит задачи, анализирует и действует. RPT-1 становится "мозгом" для таких агентов, работающих с цифрами.
Но не все так гладко. Во-первых, RPT-1 – это не открытая модель. Вы не скачаете ее с Hugging Face. Это облачный сервис в экосистеме SAP, что создает риск vendor lock-in. Во-вторых, для эффективной работы ей нужны большие объемы качественных исторических данных. Компаниям с "грязными" legacy-системами придется сначала пройти долгий путь очистки.
Куда это ведет и что делать уже сейчас
SAP явно не одинока. Microsoft с OptiMind, Salesforce с Einstein Tables – все движутся в сторону консолидации. Скоро мы увидим войну фундаментальных табличных моделей, как когда-то была война чат-ботов.
Что делать бизнесу? Не бежать срочно выключать все свои XGBoost-модели. Стоит начать с аудита: какие табличные ML-модели у вас есть, сколько они стоят в содержании и как часто обновляются. Пилотный проект на одной, но критической задаче – например, анализ сбоев в цепочке поставок – даст понять, насколько эта технология для вас зрелая.
А тем, кто беспокоится о точности, напомним: 90% точности на идеальном датасете в песочнице – это одно. А возможность за два дня получить работающее решение для задачи, на которую раньше не было ресурсов, – совсем другое. Иногда скорость и универсальность важнее гипотетического процента. Особенно когда конкуренты уже используют такие системы.