Что такое Nexus и почему это не просто ещё одна LLM
Фундаментальные модели (Foundation Models) захватили мир текста, изображений и кода. Но когда дело доходит до табличных данных — Excel, SQL-таблиц, финансовых отчётов — все эти GPT-4, Claude-3.5 и Gemini-2.0 начинают спотыкаться. Они пытаются понять структуру как текст, а не как реляционную модель. Nexus от компании Fundamental — первая LTM (Large Tabular Model), созданная специально для работы с таблицами.
Вышла из стелса в январе 2026 года с $255 млн инвестиций. Не просто стартап — серьёзная заявка на передел рынка аналитики структурированных данных.
Актуальность на 05.02.2026: Nexus использует архитектуру LTM-T (Large Tabular Model - Transformer) версии 1.2, выпущенную в декабре 2025. Поддерживает таблицы до 10 миллионов строк и 5000 столбцов — это текущий лимит на февраль 2026.
Архитектура: почему это не трансформер
Вот что бесит в обычных LLM для табличных данных: они видят CSV как текст. Запятые, кавычки, переносы строк. Nexus работает иначе.
Три ключевых отличия от стандартных LLM
| Аспект | Обычные LLM (GPT-4, Claude-3.5) | Nexus LTM |
|---|---|---|
| Представление данных | Текстовое (CSV как строка) | Графовое (столбцы как узлы, связи как рёбра) |
| Контекстное окно | 128K токенов максимум | Динамическое, зависит от структуры таблицы |
| Детерминированность | Случайная (temperature > 0) | Полностью детерминированная |
| Понимание типов | Распознаёт через prompt engineering | Встроенная типовая система |
Nexus не токенизирует данные как текст. Вместо этого он строит графовое представление таблицы: каждый столбец становится узлом, связи между столбцами — рёбрами с весами на основе статистических зависимостей. Это решает проблему "потери данных в середине контекста", которая убивает LLM при работе с большими таблицами.
Что умеет делать на практике
Не спрашивайте у Nexus "расскажи о данных". Задавайте конкретные вопросы:
- Автоматическое определение аномалий: Находит выбросы в данных без предварительной настройки. Не просто статистические — смысловые аномалии ("зарплата уборщицы 500 000 рублей в таблице сотрудников").
- Генерация SQL-запросов по естественному языку: Но в отличие от LLM, Nexus понимает схему базы данных. Не будет генерировать JOIN по несуществующим столбцам.
- Предсказание следующих значений в временных рядах: Работает с пропусками в данных лучше классических ML-моделей, потому что учитывает контекст всей таблицы.
- Автоматическое создание дашбордов: Анализирует, какие метрики важны, и предлагает визуализации. Не случайные — основанные на статистических зависимостях.
Сравнение с альтернативами: кто проигрывает
Прямые конкуренты на начало 2026
| Инструмент | Тип | Плюсы | Минусы против Nexus |
|---|---|---|---|
| GPT-4 с плагином для таблиц | LLM с дообучением | Универсальность, понимает контекст | Галлюцинации, медленная работа с большими таблицами, дорого |
| Claude-3.5 Sonnet | LLM с улучшенным контекстом | 200K контекст, точность | Тот же подход "таблица как текст", проблемы с детерминизмом |
| TabPFN | Специализированная модель для таблиц | Быстрая, точная для классификации | Только предсказания, нет понимания смысла данных |
| Pandas AI | Надстройка над pandas | Интеграция с Python, простота | Фактически обёртка над GPT, все её проблемы остаются |
Главное преимущество Nexus — детерминированность. Один и тот же запрос к одной и той же таблице даёт одинаковый результат всегда. Для бизнеса это критично: отчёты должны быть воспроизводимы. LLM с их случайностью (даже при temperature=0 остаются стохастические элементы) здесь проваливаются.
Важно: Nexus не заменяет классические ML-модели для предсказаний. Его сила — в понимании структуры и смысла данных. Для точных численных прогнозов лучше использовать XGBoost или нейросети. Nexus же скажет, какие признаки вообще стоит использовать для прогноза.
Кому реально нужен Nexus
Не всем. Вот кому он даст максимальный эффект:
Финансовые аналитики
Ежедневные отчёты по тысячам строк транзакций. Nexus найдет аномалии, которые человек пропустит, и объяснит их на естественном языке. "Платеж от контрагента X в 2:15 ночи на 15% больше среднего, при этом обычно этот контрагент платит днём" — такие инсайты.
Data-инженеры
Миграция legacy-систем с кучей CSV-файлов. Nexus автоматически определит схему, типы данных, найдёт противоречия между файлами. Экономит недели ручной работы.
Продуктовые аналитики
A/B-тесты с десятками метрик. Вместо того чтобы вручную искать статистически значимые различия — задать вопрос "Какие метрики изменились значимо между группами A и B?" и получить ответ с p-значениями.
Интеграция с существующими системами
Nexus предлагает три варианта работы:
- SaaS API: Отправляете таблицу (CSV, Parquet, JSON), получаете анализ. Цена от $0.05 за 1000 строк. Дорого для больших объёмов, но быстро для прототипов.
- On-premise решение: Разворачиваете в своём дата-центре. Требует GPU с 24GB памяти минимум. Лицензия от $50k в год.
- Nexus Lite: Урезанная версия для локального использования на CPU. Бесплатна для некоммерческого использования, но ограничена таблицами до 10k строк.
API похож на OpenAI, но с табличным контекстом:
import fundamental_nexus as fn
client = fn.Client(api_key="ваш_ключ")
# Загружаем таблицу
table_id = client.upload_table("sales_data.csv")
# Задаём вопросы
response = client.query(
table_id=table_id,
question="Какие товары показывают сезонность в продажах?",
format="markdown" # или "json", "sql", "python"
)
print(response.answer)
print(response.confidence) # Уверенность модели от 0 до 1
print(response.reasoning) # Цепочка рассуждений
Ограничения и подводные камни
Идеальных технологий не бывает. Что не так с Nexus:
- Только структурированные данные: Не ждите, что Nexus проанализирует текст в ячейках как LLM. Для NLP задач всё ещё нужны специальные методы работы с текстом.
- Цена: On-premise решение стоит как хороший data-инженер в год. Для малого бизнеса — перебор.
- Сложность настройки: Хотя модель предобучена, для domain-specific задач нужна дообучка. А данных для этого может не быть.
- Нет open-source: В отличие от GitNexus, который открыт для всех, Nexus — проприетарная технология. Не покопаться в исходниках.
Что дальше: прогноз на 2026-2027
Nexus задаёт тренд. Ожидайте:
- Open-source аналоги: Уже через 3-6 месяцев появятся попытки повторить архитектуру. Возможно, от Hugging Face или независимых исследователей.
- Интеграция в BI-системы: Tableau, Power BI, Looker добавят LTM как фичу в следующие релизы.
- Гибридные модели: Nexus + LLM для работы со смешанными данными (таблицы + текст). Это решит проблему галлюцинаций при анализе комплексных отчётов.
- Специализированные LTMs: Для медицинских данных, финансовых отчётов, логистики. Одна архитектура — много доменных моделей.
Совет: Если вы работаете с большими таблицами ежедневно — пробуйте Nexus Lite уже сейчас. Это бесплатно и даст понимание, нужен ли вам полный стек. Если же ваши данные в основном текстовые (логи, документы), лучше инвестируйте в специализированные LLM для анализа логов.
Nexus не заменит data-аналитиков. Но сделает их работу в 10 раз эффективнее. Вопрос в том, готовы ли вы платить за это $50k в год. Для корпораций — очевидное да. Для стартапов — стоит подождать open-source альтернатив или снижения цен.
Технология новая, но архитектурно правильная. Табличные данные — отдельный мир со своей структурой. Пытаться анализировать их текстовыми моделями — всё равно что резать хлеб отвёрткой. Работает, но неэффективно.