ИИ, который думает как эпиграфист

Историки десятилетиями корпели над фрагментами мрамора и бронзы, сопоставляя обломки надписей с литературными источниками. Теперь эту работу делает Aeneas — первая в мире AI-модель, созданная специально для латинской эпиграфики. Не очередной ChatGPT с прикрученной классикой. Узкий специалист, который понимает, что IMP CAESAR DIVI TRAIANI PARTHICI FILIUS — это не просто набор слов, а стандартная титулатура императора Адриана.

В феврале 2026 вышла третья версия — Aeneas v3.1. Основное отличие от предыдущих релизов — мультимодальность. Модель теперь работает не только с текстом, но и с изображениями надписей. Загружаешь фотографию фрагмента, система распознаёт буквы (с учётом повреждений и палеографических особенностей), а затем ищет параллели в базах данных.

💡

Aeneas v3.1 обучена на 1,2 миллиона латинских надписей из корпуса Epigraphische Datenbank Heidelberg и литературных текстах от Плавта до Августина. Вес модели — 780 МБ, работает на обычном CPU.

Что умеет эта штука на практике

Представьте, вы нашли в архиве фотографию надписи с раскопок 1930-х годов. Бумага пожелтела, угол оторван. В каталоге записано: «Фрагмент посвятительной надписи, вероятно, II век н.э.». Раньше пришлось бы неделями листать Corpus Inscriptionum Latinarum. Теперь загружаете скан в Aeneas.

За пять секунд модель:

Распознаёт текст с вероятностью 94% (для сравнения — у общего OCR типа Tesseract точность на латинских надписях редко превышает 70%)
Находит три похожие надписи из разных провинций Римской империи
Предлагает возможные реконструкции утраченных частей
Даёт ссылки на научные публикации, где эти параллели упоминались

Самое интересное — контекстуализация. Aeneas не просто ищет совпадения слов. Она понимает формулы. Если в надписи есть PRO SALUTE IMPERATORIS, модель знает, что это стандартное начало вотивных надписей эпохи Принципата, и будет искать именно такие конструкции, а не случайные совпадения отдельных слов.

Чем Aeneas отличается от других инструментов

Цифровые гуманитарии уже привыкли к NER-моделям вроде tanaos-NER-v1 для извлечения имён и мест. Но это другой уровень.

Инструмент	Для чего	Точность на эпиграфике	Особенности Aeneas
Общие LLM (GPT-4o, Claude 3.7)	Общий анализ текста	40-60%	Специализация на формулах и аббревиатурах
TRACER (для греческих надписей)	Распознавание и атрибуция	85% для греческого	Работает с латынью, мультимодальность
Epigraphic Database Heidelberg	Поиск по ключевым словам	100% (но требует точного ввода)	Понимает неполные и повреждённые тексты

Главное преимущество — Aeneas не требует идеального ввода. Модель обучена на реальных надписях с повреждениями, ошибками резчиков, вариантами написания. AVGVSTVS, AVGUSTVS, AVGVSTVS с перевёрнутой V — для системы это одно слово.

Не путайте с моделями личности на LLM. Aeneas не генерирует текст от лица Цицерона. Она анализирует реальные надписи и находит связи между ними.

Как это выглядит в работе

Возьмём реальный кейс из документации. Надпись из Британии (RIB 152): фрагмент, где сохранилось только ...]VS LEG[...]. Человек-исследователь увидит сокращение LEG (legio, легион). Но какой именно легион? Aeneas анализирует:

Палеографию — стиль букв соответствует II-III векам
Географию — находка в Честере, где базировался Legio XX Valeria Victrix
Параллели — находит 12 аналогичных упоминаний легионов в британских надписях
Вероятность — предлагает реконструкцию [LEG XX VV] VS LEG[IONIS] с уверенностью 87%

Система показывает не просто результат, а цепочку рассуждений: «На основе палеографического анализа буква S имеет характерный для II века наклон. В Честере 83% надписей с LEG относятся к XX легиону. В 12 аналогичных случаях сокращение LEG следует после названия легиона».

Этот подход напоминает механистическую интерпретируемость в больших моделях, но здесь она встроена изначально. Историк видит не чёрный ящик, а прозрачную логику.

Кому это нужно (спойлер: не только академикам)

Основные пользователи — исследователи римской истории. Но в 2026 году инструмент нашли и другие аудитории:

Музейные работники — каталогизация коллекций ускорилась в 3-4 раза. Раньше на атрибуцию одной надписи уходило 2-3 дня, теперь 20 минут.
Археологи на раскопках — мобильная версия Aeneas Lite работает офлайн на планшете. Сфотографировал находку — получил предварительную датировку.
Преподаватели университетов — используют в учебных курсах по цифровой эпиграфике. Студенты тренируются на реальных примерах без доступа к редким изданиям.
Генеалоги-любители — ищут упоминания фамилий в надписях. Хотя здесь точность ниже, потому что римские имена часто повторялись.

Разработчики обещают адаптацию для других древних языков. Греческая версия планируется на конец 2026 года, затем — коптская и древнееврейская. Интересно, что подход Aeneas может пригодиться не только для древностей. Технология поиска параллелей в повреждённых текстах применяется в статистическом анализе и даже в анализе повреждённых цифровых документов.

Ограничения и подводные камни

Идеального инструмента не существует. Aeneas v3.1 всё ещё:

Плохо работает с курсивными надписями (например, граффити на стенах Помпей)
Требует минимального качества изображения — на размытых фото точность падает до 60%
Не распознаёт цифры в римской нумерации, если они слились с буквами
Стоит 49 евро в месяц для профессионального использования (академическая лицензия — бесплатно)

Самая большая проблема — bias в данных. Модель обучена на опубликованных надписях, которые уже прошли экспертизу. Если в базе мало материалов из определённого региона (скажем, Мавретании), то и точность для таких надписей будет ниже.

Разработчики честно пишут: «Aeneas не заменяет эксперта, а ускоряет его работу. Все результаты требуют проверки». Это важный момент в эпоху, когда люди начинают доверять ИИ больше, чем собственному мнению.

Где попробовать и как начать

Бесплатная демо-версия доступна на сайте проекта. Ограничение — 10 запросов в день, только текстовый ввод (без загрузки изображений). Для полноценной работы нужна академическая лицензия (доказательство affiliation с университетом или исследовательским институтом) или платная подписка.

API открыт, что позволяет интегрировать Aeneas в другие проекты цифровой гуманитаристики. Например, можно подключить модель к базе археологических находок, чтобы автоматически атрибутировать все новые надписи.

Для локальной установки требуется Python 3.10+, 4 ГБ оперативной памяти и минимум 2 ГБ свободного места. Модель оптимизирована для CPU, но поддерживает GPU-ускорение через CUDA 12.1.

Если вы работаете с древними текстами профессионально — пробуйте обязательно. Если просто интересуетесь историей — посмотрите демо, чтобы понять, как современные технологии меняют изучение прошлого. Через пять лет такие инструменты станут стандартом в исторических исследованиях.

Пока крупные компании соревнуются в создании универсальных ИИ, узкоспециализированные модели вроде Aeneas делают реальную работу в конкретных областях. Это напоминает ситуацию с кастомизацией LLM на странных данных — иногда лучшие результаты даёт не масштаб, а специфика.

Историки шутят, что скоро вместо «посоветуйте литературу по эпиграфике» будут говорить «скачайте Aeneas и обновите базу». И в этой шутке есть доля правды — инструмент действительно меняет правила игры. Медленно, но верно.

Как модель Aeneas находит связи в древних текстах: инструмент для историков и цифровых гуманитариев