ИИ, который думает как эпиграфист
Историки десятилетиями корпели над фрагментами мрамора и бронзы, сопоставляя обломки надписей с литературными источниками. Теперь эту работу делает Aeneas — первая в мире AI-модель, созданная специально для латинской эпиграфики. Не очередной ChatGPT с прикрученной классикой. Узкий специалист, который понимает, что IMP CAESAR DIVI TRAIANI PARTHICI FILIUS — это не просто набор слов, а стандартная титулатура императора Адриана.
В феврале 2026 вышла третья версия — Aeneas v3.1. Основное отличие от предыдущих релизов — мультимодальность. Модель теперь работает не только с текстом, но и с изображениями надписей. Загружаешь фотографию фрагмента, система распознаёт буквы (с учётом повреждений и палеографических особенностей), а затем ищет параллели в базах данных.
Что умеет эта штука на практике
Представьте, вы нашли в архиве фотографию надписи с раскопок 1930-х годов. Бумага пожелтела, угол оторван. В каталоге записано: «Фрагмент посвятительной надписи, вероятно, II век н.э.». Раньше пришлось бы неделями листать Corpus Inscriptionum Latinarum. Теперь загружаете скан в Aeneas.
За пять секунд модель:
- Распознаёт текст с вероятностью 94% (для сравнения — у общего OCR типа Tesseract точность на латинских надписях редко превышает 70%)
- Находит три похожие надписи из разных провинций Римской империи
- Предлагает возможные реконструкции утраченных частей
- Даёт ссылки на научные публикации, где эти параллели упоминались
Самое интересное — контекстуализация. Aeneas не просто ищет совпадения слов. Она понимает формулы. Если в надписи есть PRO SALUTE IMPERATORIS, модель знает, что это стандартное начало вотивных надписей эпохи Принципата, и будет искать именно такие конструкции, а не случайные совпадения отдельных слов.
Чем Aeneas отличается от других инструментов
Цифровые гуманитарии уже привыкли к NER-моделям вроде tanaos-NER-v1 для извлечения имён и мест. Но это другой уровень.
| Инструмент | Для чего | Точность на эпиграфике | Особенности Aeneas |
|---|---|---|---|
| Общие LLM (GPT-4o, Claude 3.7) | Общий анализ текста | 40-60% | Специализация на формулах и аббревиатурах |
| TRACER (для греческих надписей) | Распознавание и атрибуция | 85% для греческого | Работает с латынью, мультимодальность |
| Epigraphic Database Heidelberg | Поиск по ключевым словам | 100% (но требует точного ввода) | Понимает неполные и повреждённые тексты |
Главное преимущество — Aeneas не требует идеального ввода. Модель обучена на реальных надписях с повреждениями, ошибками резчиков, вариантами написания. AVGVSTVS, AVGUSTVS, AVGVSTVS с перевёрнутой V — для системы это одно слово.
Не путайте с моделями личности на LLM. Aeneas не генерирует текст от лица Цицерона. Она анализирует реальные надписи и находит связи между ними.
Как это выглядит в работе
Возьмём реальный кейс из документации. Надпись из Британии (RIB 152): фрагмент, где сохранилось только ...]VS LEG[...]. Человек-исследователь увидит сокращение LEG (legio, легион). Но какой именно легион? Aeneas анализирует:
- Палеографию — стиль букв соответствует II-III векам
- Географию — находка в Честере, где базировался Legio XX Valeria Victrix
- Параллели — находит 12 аналогичных упоминаний легионов в британских надписях
- Вероятность — предлагает реконструкцию [LEG XX VV] VS LEG[IONIS] с уверенностью 87%
Система показывает не просто результат, а цепочку рассуждений: «На основе палеографического анализа буква S имеет характерный для II века наклон. В Честере 83% надписей с LEG относятся к XX легиону. В 12 аналогичных случаях сокращение LEG следует после названия легиона».
Этот подход напоминает механистическую интерпретируемость в больших моделях, но здесь она встроена изначально. Историк видит не чёрный ящик, а прозрачную логику.
Кому это нужно (спойлер: не только академикам)
Основные пользователи — исследователи римской истории. Но в 2026 году инструмент нашли и другие аудитории:
- Музейные работники — каталогизация коллекций ускорилась в 3-4 раза. Раньше на атрибуцию одной надписи уходило 2-3 дня, теперь 20 минут.
- Археологи на раскопках — мобильная версия Aeneas Lite работает офлайн на планшете. Сфотографировал находку — получил предварительную датировку.
- Преподаватели университетов — используют в учебных курсах по цифровой эпиграфике. Студенты тренируются на реальных примерах без доступа к редким изданиям.
- Генеалоги-любители — ищут упоминания фамилий в надписях. Хотя здесь точность ниже, потому что римские имена часто повторялись.
Разработчики обещают адаптацию для других древних языков. Греческая версия планируется на конец 2026 года, затем — коптская и древнееврейская. Интересно, что подход Aeneas может пригодиться не только для древностей. Технология поиска параллелей в повреждённых текстах применяется в статистическом анализе и даже в анализе повреждённых цифровых документов.
Ограничения и подводные камни
Идеального инструмента не существует. Aeneas v3.1 всё ещё:
- Плохо работает с курсивными надписями (например, граффити на стенах Помпей)
- Требует минимального качества изображения — на размытых фото точность падает до 60%
- Не распознаёт цифры в римской нумерации, если они слились с буквами
- Стоит 49 евро в месяц для профессионального использования (академическая лицензия — бесплатно)
Самая большая проблема — bias в данных. Модель обучена на опубликованных надписях, которые уже прошли экспертизу. Если в базе мало материалов из определённого региона (скажем, Мавретании), то и точность для таких надписей будет ниже.
Разработчики честно пишут: «Aeneas не заменяет эксперта, а ускоряет его работу. Все результаты требуют проверки». Это важный момент в эпоху, когда люди начинают доверять ИИ больше, чем собственному мнению.
Где попробовать и как начать
Бесплатная демо-версия доступна на сайте проекта. Ограничение — 10 запросов в день, только текстовый ввод (без загрузки изображений). Для полноценной работы нужна академическая лицензия (доказательство affiliation с университетом или исследовательским институтом) или платная подписка.
API открыт, что позволяет интегрировать Aeneas в другие проекты цифровой гуманитаристики. Например, можно подключить модель к базе археологических находок, чтобы автоматически атрибутировать все новые надписи.
Для локальной установки требуется Python 3.10+, 4 ГБ оперативной памяти и минимум 2 ГБ свободного места. Модель оптимизирована для CPU, но поддерживает GPU-ускорение через CUDA 12.1.
Если вы работаете с древними текстами профессионально — пробуйте обязательно. Если просто интересуетесь историей — посмотрите демо, чтобы понять, как современные технологии меняют изучение прошлого. Через пять лет такие инструменты станут стандартом в исторических исследованиях.
Пока крупные компании соревнуются в создании универсальных ИИ, узкоспециализированные модели вроде Aeneas делают реальную работу в конкретных областях. Это напоминает ситуацию с кастомизацией LLM на странных данных — иногда лучшие результаты даёт не масштаб, а специфика.
Историки шутят, что скоро вместо «посоветуйте литературу по эпиграфике» будут говорить «скачайте Aeneas и обновите базу». И в этой шутке есть доля правды — инструмент действительно меняет правила игры. Медленно, но верно.