В 2026 году научные издательства с радостью берут с вас $3000–$10 000 за Article Processing Charges (APC), а рецензирование тянется месяцами. Но есть и хорошая новость: OpenArx — open-source проект под лицензией Apache 2.0, который переворачивает эту модель вверх дном. Он не просто парсит arXiv — он превращает научные тексты в инструмент для AI-агентов через протокол MCP. И да, он бесплатный.
Главная головная боль науки — и как её решает OpenArx
Закрытые базы, дорогие API, отсутствие стандартизации — любой разработчик, пытавшийся автоматизировать поиск статей, знает эту боль. Semantic Scholar даёт ключ, но только если платить. Google Scholar — чёрный ящик. OpenArx предлагает радикально другое: разворачиваешь MCP-сервер у себя — и твой агент получает прямой доступ к миллионам статей из arXiv, их полным текстам, метаданным, а в перспективе — к системе распределённого рецензирования.
Что внутри коробки: MCP-сервер, клиент для arXiv API, семантический парсер, модуль управления публикациями (submit, review, версионирование) и встроенный ранжировщик на основе цитирований. Всё через единый протокол MCP — никаких REST-велосипедов.
MCP — это не просто тренд, это спасение от зоопарка интеграций
Помните, как мы собирали умного AI-агента с RAG? Там мы вручную оборачивали каждый инструмент. OpenArx даёт ровно то же самое, но сразу в виде готовых MCP-инструментов: search_articles, get_full_text, submit_review, get_citation_graph. Агент просто вызывает их — никакой магии, только MCP.
Ирония судьбы: недавнее исследование 2181 MCP-endpoint показало, что половина удалённых серверов мертва. Но OpenArx можно запустить локально — никакой зависимости от стороннего хостинга. Это меняет правила игры для конфиденциального рецензирования.
Сравнение с альтернативами: Semantic Scholar, Google Scholar, OpenAlex
| Критерий | OpenArx | Semantic Scholar | Google Scholar | OpenAlex |
|---|---|---|---|---|
| Протокол | MCP (нативный) | REST (платный) | Нет API | REST |
| Полные тексты | Да (arXiv) | Да (ограниченно) | Нет | Да (частично) |
| Локальное развёртывание | ✔️ | ❌ | ❌ | ✔️ |
| Интеграция с LLM-агентами | Из коробки | Через API-ключи | Парсинг (шатко) | Через REST |
| Модуль рецензирования | Встроен | Нет | Нет | Нет |
| Стоимость | Бесплатно (Apache 2.0) | От $0 до $2/1000 запросов | Бесплатно (но нет API) | Бесплатно (с ограничениями) |
Вывод очевиден: OpenArx выигрывает в удобстве для AI-агентов. OpenAlex — хороший, но ему не хватает MCP-нативности. Semantic Scholar — мощный, но закрытый и дорогой для масштабирования.
Пример: подключаем OpenArx к локальному агенту за 5 минут
Допустим, у вас уже стоит Open Cowork v3.1.0 или любой MCP-совместимый агент. Устанавливаете OpenArx одной командой:
git clone https://github.com/openarx/openarx-server.git
cd openarx-server
npm install
npm start
Сервер поднимается на localhost:3000/mcp. Теперь в конфигурации агента добавляем новый MCP-инструмент:
{
"mcpServers": {
"openarx": {
"command": "npx",
"args": ["openarx-mcp"]
}
}
}
Готово. Агент может выполнять поиск по arXiv, читать полные тексты, получать списки цитирований. Никаких API-ключей, никаких денег. Если хотите глубже разобраться с регистрацией инструментов, загляните в MCP Tool Registry — практическое руководство по автоматизации RAG-систем.
Рецензирование без посредников: как OpenArx меняет процесс
Самая жирная фича — модуль peer review. Автор сабмитит статью, указав 3-5 потенциальных рецензентов. MCP-сервер отправляет приглашения, собирает отзывы (через веб-интерфейс или Telegram-бота) и генерирует итоговое решение. Всё прозрачно, без посредников и APC. Звучит утопично? Но код лежит на GitHub — можете форкнуть и адаптировать под свой журнал. Единственное слабое место — пока нет интеграции с ORCID и DOI-генерацией, хотя roadmap обещает это к лету 2026.
Кому реально нужно присмотреться к OpenArx
- Разработчикам AI-исследовательских ассистентов — если вы пишете Deep Research-агентов, OpenArx даёт готовый слой для научного поиска без костылей.
- Редакциям малых научных журналов — поднимите свой MCP-сервер и принимайте статьи через агентов. Никаких дорогих платформ.
- Университетским лабораториям — локальный сервер внутри VPN гарантирует, что данные рецензирования не утекут на сторону.
- Блогерам и научным коммуникаторам — автоматизируйте поиск актуальных статей для постов. Прикрутите к агентам, как в статье про WordPress и AI-агентов, и получите авто-дайджест за 10 минут.
Подводные камни: что пока бесит
OpenArx ещё пахнет сыростью. Версия 0.1.2, репозиторий звёздный, но документация — базовая readme. Если у вас нет опыта с MCP, настройка может превратиться в квест. Плюс — покрытие только arXiv. Хотя авторы обещают добавить PubMed и CrossRef, это произойдёт не раньше осени. Ещё одна головная боль — скорость: первая загрузка full-text с PDF занимает несколько секунд, агент в это время ждёт. Для real-time приложений придётся кешировать.
Но это всё решаемо. Как и в случае с LM Studio MCP, основная ценность — не в идеальном коде, а в концепции. OpenArx закладывает фундамент для децентрализованной научной коммуникации, где агенту не нужен человеко-читаемый интерфейс, чтобы понять статью.
Прогноз: MCP-стандарт для науки
Через год мы будем удивляться, что раньше агенты не могли напрямую читать научные статьи. OpenArx — первый кирпич в стене, которая отделяет нас от монополии издательств. Если проект дотянет до версии 1.0 с поддержкой ORCID, DOI и нескольких репозиториев, он станет таким же обязательным инструментом для AI-агентов, как Arcade.dev Gateway для 7500 инструментов. А если нет — его форкнут и допилят. В открытом коде правда всегда найдёт лазейку.