Память как у золотой рыбки: почему ваш AI-агент все забывает

Вы только что объяснили своему локальному агенту на основе GPT-OSS 22B (последняя стабильная версия на март 2026) всю архитектуру вашего проекта. Он кивает, начинает вносить изменения, и через десять минут спрашивает: "А как называется главный модуль?" Контекстное окно переполнилось. История диалога стерлась. Вы чувствуете, как растет раздражение.

Знакомая история? Современные LLM, даже с контекстом в 1 миллион токенов, все еще страдают от контекстного рота. Они не помнят то, что было в начале диалога, не говоря уже о всей кодовой базе.

Проблема не в размере контекста, а в персистентности. AI-агентам нужна долговременная память, а не просто больше оперативки.

Memento v1.0: не просто костыль, а полноценная гиппокампа

Memento v1.0 — это локальный MCP-сервер, который превращает вашу кодовую базу в долговременную память для AI-агента. Не в оперативную, которую сбрасывает после сессии. А в настоящую, персистентную. Как предыдущие версии, но с ключевыми улучшениями.

Технически, Memento реализует Model Context Protocol (MCP), который стал стандартом де-факто после того, как Anthropic открыла спецификацию. Но в отличие от простых MCP-серверов, Memento строит семантический индекс вашего кода.

1Индексирование без сумасшедших требований к VRAM

Старые инструменты для семантического поиска по коду требовали мощных GPU. Memento v1.0 использует квантованные эмбеддинг-модели, которые работают на CPU. Вы индексируете репозиторий один раз — и получаете векторную базу, которая весит в разы меньше, чем сам код.

💡

Memento не хранит сам код в векторах — только семантические представления. Исходники остаются на диске. Это важно для безопасности и позволяет работать с проектами любого размера.

2Гибридный поиск: BM25 + HNSW индекс

Вы спрашиваете агента: "Где у нас обрабатываются платежи через Stripe?" Без Memento он будет искать файлы со строкой "Stripe". С Memento — он найдет все связанные модули, даже если в них нет этого слова, но семантически они близки.

Memento v1.0 комбинирует классический BM25 (для точного совпадения ключевых слов) и HNSW индекс для векторного поиска. Результаты ранжируются с учетом обоих методов.

3Полностью локально: никаких облачных API

Все эмбеддинги вычисляются на вашем железе. Индекс хранится локально. Никаких данных не уходит в облака. Это критично для приватных проектов и работы в офлайне.

Установка за 5 минут: одна команда и готово

Разработчики Memento v1.0 сделали установку максимально простой. Если у вас есть Docker, все сводится к одной команде:

curl -sSL https://get.memento.dev/install.sh | bash

Или, если вы предпочитаете Python:

pip install memento-mcp

На март 2026 года, Memento v1.0 требует Python 3.10 или выше. Убедитесь, что у вас установлена актуальная версия.

Настройка для Claude Desktop, Cursor или любого MCP-клиента

Memento работает с любым агентом, который поддерживает MCP. Например, для Claude Desktop добавьте в конфиг:

{
  "mcpServers": {
    "memento": {
      "command": "python",
      "args": ["-m", "memento.server"],
      "env": {
        "MEMENTO_PROJECT_PATH": "/path/to/your/project"
      }
    }
  }
}

Для Cursor или других IDE процесс аналогичен.

Пример из жизни: как Memento помог переписать легаси-код

Представьте: у вас есть монолит на 100 тысяч строк, написанный десять лет назад. Нужно модернизировать систему аутентификации. Без Memento, агент будет постоянно терять контекст. С Memento — он помнит всю структуру.

Вы говорите: "Найди все места, где используется старая auth библиотека."

Memento возвращает не только файлы с прямыми импортами, но и модули, которые косвенно зависят от нее. Агент видит полную картину и предлагает изменения, которые не сломают скрытые зависимости.

💡

В отличие от бесконечного контекста, Memento не загружает весь код в промпт. Он выбирает только релевантные фрагменты, экономя токены.

Сравнение с альтернативами: почему Memento v1.0?

Инструмент	Локальность	Гибридный поиск	Сложность установки	Лицензия
Memento v1.0	Полностью	BM25 + HNSW	Низкая	AGPL v3
Widemem	Частично	Только векторный	Средняя	MIT
Mycelium Memory Hub	Нет (облачный)	Есть	Высокая	Проприетарная
MemV	Полностью	Нет	Высокая	Apache 2.0

Memento v1.0 выделяется полной локальностью и гибридным поиском. AGPL лицензия означает, что вы можете использовать его бесплатно, но если модифицируете, должны открыть исходники. Для компаний, которые хотят избежать этого, есть коммерческая лицензия.

Кому подойдет Memento v1.0? (Спойлер: почти всем)

Разработчики на приватных проектах: если вы работаете с закрытым кодом, Memento не отправляет данные в облака.
Команды с большими legacy-репозиториями: индексация один раз, и агент помнит все.
Энтузиасты локальных AI: кто использует локальные модели и хочет максимизировать их эффективность.
Те, кого бесит постоянное повторение: если вы устали объяснять агенту одно и то же.

Не подойдет тем, кто ищет простой облачный сервис без установки. Или тем, кому нужна память для не-кодовых данных (хотя в будущем обещают поддержку документов).

Финал: что будет дальше?

Memento v1.0 — это не конечная точка. Разработчики уже анонсировали интеграцию с нейронаучными трюками для улучшения поиска. И планируют добавить поддержку мультимодальных эмбеддингов для дизайн-систем.

Мой совет: попробуйте Memento v1.0 даже если у вас маленький проект. Потому что память — это не роскошь, а необходимость. И когда ваш агент впервые ответит на вопрос, не переспрашивая, вы поймете, что это того стоило.

А если столкнетесь с проблемами — сообщество r/LocalLLaMA уже вовсю использует Memento, так что помощи ждать недолго.

Подписаться на канал

Memento v1.0: Забудьте о золотых рыбках — ваш AI-агент теперь помнит все