Вы загрузили тысячу документов в вашу RAG-систему. Настроили чанкинг, подобрали эмбеддинг-модель. Запускаете поиск. Получаете ответ. Но ответ — ерунда. Вы смотрите в логи: там мелькают хэши, score'ы, какие-то числа. А понять, почему система вытащила именно этот кусок текста, а не соседний, — невозможно. RAG остаётся чёрным ящиком. До тех пор, пока вы не запустите Project Golem.

Что такое Project Golem и зачем он нужен

Project Golem — это open-source инструмент, который превращает абстрактные многомерные эмбеддинги в интерактивный 3D-граф. Он буквально рисует вам карту вашей векторной базы данных. Вы видите, как документы сгруппированы в кластеры, как далеко друг от друга находятся разные темы, и, самое главное, как именно векторный поиск находит путь от вашего вопроса к релевантным чанкам.

💡

В основе Golem лежит тот же принцип, что и в нашей статье про визуализацию RAG с UMAP. Но здесь это не статичная картинка, а целая интерактивная среда для расследования.

Инструмент появился в начале 2025 года как внутренний проект для отладки больших RAG-пайплайнов и к марту 2026 года обрёл версию 1.5 с поддержкой всех основных векторных баз (Milvus 2.4, Weaviate, Pinecone) и последних эмбеддинг-моделей, включая Google's Gemini Embedding 2.1 и NVIDIA's Nemotron-4 340B Embeddings.

Как это работает: от чисел к трёхмерному миру

Golem подключается к вашей векторной базе, выгружает эмбеддинги и метаданные, а затем делает две ключевые вещи. Сначала снижает размерность с помощью алгоритма PaCMAP (на 2026 год — это более быстрый и стабильный наследник UMAP). Потом строит 3D-сцену в браузере, используя Three.js.

Что визуализирует Golem	Зачем это нужно
Кластеры документов по темам	Понять, хорошо ли разделились данные после эмбеддинга
Траектории поисковых запросов	Увидеть, какой путь проходит запрос к топ-N результатам
Выбросы (outliers)	Найти чанки, которые испортят любой поиск
Плотность распределения	Оценить, не "схлопнулись" ли все вектора в один шар

Вы не просто смотрите на разноцветные точки. Вы можете кликнуть на любую точку (это чанк документа) и увидеть его исходный текст. Запустить поиск по конкретному запросу и наблюдать, как от вашего вопроса (он отображается как pulsar-шар) расходятся лучи к найденным документам. Это убийственно наглядно.

Главный подвох: снижение размерности всегда искажает реальность. Близкие точки в 3D могут быть далёкими в исходном 768-мерном пространстве. Golem это не скрывает — он показывает метрики искажения прямо в интерфейсе. Доверяй, но проверяй.

Сравнение: чем Golem лучше других инструментов

До Golem были попытки. TensorBoard Projector — мощно, но требует TensorFlow и выглядит как приборная панель 2010-х. umap.plot — только статичные 2D картинки. Встроенные дашборды в Milvus Attu или Weaviate Console — показывают метрики, но не пространственную структуру.

Golem выигрывает у всех тремя пунктами:

Интерактивность 3D. Можно летать вокруг своих данных, приближать, поворачивать. Мозг так воспринимает информацию в разы лучше.
Привязка к реальным запросам. Вы вводите вопрос прямо в интерфейсе и смотрите, как работает поиск в реальном времени. Идеально для отладки гибридного поиска.
Никакой привязки к стеку. Работает с любой векторной БД через API. Неважно, что у вас: Qdrant 1.9.x, Pinecone или самописное хранилище на FAISS.

Запускаем Golem на своих данных

Установка — дело пяти минут. Клонируете репозиторий с GitHub, ставите зависимости из requirements.txt (главное — Python 3.10+). Конфигурируете подключение к вашей БД в YAML-файле.

1 Подготовка и первый запуск

После настройки просто запускаете скрипт индексации. Golem выгрузит эмбеддинги, рассчитает проекцию и сгенерирует статичные файлы для веб-интерфейса. Дальше открываете index.html в браузере — и всё. Сервер не нужен.

2 Что смотреть в первую очередь

Сразу идите на вкладку "Query Inspector". Вбейте типичный пользовательский запрос. Смотрите, куда полетит шар-запрос и к каким документам потянутся лучи. Если лучи бьют в пустоту или цепляют явно нерелевантные кластеры — у вас проблема с эмбеддингами или чанкингом. Чаще всего проблема именно здесь, а не в LLM.

Кому стоит попробовать, а кому нет

Этот инструмент — палочка-выручалочка для инженеров, которые отлаживают production RAG-системы. Если ваша точность поиска скачет от 70% до 90% и вы не понимаете почему, Golem покажет причину за полчаса. Он также бесценен для исследований, когда нужно объяснить, почему одна модель эмбеддингов работает лучше другой.

Не тратьте время на Golem, если:

У вас меньше 1000 документов в базе. Проще всё проверить вручную.
Вы только начинаете знакомство с RAG. Сначала разберитесь с основами, например, по нашему туториалу по Gemini Embedding 2.
Вам нужна визуализация для мультимодальных эмбеддингов (изображения, видео). Golem пока заточен под текст, хотя в roadmap на 2026 год есть поддержка мультимодального RAG.

Project Golem не сделает ваш RAG умнее. Он сделает его понятнее. А в мире, где сложность систем растёт быстрее нашей способности их отлаживать, это иногда важнее.

Прогноз на 2026-2027: такие инструменты, как Golem, станут стандартом де-факто для CI/CD пайплайнов в ML. Вместо unit-тестов на точность — визуальная проверка, что новая модель эмбеддингов не разбросала ваши данные по углам 768-мерной вселенной.

Подписаться на канал

Project Golem: Когда RAG перестаёт быть чёрным ящиком