CodeGraph: сокращение API-вызовов к LLM на 94% | AiManual
AiManual Logo Ai / Manual.
19 Май 2026 Инструмент

CodeGraph: как сократить API-вызовы к LLM на 94% и не разориться на Claude

Обзор репозитория CodeGraph: локальная оптимизация запросов к LLM, снижение затрат на Claude и Cursor до 94% без потери качества. Примеры и сравнение.

Сколько вы платите за воздух?

Каждый день разработчики шлют тонны токенов в API Claude, GPT и Cursor. Проблема в том, что 80% этих запросов — пережёвывание одного и того же контекста: структуры проекта, типов, старых файлов. Вы платите за то, что модель могла бы уже знать, если бы у неё была локальная память. CodeGraph — это open-source инструмент, который разрывает этот порочный круг. Он кэширует граф зависимостей вашего проекта прямо на машине и отдаёт LLM только то, что реально нужно для ответа. Результат — до 94% меньше вызовов к API.

Цифра 94% — не маркетинг. Авторы репозитория приводят замеры на React-проектах со 150+ компонентами: средний размер промпта сократился с 12 000 до 700 токенов. А количество повторных запросов из-за недостатка контекста упало на 89%.

Как это работает под капотом?

CodeGraph не проксирует трафик. Он встраивается в ваш CI/CD или IDE (поддерживаются VS Code, JetBrains, Neovim) и строит статический граф: кто от кого зависит, какие типы экспортируются, где лежат тесты. Когда вы в Cursor выделяете функцию и жмёте "Explain", CodeGraph перехватывает запрос, подтягивает только связанные узлы графа (импорты, типы, соседние функции) и упаковывает их в лаконичный промпт. Модель получает ровно то, что нужно, без всего проекта.

В отличие от Claude-spend, который лишь мониторит расходы, CodeGraph активно их режет. А NadirClaw маршрутизирует запросы между моделями, но не уменьшает их размер. CodeGraph же работает на уровне семантики кода.

Что внутри репозитория?

Проект написан на Rust (ядро) и TypeScript (плагины). Установка через npm или cargo:

npm install -g @codegraph/cli

Далее нужно инициализировать граф в корне проекта:

codegraph init --lang typescript --entry src/index.ts

CodeGraph просканирует файлы, построит DAG и сохранит его в .codegraph/cache.bin. Теперь при каждом запросе к LLM (через CLI-команду codegraph ask или встроенный плагин) он будет возвращать компактный контекст.

Пример в action: допустим, вы хотите объяснить функцию handleLogin из модуля auth. Вместо того чтобы кидать в ChatGPT 2000 строк кода, CodeGraph найдёт саму функцию её импорты (useAuth, api client) и ничего лишнего. Промпт получается размером с почтовую марку.

Важный нюанс: для максимальной экономии CodeGraph лучше всего сочетать с локальными моделями. Тогда вы платите только за электричество. Наше большое сравнение API vs локальных моделей показывает, что железо окупается за 4–6 месяцев при активном использовании.

Сравнение с альтернативами (кому Switch?)

ИнструментПодходЭкономияГде живёт
CodeGraphЛокальный граф зависимостейдо 94% токеновIDE, CLI
NadirClawМаршрутизация между моделямидо 60% стоимостиПрокси-сервер
Claude-spendМониторинг и лимитыкосвеннаяDashboard
Cursor (встроенный)Отправка всего файла0%IDE

Да, Cursor удобен, но его счёт за токены может шокировать. Мы уже писали, что Cursor — дорого. CodeGraph даёт альтернативу: вы продолжаете пользоваться Cursor (или любым другим инструментом), но через плагин CodeGraph все промпты сжимаются прежде, чем уйти в облако.

Реальный кейс: проект на 200 модулей

Возьмём типичный микросервис на FastAPI. Разработчик тратит ~$200 в месяц на Claude API через Cursor. После установки CodeGraph:

  • Средний размер промпта уменьшился с 15 000 до 800 токенов.
  • Количество запросов не изменилось, но каждый стал легче.
  • Расходы упали до $12 в месяц (экономия 94%).

И это без потери качества — модель по-прежнему видит достаточно контекста для точных ответов. Даже Owlex MCP-сервер, который гоняет запросы между разными LLM, можно обвесить CodeGraph и получить тройную экономию.

Кому CodeGraph даст профит?

  1. Одиночкам-фрилансерам. Вы платите из своего кармана — каждый сэкономленный доллар остаётся у вас.
  2. Командам с монолитами. Чем больше кодовая база, тем жирнее промпты. CodeGraph режет их безболезненно.
  3. Тем, кто экспериментирует с локальными LLM. Если вы уже используете Claude Code локально через vLLM, CodeGraph дополнительно снизит нагрузку на GPU.
💡
При установке плагина для Cursor не забудьте отключить встроенную отправку всего файла — иначе экономия будет неполной.

Недостатки, о которых молчат

CodeGraph не идеален. Он требует первоначальной настройки графа (занимает секунды, но если проект динамически подгружает модули — может пропустить зависимости). Также он пока плохо работает с Python из-за неоднозначности импортов (но версия 0.4 обещает это исправить). И последнее: для языков без статической типизации (JavaScript) граф получается менее точным. Но 94% экономии перевешивают эти огрехи.

Альтернативный подход — использовать LiteLLM с Llama-4 Scout, который умеет работать с большим контекстом, но там выигрыш в цене за токен, а не в объёме. CodeGraph же бьёт прямо в корень — меньше токенов значит меньше денег.

Как начать прямо сейчас

Репозиторий лежит на GitHub (ссылка в профиле автора, ищите CodeGraph). Установка через npm или cargo, интеграция с VS Code одним кликом. Через 5 минут после установки вы уже будете видеть, сколько токенов сэкономили.

И да, если вы всё ещё сомневаетесь, стоит ли заморачиваться — вспомните, что цена на Claude API в 2026 году не снизилась, а число токенов в проектах только растёт. Инструменты точечного доступа к коду — это уже не роскошь, а необходимость.

CodeGraph не панацея, но он наглядно показывает: большую часть работы должны делать не нейросети, а грамотная инженерия. И иногда лучший промпт — это отсутствие лишнего промпта.

Подписаться на канал