Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

D

Doc-to-LoRA и Text-to-LoRA от Sakana AI: как динамически обновлять знания LLM без переобучения

Обзор методов Doc-to-LoRA и Text-to-LoRA от Sakana AI для создания LoRA адаптеров на лету через гиперсети. Сравнение с CLaaS и другими альтернативами.

Обзор
R

RewardHackWatch v1.3: детектирование взлома награды в LLM-агентах на CPU с локальным судьёй Llama

Анонс RewardHackWatch v1.3 — open-source инструмент для детектирования подмены тестов и взлома наград в LLM-агентах. Работает на CPU через Ollama с локальным су

Обзор
О

Обратная инженерия Apple Neural Engine: как обучать MicroGPT и LoRA на ANE для максимальной энергоэффективности

Разбираем скрытые API Apple Neural Engine. Практический гайд по обучению MicroGPT и LoRA на NPU Mac M4 для рекордной энергоэффективности.

Обзор
C

Claude Sonnet 4.6: Та самая модель, которая заставила разработчиков забыть про GPT-5

Полный разбор Claude Sonnet 4.6 на март 2026: тесты на SWE-Bench, 1 миллион токенов контекста бесплатно, сравнение с Opus и GPT-5 Turbo, практические примеры ис

Обзор
З

Запуск LLM на bare-metal: UEFI-приложение без ОС для максимально легковесного inference

Экспериментальный проект: UEFI-приложение для запуска LLM на голом железе. Прямой доступ к памяти, никакой операционной системы. Обзор для энтузиастов.

Обзор
О

Оптимизация фронтенда AI-чатов: как исправить лаги в ChatGPT своими руками (перехват API)

Пошаговое руководство по оптимизации фронтенда ChatGPT. Узнайте, как перехватывать fetch-запросы, чистить mapping и внедрять виртуализацию списка для борьбы с л

Обзор
A

AVP (Agent Vector Protocol): передавай KV-cache, а не слова — экономия до 78% токенов

Agent Vector Protocol меняет правила игры. Передавай KV-cache между LLM-агентами вместо текста. Обзор, сравнение, примеры для GPT-4o, Claude 3.7, Devstral-X.

Обзор
C

Claude Skills и Subagents: как избежать рутины промпт-инжиниринга

Как Claude Skills и Subagents от Anthropic меняют работу с LLM. Сравнение с альтернативами, примеры использования и кому подойдет в 2026 году.

Обзор
L

LongCat-Flash-Lite 68.5B на 24 ГБ VRAM: как заставить котика поместиться в маленькую коробку

Пошаговая инструкция по локальному запуску модели LongCat-Flash-Lite 68.5B на GPU с 24 ГБ видеопамяти через оптимизированный llama.cpp с N-gram схемой.

Обзор
B

Bare-Metal LLM: как запустить языковую модель без операционной системы

Полный обзор bare-metal LLM: запускаем языковые модели прямо на железе без операционной системы. Актуально на 2026 год. Сравнение, примеры использования, рекоме

Обзор
И

Используем Qwen2.5-Coder-32B как хакера: какая opensource модель реально справляется с Red Teaming?

Практический бенчмарк opensource моделей для кибербезопасности. Сравниваем Qwen2.5-Coder-32B, Seneca-Cybersecurity и другие — кто генерирует рабочие эксплойты,

Обзор
U

Unsloth Dynamic 2.0: Как умное выборочное квантование GGUF ускоряет инференс и экономит память

Unsloth Dynamic 2.0 ускоряет инференс и экономит память с помощью выборочного квантования слоев. Сравнение, примеры использования и рекомендации.

Обзор