Гайды по AI и нейросетям

Manual #2241 10 min

Как ускорить AutoGen агентов на 85%: реверс-инжиниринг и архитектура Speculative Reasoning Execution

Реверс-инжиниринг Microsoft AutoGen: модуль SRE сокращает latency с 13.4s до 1.6s. Паттерны асинхронных tool calls и оптимизация ConversableAgent.

Открыть документ

Manual #2237 5 min

Firecrawl на минималках: как парсить сайты для AI за копейки, а не за тысячи

Полный разбор дешевых альтернатив Firecrawl для парсинга сайтов под AI. Сравнение цен, кейс CRM enrichment, готовые решения на 2026 год.

Открыть документ

Manual #2236 9 min

Как локально анализировать код GitHub-репозитория: обзор инструментов RAG и офлайн-альтернатив ChatGPT

Полное руководство по локальному анализу кода GitHub без облаков. Настройка RAG с Ollama, векторными БД и офлайн LLM для приватного анализа репозиториев.

Открыть документ

Manual #2233 12 min

End-to-End беспилотник на VLM: когда дрон сам понимает, куда лететь

Пошаговый гайд по созданию беспилотника с VLM для автономного полета. Аппаратная часть, софт, обучение модели, интеграция.

Открыть документ

Manual #2231 8 min

Забей на облака: Запускаем локальную LLM на iPhone для суммирования встреч

Полное руководство по запуску локальных языковых моделей на iPhone для автономного суммирования встреч. Модели, квантование, CoreML и оптимизация на 25.01.2026.

Открыть документ

Manual #2230 7 min

Kinoscriber: как транскрибировать видео локально без интернета и платных подписок

Полный обзор Kinoscriber - веб-приложения для создания субтитров. Тестируем модели Parakeet 2.3, сравниваем скорость и точность, разбираем установку и типичные

Открыть документ

Manual #2226 10 min

MiniMax Agent: как за 15 минут создать интерактивное 3D-приложение без кода на примере модели Солнечной системы

Пошаговый гайд по созданию интерактивной 3D-модели Солнечной системы с помощью MiniMax Agent. Без программирования и сложных инструментов.

Открыть документ

Manual #2225 9 min

Семь GPU ревут: считаем, сколько съедает LLM-ферма и как вернуть деньги

Практический гайд по расчету энергозатрат LLM-фермы с 7 GPU. Idle power, пиковая нагрузка до 2500W, оптимизация и реальный ROI.

Открыть документ

Manual #2223 8 min

NVMe Swapping: Как запустить ЛЮБУЮ модель Ollama на одном сервере и забыть про OOM ошибки

Техника NVMe Swapping позволяет запускать любые модели Ollama на одном сервере. Экономия VRAM, избавление от OOM ошибок, практическое руководство.

Открыть документ

Manual #2222 8 min

Qwen3-VL-8B генерирует кривой JSON? Вот как настроить сэмплеры и исправить всё

Практический гайд: оптимальные параметры сэмплеров для Qwen3-VL-8B. Исправляем плохой JSON и низкое качество ответов. Настройка температуры, top_p, top_k, penal

Открыть документ

Manual #2218 8 min

LM Studio OOM на Windows: Почему Full GPU Offload жрёт оперативную память как сумасшедший

Разбираемся, почему LM Studio с Full GPU Offload на Windows ест оперативку даже при 32 ГБ RAM. Полное руководство по GGUF-моделям, распределению памяти и фиксу

Открыть документ

Manual #2217 7 min

DGX Spark: тестирование реальной производительности матричного умножения (GEMM) и анализ аномалий INT4

Практическое тестирование реальной производительности матричного умножения на DGX Spark. Анализ аномалий INT4, сравнение TFLOP, настройка CUDA ядер и оптимизаци

Открыть документ

Учебные материалы

Как ускорить AutoGen агентов на 85%: реверс-инжиниринг и архитектура Speculative Reasoning Execution

Firecrawl на минималках: как парсить сайты для AI за копейки, а не за тысячи

Как локально анализировать код GitHub-репозитория: обзор инструментов RAG и офлайн-альтернатив ChatGPT

End-to-End беспилотник на VLM: когда дрон сам понимает, куда лететь

Забей на облака: Запускаем локальную LLM на iPhone для суммирования встреч

Kinoscriber: как транскрибировать видео локально без интернета и платных подписок

MiniMax Agent: как за 15 минут создать интерактивное 3D-приложение без кода на примере модели Солнечной системы

Семь GPU ревут: считаем, сколько съедает LLM-ферма и как вернуть деньги

NVMe Swapping: Как запустить ЛЮБУЮ модель Ollama на одном сервере и забыть про OOM ошибки

Qwen3-VL-8B генерирует кривой JSON? Вот как настроить сэмплеры и исправить всё

LM Studio OOM на Windows: Почему Full GPU Offload жрёт оперативную память как сумасшедший

DGX Spark: тестирование реальной производительности матричного умножения (GEMM) и анализ аномалий INT4