Учебные материалы
Как создать техническое задание, которое не решат ИИ: кейс Anthropic и тесты для разработчиков
Как Anthropic создает тестовые задания, которые не решает Claude 4.5. Практическое руководство для тимлидов и HR по оценке реальных навыков разработчиков.
Как настройка `--threads -1` в llama.cpp ломает производительность GLM-4.7: разбор бага и оптимизация
Подробный разбор бага с параметром --threads -1 в llama.cpp для GLM-4.7. Объясняем, почему автоматическое определение потоков ломает производительность, и даем
Fine-tuning и квантование Qwen2.5-0.5B для классификации обращений: пошаговый гайд для бизнеса
Полный гайд по fine-tuning Qwen2.5-0.5B для классификации обращений, квантованию до 350 MB и деплою на дешёвый VPS. Экономия с $200 до $10 в месяц.
256k контекст на 8 x 5070 Ti: как выбрать и запустить Large Context Model для технических суммаризаций
Практическое руководство по выбору и запуску моделей с контекстом 256k-512k для суммаризации технических документов. Аппаратные требования, сравнение моделей, о
Когда Ollama зависает на полуслове: как настроить таймауты и логирование для генерации сложного кода
Практическое руководство по настройке таймаутов, логированию ошибок и оптимизации Ollama с Continue для генерации сложного кода на локальных LLM. Решаем проблем
Суверенный агент на Neo4j RAG с автономными циклами: полный гайд для Apple Silicon
Пошаговая архитектура автономного агента с Neo4j RAG, ChromaDB и гибридной памятью для Mac M1/M2/M3. Полный стек на 26.01.2026.
VibeCheck: Как я заставил локальный ИИ выгонять меня из дома и искать события
Создаем самодельное приложение на локальном ИИ для борьбы с прокрастинацией. Генерация аниме-картинок, поиск событий, экономия на API. Полный гайд на 2026 год.
Как ускорить AutoGen агентов на 85%: реверс-инжиниринг и архитектура Speculative Reasoning Execution
Реверс-инжиниринг Microsoft AutoGen: модуль SRE сокращает latency с 13.4s до 1.6s. Паттерны асинхронных tool calls и оптимизация ConversableAgent.
Firecrawl на минималках: как парсить сайты для AI за копейки, а не за тысячи
Полный разбор дешевых альтернатив Firecrawl для парсинга сайтов под AI. Сравнение цен, кейс CRM enrichment, готовые решения на 2026 год.
Как локально анализировать код GitHub-репозитория: обзор инструментов RAG и офлайн-альтернатив ChatGPT
Полное руководство по локальному анализу кода GitHub без облаков. Настройка RAG с Ollama, векторными БД и офлайн LLM для приватного анализа репозиториев.
End-to-End беспилотник на VLM: когда дрон сам понимает, куда лететь
Пошаговый гайд по созданию беспилотника с VLM для автономного полета. Аппаратная часть, софт, обучение модели, интеграция.
Забей на облака: Запускаем локальную LLM на iPhone для суммирования встреч
Полное руководство по запуску локальных языковых моделей на iPhone для автономного суммирования встреч. Модели, квантование, CoreML и оптимизация на 25.01.2026.