Учебные материалы
Создание ИИ-ассистента с долговременной памятью и агентами: полный гайд по реализации на Ollama и RAG
Полное руководство по созданию локального ИИ-ассистента с долговременной памятью на RAG и агентами с tool calling. Используем Ollama, pgvector, мультиагентский
Автооценка вебинаров с LLM-судьей: конвейер на whisper.cpp и Claude Code за неделю
Пошаговый гайд по созданию пайплайна автооценки вебинаров: транскрипция whisper.cpp, рубрики YAML, калибровка LLM-судьи под эксперта. Код, метрики, грабли.
Capability-based тестирование LLM-агентов: единый набор тестов для нескольких ассистентов
Научитесь тестировать несколько LLM-ассистентов одним набором тестов. Capability-based подход: проверяем способности, а не реализации. Open-source репозиторий и
Local LLM Inference Optimization: Полное руководство с командами и техниками
Глубокое руководство по оптимизации локального инференса LLM: квантование, CPU offloading, vLLM, llama.cpp, speculative decoding. Актуальные команды и конфиги д
Meta-Spider: новый фреймворк на мета-внимании для LLM и агентов — обзор и запуск через llama.cpp
Подробный гайд по Meta-Spider — архитектуре meta-attention для агентов. Обзор моделей Qwen-3.5-4b и Granite 4.1 8B, пошаговый запуск через llama.cpp, нюансы и п
Лучшие локальные модели text-to-image: тест 192 промптов и методология сравнения
Сравнение локальных моделей генерации изображений: Stable Diffusion 3.5, Flux.1, PixArt-Σ, Kandinsky 3.1. Результаты тестирования 192 промптов, методология, плю
Tool Calling (Function Calling) в LLM: как AI-агенты решают, какое действие выполнить — полное руководство
Разбираем механизм tool calling: как LLM выбирает нужное действие, вызывает API и обрабатывает результат. Пошаговый план, примеры кода, частые ошибки.
AI-агент написал код. Ты уверен, что он не уничтожит твою систему? Песочница: Docker, microVM или WASM
Сравнение Docker, microVM и WASM для безопасного выполнения кода AI-агентов. Какой подход выбрать в 2026 году? Практические советы и подводные камни.
Собираем аналог Firebase на open-source: пошаговый туториал с кодом
Полный гайд по созданию open-source аналога Firebase: Supabase, Realtime, Auth, Storage и деплой в 2026. С примерами кода.
Тернарные нейросети на микроконтроллерах: разбор граблей при обучении ViT, CNN и RNN
Инженерный опыт тернарной квантизации ViT, CNN и RNN для Cortex-M0+. STE, аугментация, CIFAR-10, код и грабли. Как не убить точность и уложиться в 36 рублей.
Как избежать сбоев в JSON-схемах при использовании fallback-моделей в AI-агентах: рецепт с Python-реализацией
Падает JSON при смене модели? Решение: слой валидации, repair и retry. Python-код SchemaGuard для устойчивых агентных пайплайнов.
Современный стек RAG 2025: отказ от энкодеров в пользу LLM и переход на SGLang
Разбираем, почему в 2025 году энкодеры в RAG уступили место универсальным LLM, а SGLang стал стандартом инференса. Полный разбор стека, ошибок и будущего.