Учебные материалы
Современный стек RAG 2025: отказ от энкодеров в пользу LLM и переход на SGLang
Разбираем, почему в 2025 году энкодеры в RAG уступили место универсальным LLM, а SGLang стал стандартом инференса. Полный разбор стека, ошибок и будущего.
Gemini 3.1 Flash Lite: CLI для интеграции с Gmail, Drive и Docs — установка и первые примеры
Пошаговый гайд по установке Gemini 3.1 Flash Lite CLI, настройке OAuth для Gmail, Drive и Docs, и первые рабочие примеры автоматизации с критическими нюансами.
Как отключить AI в Google Docs: пошаговая инструкция по удалению Gemini и других навязчивых функций
Пошаговое руководство по отключению Gemini, Smart Compose, Help me write и других AI-функций в Google Docs. Убираем навязчивые подсказки и возвращаем контроль н
How to Reduce AI Sycophancy: Lessons from Oxford's Study on Warm vs. Truthful AI
Практическое руководство по снижению сикофантии AI: методы тонкой настройки на основе исследования Оксфорда. Баланс теплоты и правдивости с кодом и лайфхаками.
Создание кастомного GStreamer плагина для NVIDIA DeepStream на Python: как обойти nvinfer и взять контроль над метаданными
Полный гайд по созданию Python плагина для DeepStream: перехват буферов после nvinfer, извлечение и изменение NvDsMeta, обработка объектов без перекомпиляции C+
Порог оттока — это ценовое решение: как настроить churn threshold с учётом стоимости удержания и потерь
Узнайте, почему стандартный порог 0.5 в churn-моделях стоит миллионов. Как рассчитать оптимальный threshold с учётом стоимости удержания и потерь на IBM Telco.
Продвинутый RAG: диспетчеризация вопросов с профилированием документа, стратегией чанков и аудитом на основе GPT-4.1
Глубокий технический разбор RAG-пайплайна с профилированием документа, динамическим выбором чанков и аудитом через GPT-4.1. Код, нюансы и грабли продакшена.
Как Cloudflare построила AI-ревью кода в масштабе: CI-оркестрация с OpenCode
Реальный кейс Cloudflare: как оркестрировать AI-ревью кода с OpenCode в CI пайплайне. Архитектура, масштабирование, подводные камни. Дата: 21.06.2026
Автоматическое обнаружение сбоев AI-агентов и анализ первопричин с Strands Evals SDK
Пошаговое руководство по использованию Strands Evals SDK для детекции ошибок и root cause analysis в трейсах AI-агентов. Экономьте часы отладки в production.
Полный гайд по внутренностям LLM: от токенизации до продакшена на примере Gemma 4 12B
DevOps-гайд по архитектуре LLM на примере Gemma 4 12B: от токенов до продакшена. Математика, формы тензоров, аппаратные ограничения и квантование.
Оптимизация RAG для PDF: как извлекать текст из изображений без лишних затрат на Vision LLM
Научитесь извлекать текст из изображений PDF с минимальными затратами на Vision API. Каскадная фильтрация: OCR, дешевая типизация и только 10% запросов к VLM.
Автоматическая нарезка докладов в вертикальные видео: пайплайн с Whisper, LLM и ffmpeg
Гайд по автоматической нарезке длинных докладов в вертикальные видео. Используем Whisper для транскрибации, LLM для поиска хайлайтов, ffmpeg для монтажа. Без ру