Учебные материалы
Deep Research Codex: как собрать локальный Deep Research агент за копейки
Пошаговый гайд по созданию локального аналога OpenAI Deep Research с помощью GPT Researcher, Codex и Ollama. Экономим деньги, сохраняем контроль над данными.
Освобождаем VRAM после запуска LLM: No-Mmap и Mlock как лекарство от утечки памяти в llama.cpp
Практический гайд по флагам --no-mmap и --mlock в llama.cpp. Как заставить GPU отдать память после запуска модели, избавиться от утечек и ускорить работу на eGP
Как проектировать архитектуру для ИИ-кодирования: опыт решения проблемы роста контекстного окна
Опыт DevOps: как проектировать код, удобный для LLM, управлять контекстом и избежать технического долга. Практические советы и примеры рефакторинга.
Как построить LLM с нуля: пошаговое руководство от Bigram до Transformer
Подробное руководство по созданию языковой модели с нуля на Python. От простой Bigram модели до Transformer с Attention. Код, объяснения и советы.
Как создавать LLM-агентов без фреймворков: прототипирование workflow на Python и OpenAI API
Пошаговое руководство по созданию LLM-агентов на чистом Python и OpenAI API без LangChain и CrewAI. Прототипирование workflow, инструменты, structured outputs и
Локализация автономного транспорта: как сенсоры и данные решают проблему неопределенности
Разбираем, как автономные машины определяют свое положение, когда сенсоры врут. Фильтр Калмана, графы, аутлаеры — и почему в 2026 году это все еще сложно.
Разбираем вопрос на атомы: парсинг запросов для QA-систем с кодом
Глубокий гайд по извлечению ключевых слов, типа ответа и контекста из пользовательских запросов. Код на Python, spaCy 3.8, transformers 4.50. Улучшаем retrieval
Как создать AI-агентов для бизнес-аналитики на базе 1С без больших бюджетов: разбор реального кейса
Пошаговый разбор создания AI-агента для ABC-анализа в 1С. Реальный кейс: как компания сэкономила бюджет и обошла банкротство. Код, архитектура, ошибки.
RAG от А до Я: шпаргалка архитектора с кодом, метриками и 8 граблями продакшена
Полное руководство по production RAG: чанкинг, гибридный поиск, реранкинг, метрики Ragas, код и 8 граблей, которые сломают ваш пайплайн.
Тест Caveman: стоит ли использовать пещерный стиль для экономии токенов в AI?
Проверяем репозиторий Caveman: насколько пещерный стиль помогает экономить токены в AI-запросах. Тесты на GPT-5.5, Claude 5 и Copilot 2026. Результаты удивляют.
Как сгенерировать реализацию IndexedDB с помощью LLM: промпт, тесты WPT и результаты
Эксперимент: один промпт и Claude Code + Ralph loop позволили сгенерировать реализацию IndexedDB, проходящую 95% тестов WPT. Методика, нюансы, код.
Prompt injection 2026: почему нельзя запатчить, как защититься от supply-chain агентов
Почему prompt injection не лечится патчами и как защититься от supply-chain атак на LLM. Разбор атак на LiteLLM и hackerbot-claw, архитектурные пределы и методы