Учебные материалы
Математическая революция: почему механизм внимания — это проблема d², а не n²
Разбор анонимного доказательства, показывающего, что истинная сложность механизма внимания — O(d²), а не O(n²). Как это изменит архитектуру трансформеров и эффе
Сравнительный тест Qwen3.5: 4B, 9B и 27B модели в Ollama на Radeon 7900XTX
Практический бенчмарк Qwen3.5 моделей на Radeon 7900XTX. Сравнение скорости и качества ответов. Код для повторения тестов.
Почему LM Studio медленнее llama.cpp для MoE-моделей: разбор и настройка для максимальной скорости
Разбираем, почему LM Studio в 2.5 раза медленнее llama.cpp для MoE-моделей и даем пошаговую настройку для максимальной скорости.
Как создать саморазвивающегося ИИ-агента на Rust: эксперимент Truman Show
Пошаговый гайд по созданию автономного ИИ-агента на Rust, который пишет код, ведет журнал и саморазвивается. Практический эксперимент Truman Show 2026.
Полный гайд: Создаём локальный ИИ-ассистент с RAG для учёбы на базе Qwen2.5
Пошаговое руководство по созданию локального ИИ-ассистента для учёбы с использованием Qwen2.5, ChromaDB и Gradio. Работает без интернета, сохраняет конфиденциал
Сборка умной колонки на Raspberry Pi с локальными ИИ-моделями: Ollama, Whisper, Silero TTS
Пошаговое руководство по сборке умной колонки на Raspberry Pi 5. Используем локальные модели Ollama, Whisper и Silero TTS для полной автономности без облаков и
Графовая когнитивная память для долгоживущих ИИ-агентов: архитектура на SQLite с кодом и гибридным поиском
Полная архитектура графовой памяти на SQLite для долгоживущих ИИ-агентов. Код, схемы, гибридный поиск FTS5+векторы и кривая забывания Эббингауза.
Полностью открытые LLM в 2026: как отличить настоящий опенсорс от маркетинга
Полное руководство по полностью открытым LLM в 2026: критерии открытости, сравнение моделей, инструкции по воспроизведению с нуля и обзор лучших SOTA-решений
AI-агент для проверки ТЗ: пошаговый разбор архитектуры и промптов от аналитика
Пошаговый разбор создания AI-агента для автоматической проверки технических заданий. Архитектура, промпты, ошибки и советы от Senior DevOps инженера.
Проект «Прометей»: как озвучить библиотеку книг за вечер с помощью ИИ на выделенном сервере
Технический гайд по созданию высокоскоростной TTS-фабрики для библиотек. Озвучка книг с помощью XTTS 3.0 и GPT-SoVITS 3.5 на GPU-сервере. Оптимизация, параллели
Как простой трюк с верификацией поднял результат Qwen3.5 на SWE-bench до уровня Claude Opus
Глубокий разбор стратегии verify-on-edit, которая позволила Qwen3.5 догнать Claude Opus в решении реальных задач из SWE-bench. Пошаговый план, нюансы и подводны
Гайд: как запустить DeepSeek-V3.2 и другие свежие LLM на vLLM (B200/H200)
Пошаговая инструкция по запуску новейших LLM на vLLM 0.16 для NVIDIA Blackwell. Настройка драйверов, кастомизация Docker, решение ошибок safetensors и nvlsm fab