Учебные материалы
Инженерный расчёт на автопилоте: как Grok 4.1 Thinking и Aristotle заменяют коллегу с красной ручкой
Пошаговый гайд по использованию Grok 4.1 Thinking и Aristotle для экспертной проверки инженерных расчётов, научных гипотез и рецензирования статей. Реальные про
LLM Structured Outputs: Когда JSON — это не опция, а требование
Полное руководство по получению структурированных данных из LLM: JSON Schema, Pydantic, Outlines, ограниченная генерация и парсинг. Методы для production.
CPU-инференс Mistral-7B: как калибровка на этапе вывода ускоряет работу на 40%
Практический гайд: как калибровка на этапе вывода в llama.cpp ускоряет CPU-инференс Mistral-7B на 40% и снижает потребление RAM на 6%. Тесты на Ryzen 5 5600G.
«Модель на конец света»: обзор самых умных LLM, которые влезут в 24 ГБ VRAM
Какие самые умные модели ИИ запустить на 24 ГБ видеопамяти? Обзор Qwen, Llama, DeepSeek и квантование для офлайн-работы.
Оптимизация GPT-OSS 120B на Strix Halo 128 ГБ: сборник советов по драйверам, маппингу памяти и настройке Ubuntu
Полный гайд по запуску GPT-OSS 120B на AMD Strix Halo с 128 ГБ ОЗУ. Настройка драйверов ROCm, маппинг памяти, оптимизация Ubuntu 24.04.
Как запустить контекст >128k на 2x RTX 3090: сравнение методов (vLLM, EGPU, RPC, ik_llama)
Полный гайд по запуску длинного контекста на двух RTX 3090. Сравнение методов vLLM, EGPU, RPC и ik_llama с инструкциями и бенчмарками.
DOM-пранинг: как заставить браузерного агента видеть структуру, а не пиксели
Замена скриншотов на структурированные DOM-снимки для локальных агентов. Практический гайд с кодом для Qwen 2.5 3B.
Фреймворки для оркестрации AI-агентов: какой выбрать и почему все они раздражают
Полный обзор и сравнение фреймворков для оркестрации AI-агентов. LangGraph vs CrewAI vs AutoGen: что выбрать для production в 2025 году.
Discord-бот с мозгами на Raspberry Pi: как запустить LLM на 4 ГБ RAM и не сойти с ума
Подробный гайд по выбору моделей и квантований для Discord-бота с локальной LLM. Ollama, TinyLlama, Phi-2 на слабом железе. Готовый код на Node.js.
Jailbreak SAFi агента: анализ уязвимостей и техник prompt injection на реальном кейсе
Разбор реального jailbreak-челленджа SAFi агента. Анализ уязвимостей, техник prompt injection и answer-in-refusal leak. Как защитить ИИ-агентов.
Data Poisoning: когда ваши тренировочные данные внезапно становятся оружием против вас
Как обнаружить и защититься от data poisoning атак на тренировочные данные. Практическое руководство с примерами, методами защиты и реальными кейсами взлома ML
С нуля на PyTorch: собираем свою GPT по учебнику Рашки. Почему это сложнее, чем кажется
Пошаговая реализация GPT на PyTorch по книге Sebastian Raschka: токенизатор, трансформер-блоки, MultiHeadAttention, маскирование и авторегрессионное обучение.