Учебные материалы
GLM-4.7 с Claude-совместимым API: как сэкономить $1000 в месяц на агентах
Пошаговый гайд по развертыванию GLM-4.7 с Claude-совместимым API для агентов, тестирования и внутренних инструментов. Экономия до 1000$ в месяц.
Когда 512k токенов — это не хвастовство, а боль: как правильно бенчмаркать длинные контексты LLM
Полное руководство по тестированию LLM с длинным контекстом. lm-eval, Runer-QA-Hotpot, стресс-тесты, анализ деградации качества — всё, что нужно для честного бе
Mistral Vibe + Devstral2 Small: локальный монстр на 256k токенов и трех GPU
Пошаговый гайд по настройке связки Mistral Vibe и Devstral2 Small для 256k контекста на 3 GPU с реальными цифрами скорости и конфигурацией config.toml.
Dark CoT: как научить 4B-модель стратегическому и макиавеллиевскому мышлению (эксперимент с Gemma 3 4B)
Эксперимент по fine-tuning Gemma 3 4B для стратегического мышления. Dark Chain-of-Thought, датасеты, метрики GPQA Diamond, этические вопросы.
40 минут - не предел: как AI-агенты Google Cloud уже сейчас решают реальные бизнес-задачи
Конкретные примеры внедрения AI-агентов Google Cloud: как Telus и Suzano автоматизировали процессы и сократили время выполнения задач на 40 минут и 95%.
Data-driven анализ вкусов: как с помощью эмбеддингов LLM кластеризовать фильмы, книги и музыку
Практическое руководство по использованию эмбеддингов LLM для кластеризации культурного контента. Data-driven подход к анализу вкусов.
Практический гайд: как запустить 30B MoE-модель (Granite 4 Small) на ноутбуке с 8 ГБ VRAM и 32 ГБ RAM
Подробная инструкция по запуску 30B MoE-модели Granite 4 Small на ноутбуке с 8 ГБ видеопамяти и 32 ГБ RAM. Настройка llama.cpp, размещение экспертов в CPU, рабо
40 практических советов по работе с Gemini 3: от визуализации данных до интерактивных калькуляторов в Поиске
40 практических советов по Gemini 3: работа с визуализацией данных, создание интерактивных калькуляторов в Поиске, NotebookLM Fast Research, мультимодальное обу
От эскиза до подиума: полный техпроцесс создания люксовой одежды с помощью Stable Diffusion и 3D-печати
Пошаговый гайд: от обучения LoRA на коллекциях до 3D-печати тканей. Интеграция ИИ в реальное производство люксовой одежды.
Обзор лучших AI-приложений для диктовки 2025: сравнение функций, цен и точности
Полный обзор AI-приложений для диктовки 2025 года. Сравниваем Wispr Flow, Otter.ai, Whisper API и другие по точности, функциям и цене.
Фотографии в аниме и киберпанк: превращаем селфи через Яндекс Алису
Пошаговая инструкция по стилизации фото в аниме и киберпанк через YandexART 2.5. Работающие промпты, меню стилей, ошибки и фишки.
RTX 4070 Super: Как заставить транскрипцию, RAG и веб-интерфейс работать одновременно без падений
Пошаговое руководство по запуску Whisper транскрипции, RAG и Open WebUI на одной RTX 4070 Super без сбоев. Распределение VRAM, изоляция процессов, мониторинг.