Учебные материалы
Развертывание Vision-Language модели NVIDIA Cosmos на Jetson: полный туториал с vLLM
Пошаговый туториал по развертыванию VLM NVIDIA Cosmos на Jetson AGX Thor/Orin с vLLM. JetPack 6.0+, оптимизация памяти, работа с камерой и примеры кода.
Как заменить двухмодельную агентную настройку на Qwen3.5 35B-A3B на Mac M1: гайд по производительности и квантованию
Пошаговый гайд по замене двухмодельной агентной настройки на Qwen3.5 35B-A3B на Mac M1. Квантование Q4_K_XL, настройка llama.cpp server, тесты производительност
Чиним лаги ChatGPT на длинных диалогах: перехватываем API и обрезаем историю
Пошаговый гайд по оптимизации фронтенда ChatGPT: перехватываем fetch API, обрезаем историю сообщений и убираем лаги на диалогах 500+ сообщений. Код и объяснения
Заголовок: ломаем догму 'длиннее reasoning - лучше'. Как DTR ускоряет локальные LLM в 2 раза без потери качества
Полное руководство по DTR и Think@n стратегии для ускорения локальных LLM. Экономия 50% вычислений без потери точности. Актуально на 2026 год.
Multi-Directional Refusal Suppression: как подавить отказы в LLM с помощью самоорганизующихся карт
Глубокий разбор метода Multi-Directional Refusal Suppression для подавления отказов в языковых моделях с помощью самоорганизующихся карт (SOM). Технический гайд
Как уйти от шаблонного AI-дизайна: 5 приёмов для уникального вида сайтов
Разрабатываем сайты, которые не похожи на пластиковый AI-лендинг. Конкретный пайплайн из пяти шагов для дизайнеров и разработчиков.
Claude Skills: инструкция по созданию переиспользуемых промптов и победа над рутиной
Полное руководство по Claude Skills от Anthropic. Узнайте, как создавать skill.md файлы для автоматизации рутинных задач с Claude 4.5. Примеры, ошибки, FAQ.
Как построить гибридного чат-бота с ИИ за 5000 руб. в месяц: обзор подходов и выбор стека
Практический гайд по архитектуре гибридного чат-бота. Детальный разбор затрат: SaaS, open-source, кастомные решения. Учет 152-ФЗ и выбор стека.
Оптимизация ML inference на Databricks: partitioned tables vs liquid clustering vs salting на боевом кейсе
Реальный кейс ускорения инференса с 24 до 6 часов: сравниваем partitioned tables, liquid clustering и salting на Databricks с метриками производительности.
Тест производительности Qwen3.5-35B в multi-agent задачах: почему он справился, а другие sub-100B модели — нет
Детальный разбор эксперимента: почему только Qwen3.5-35B справился с multi-agent workflow, а другие модели sub-100B провалились. Анализ reasoning effort, пошаго
Как включить обработку изображений в Qwen 3.5 через OpenCode и Llama.cpp: готовое решение
Полное руководство по активации многомодальности в Qwen 3.5. Готовая JSON-конфигурация для OpenCode и Llama.cpp, шаги установки и решение типичных ошибок.
RAG-бот для BIM на GigaChat: как архитектор без навыков кода автоматизировал работу с документами
История архитектора, который без программирования создал RAG-бота для работы с BIM-документами на GigaChat. Как он это сделал и какие результаты получил.