Гайды по AI и нейросетям

Manual #2297 12 min

Gemma 3 против GPT OSS, Nemotron Nano и Qwen 3 на Mac: кто реально быстрее в 2026 году?

Сравнение производительности 4 моделей в разных квантованиях на Mac M4 Air, M4 mini и M1 Ultra. Реальные цифры скорости и потребления памяти в 2026 году.

Открыть документ

Manual #2293 9 min

Полный каталог инструментов для локального ИИ: 80+ опенсорс-решений для инференса, RAG и тонкой настройки

Экспертный обзор 80+ опенсорс-инструментов для локального ИИ. Ollama, llama.cpp, Stable Diffusion, векторные БД. Полный стек для инференса, RAG и тонкой настрой

Открыть документ

Manual #2287 10 min

Как запустить Llama 70B локально на своём компьютере: пошаговое руководство для новичков

Пошаговое руководство по запуску Llama 70B на домашнем ПК. Сравнение инструментов, выбор квантования, требования к железу и практические советы.

Открыть документ

Manual #2286 12 min

Claude Apps против OpenAI GPTs: сравнение интеграций для Slack, Figma и Canva

Подробное сравнение Claude Apps и OpenAI GPTs для интеграций в Slack, Figma и Canva. Анализ возможностей, ограничений и практических кейсов использования на 202

Открыть документ

Manual #2284 11 min

Как построить серверный AI Gateway на AWS AppSync: архитектура и пример кода

Пошаговое руководство по созданию масштабируемого и безопасного AI Gateway с использованием AWS AppSync Events и Websocket API. Примеры кода GraphQL и Lambda.

Открыть документ

Manual #2283 12 min

Семь мозгов в одной голове: архитектура 'коллективного разума' для Claude Code

Пошаговый гайд по созданию мульти-агентной системы с общей памятью SQLite, MCP сервером и оркестрацией для Claude Code. Архитектура hive mind на TypeScript.

Открыть документ

Manual #2280 8 min

Как Cursor индексирует код: разбор RAG-пайплайна для понимания codebase

Подробный разбор RAG-пайплайна в Cursor для индексации codebase. Как работает chunking, embedding и поиск по коду. Актуально на 26.01.2026.

Открыть документ

Manual #2277 8 min

BWT -0.017 в Sequential LoRA Fine-Tuning: как мы победили катастрофическое забывание

Детальный разбор эксперимента с BWT -0.017 в sequential LoRA fine-tuning на Qwen2.5. Практический протокол борьбы с катастрофическим забыванием в continual lear

Открыть документ

Manual #2276 6 min

Как деанонимизировать поведение трансформера на временных рядах: метод интерпретации с интервенционным протоколом

Практический гайд по интерпретации трансформеров на временных рядах с помощью интервенционного протокола и фальсифицируемых тестов. Шаги, код, ошибки.

Открыть документ

Manual #2275 8 min

3060 Ti против llama.cpp: как выжать 20+ токенов в секунду на карте с 8 ГБ VRAM

Пошаговая настройка llama.cpp для RTX 3060 Ti. Выбираем квантование, настраиваем параметры запуска, добиваемся 20+ токенов/сек на моделях 7B-8B.

Открыть документ

Manual #2274 8 min

Пошаговое обучение LLM с нуля на MacBook: полный гайд с PyTorch и MLX

Полное практическое руководство по обучению языковой модели с нуля на MacBook с Apple Silicon. Установка PyTorch, работа с MLX, подготовка датасета, написание и

Открыть документ

Manual #2272 7 min

Студенческий стартап провалился на ИИ-репетиторе для ЕГЭ: вот что мы накопили за 6 месяцев

Пошаговый разбор провального студенческого стартапа по созданию ИИ-репетитора для ЕГЭ на локальных моделях. RAG-система, fine-tuning под математику, промпты для

Открыть документ

Учебные материалы

Gemma 3 против GPT OSS, Nemotron Nano и Qwen 3 на Mac: кто реально быстрее в 2026 году?

Полный каталог инструментов для локального ИИ: 80+ опенсорс-решений для инференса, RAG и тонкой настройки

Как запустить Llama 70B локально на своём компьютере: пошаговое руководство для новичков

Claude Apps против OpenAI GPTs: сравнение интеграций для Slack, Figma и Canva

Как построить серверный AI Gateway на AWS AppSync: архитектура и пример кода

Семь мозгов в одной голове: архитектура 'коллективного разума' для Claude Code

Как Cursor индексирует код: разбор RAG-пайплайна для понимания codebase

BWT -0.017 в Sequential LoRA Fine-Tuning: как мы победили катастрофическое забывание

Как деанонимизировать поведение трансформера на временных рядах: метод интерпретации с интервенционным протоколом

3060 Ti против llama.cpp: как выжать 20+ токенов в секунду на карте с 8 ГБ VRAM

Пошаговое обучение LLM с нуля на MacBook: полный гайд с PyTorch и MLX

Студенческий стартап провалился на ИИ-репетиторе для ЕГЭ: вот что мы накопили за 6 месяцев