Гайды по AI и нейросетям

Manual #6914 8 min

Deep Research Codex: как собрать локальный Deep Research агент за копейки

Пошаговый гайд по созданию локального аналога OpenAI Deep Research с помощью GPT Researcher, Codex и Ollama. Экономим деньги, сохраняем контроль над данными.

Открыть документ

Manual #6913 8 min

Освобождаем VRAM после запуска LLM: No-Mmap и Mlock как лекарство от утечки памяти в llama.cpp

Практический гайд по флагам --no-mmap и --mlock в llama.cpp. Как заставить GPU отдать память после запуска модели, избавиться от утечек и ускорить работу на eGP

Открыть документ

Manual #6910 6 min

Как проектировать архитектуру для ИИ-кодирования: опыт решения проблемы роста контекстного окна

Опыт DevOps: как проектировать код, удобный для LLM, управлять контекстом и избежать технического долга. Практические советы и примеры рефакторинга.

Открыть документ

Manual #6908 8 min

Как построить LLM с нуля: пошаговое руководство от Bigram до Transformer

Подробное руководство по созданию языковой модели с нуля на Python. От простой Bigram модели до Transformer с Attention. Код, объяснения и советы.

Открыть документ

Manual #6903 7 min

Как создавать LLM-агентов без фреймворков: прототипирование workflow на Python и OpenAI API

Пошаговое руководство по созданию LLM-агентов на чистом Python и OpenAI API без LangChain и CrewAI. Прототипирование workflow, инструменты, structured outputs и

Открыть документ

Manual #6897 8 min

Локализация автономного транспорта: как сенсоры и данные решают проблему неопределенности

Разбираем, как автономные машины определяют свое положение, когда сенсоры врут. Фильтр Калмана, графы, аутлаеры — и почему в 2026 году это все еще сложно.

Открыть документ

Manual #6896 8 min

Разбираем вопрос на атомы: парсинг запросов для QA-систем с кодом

Глубокий гайд по извлечению ключевых слов, типа ответа и контекста из пользовательских запросов. Код на Python, spaCy 3.8, transformers 4.50. Улучшаем retrieval

Открыть документ

Manual #6894 8 min

Как создать AI-агентов для бизнес-аналитики на базе 1С без больших бюджетов: разбор реального кейса

Пошаговый разбор создания AI-агента для ABC-анализа в 1С. Реальный кейс: как компания сэкономила бюджет и обошла банкротство. Код, архитектура, ошибки.

Открыть документ

Manual #6890 8 min

RAG от А до Я: шпаргалка архитектора с кодом, метриками и 8 граблями продакшена

Полное руководство по production RAG: чанкинг, гибридный поиск, реранкинг, метрики Ragas, код и 8 граблей, которые сломают ваш пайплайн.

Открыть документ

Manual #6889 6 min

Тест Caveman: стоит ли использовать пещерный стиль для экономии токенов в AI?

Проверяем репозиторий Caveman: насколько пещерный стиль помогает экономить токены в AI-запросах. Тесты на GPT-5.5, Claude 5 и Copilot 2026. Результаты удивляют.

Открыть документ

Manual #6884 7 min

Как сгенерировать реализацию IndexedDB с помощью LLM: промпт, тесты WPT и результаты

Эксперимент: один промпт и Claude Code + Ralph loop позволили сгенерировать реализацию IndexedDB, проходящую 95% тестов WPT. Методика, нюансы, код.

Открыть документ

Manual #6880 6 min

Prompt injection 2026: почему нельзя запатчить, как защититься от supply-chain агентов

Почему prompt injection не лечится патчами и как защититься от supply-chain атак на LLM. Разбор атак на LiteLLM и hackerbot-claw, архитектурные пределы и методы

Открыть документ

Учебные материалы

Deep Research Codex: как собрать локальный Deep Research агент за копейки

Освобождаем VRAM после запуска LLM: No-Mmap и Mlock как лекарство от утечки памяти в llama.cpp

Как проектировать архитектуру для ИИ-кодирования: опыт решения проблемы роста контекстного окна

Как построить LLM с нуля: пошаговое руководство от Bigram до Transformer

Как создавать LLM-агентов без фреймворков: прототипирование workflow на Python и OpenAI API

Локализация автономного транспорта: как сенсоры и данные решают проблему неопределенности

Разбираем вопрос на атомы: парсинг запросов для QA-систем с кодом

Как создать AI-агентов для бизнес-аналитики на базе 1С без больших бюджетов: разбор реального кейса

RAG от А до Я: шпаргалка архитектора с кодом, метриками и 8 граблями продакшена

Тест Caveman: стоит ли использовать пещерный стиль для экономии токенов в AI?

Как сгенерировать реализацию IndexedDB с помощью LLM: промпт, тесты WPT и результаты

Prompt injection 2026: почему нельзя запатчить, как защититься от supply-chain агентов