Учебные материалы
С нуля на PyTorch: собираем свою GPT по учебнику Рашки. Почему это сложнее, чем кажется
Пошаговая реализация GPT на PyTorch по книге Sebastian Raschka: токенизатор, трансформер-блоки, MultiHeadAttention, маскирование и авторегрессионное обучение.
Когда LLM врет: отлавливаем галлюцинации линейкой в векторном пространстве
Практическое руководство: как находить ложь в ответах LLM через анализ геометрии эмбеддингов. Без дополнительных моделей, только векторы и математика.
Почему общие LLM проваливаются в юриспруденции: разбор архитектуры LabourLawLLM и специализированного бенчмарка
Китайское исследование показало, почему общие LLM не справляются с юридическими задачами. Архитектура LabourLawLLM и специализированный бенчмарк из 12 типов зад
Чёрная дыра для денег или золотая жила: считаем реальную стоимость Blackwell против облачных API
Практический финансовый анализ: когда покупать Blackwell выгоднее, чем платить за GPT-4o? Считаем TCO, амортизацию и точку безубыточности.
Phind.com умер. Да здравствует локальный AI-поисковик на Open WebUI и агентах
Пошаговый гайд по настройке локального AI-поисковика с веб-поиском. Агенты Open WebUI, обход блокировок, оптимизация скорости. Полная замена Phind.com.
Mamba изнутри: почему Delta-Gating — это не просто математика, а механизм выживания в море данных
Глубокий разбор математики Delta-Gating в Mamba: как работает селективный механизм, дискретизация Zero-Order Hold и почему это ломает Transformer. Примеры и инт
AutoRound: практическое руководство по квантованию моделей (на примере MiniMax-M2.1-REAP-40)
Пошаговое руководство по квантованию MiniMax-M2.1-REAP-40 с AutoRound. Параметры nsamples=64, seqlen=512, device_map auto. Практические примеры и типичные ошибк
NeuTTS на Android: как заставить робота говорить в вашем кармане
Подробная инструкция по установке NeuTTS Nano на Android. Копирование OBB файлов, настройка Int8 квантования и работа с мобильным AI без интернета.
Петли повторений в LoRA: как я ломал Qwen2.5-VL-3B и что из этого вышло
Разбор причин возникновения петель повторений после LoRA-дообучения мультимодальной модели Qwen2.5-VL-3B. Практические решения для video reasoning задач.
HR-бот на стероидах: как создать анализатор резюме с локальной AI вместо оплаты OpenAI
Пошаговое руководство по созданию Telegram-бота для анализа резюме с локальной LLM моделью через LM Studio. Бесплатно, приватно, без API.
AI-инструменты дерутся за ваш код: как остановить войну Cursor и Windsurf в одном репозитории
Практическое руководство по настройке workflow для работы с несколькими AI-инструментами в одном репозитории без конфликтов и хаоса.
RAG в 2024 году: почему все возвращаются к ретривелю и как это делать правильно
Глубокий гайд по современному RAG. Почему chunk size решает все, как внедрять ретривер для временных рядов и избегать типичных ошибок. Подробное руководство.