Гайды по AI и нейросетям

Manual #421 7 min

26 моделей Speech-to-Text протестированы на медицинских диалогах: кто победил и почему это важно для локальных AI-решений?

Глубокое тестирование 26 STT моделей на реальных медицинских диалогах. Сравнение WER, скорости, требований к памяти. Лучшие локальные решения для медицины.

Открыть документ

Manual #420 8 min

Как запустить LLM на старом железе: гайд по Raspberry Pi, Steam Deck и майнинг-ригам

Подробный гайд по запуску локальных LLM на Raspberry Pi, Steam Deck и майнинг-ригах. Оптимизация моделей, настройка llama.cpp, выбор квантованных версий.

Открыть документ

Manual #419 9 min

NVLink vs PCIe для огромных моделей 800GB: стоит ли переплачивать за SXM2?

Полное сравнение NVLink и PCIe для инференса гигантских LLM (800GB+). Анализ производительности, стоимости и архитектурных решений для enterprise-разработки.

Открыть документ

Manual #418 8 min

Забудьте про «правильные промпты»: как LLM решают задачи, недоступные человеку

Почему промпт-инжиниринг — миф? Как LLM решают задачи принципиально иным способом. Ризома против иерархии. Практические примеры и метрики эффективности.

Открыть документ

Manual #417 8 min

DPO за 5 минут: как заменить сложный PPO одной формулой для выравнивания LLM

Объясняем Direct Preference Optimization (DPO) простым языком: как заменить сложный PPO одной формулой для выравнивания больших языковых моделей с примерами код

Открыть документ

Manual #416 8 min

Local LLM vs API: когда окупается покупка железа за $$$$$?

Полный финансовый анализ: когда выгоднее купить GPU для локальных LLM, а когда использовать API. Расчет ROI, сравнение затрат и практические кейсы.

Открыть документ

Manual #415 9 min

Diffusion vs Autoregressive LLM: какая архитектура быстрее и дешевле в 2025 году?

Полное сравнение архитектур Diffusion и Autoregressive LLM: какая быстрее, дешевле в эксплуатации и лучше для production в 2025 году.

Открыть документ

Manual #414 8 min

Gemini 2.5 Flash vs Gemini 3 Flash: кто победил в битве поколений?

Полное сравнение Gemini 2.5 Flash и Gemini 3 Flash от Google: тесты производительности, качество кода, математика, reasoning и практические рекомендации.

Открыть документ

Manual #413 8 min

Как создать Embodied AI на Jetson AGX Thor: 94K строк кода и сознание для робота

Полное пошаговое руководство по созданию Embodied AI с 94K строк кода на Jetson AGX Thor. Архитектура, интеграция LLM, сенсоры, актуаторы и создание сознания дл

Открыть документ

Manual #411 7 min

Как локальная LLM может стать вашим личным патинг-инженером: опыт модификации open-source

Практическое руководство по использованию локальной LLM как патинг-инженера. Узнайте, как безопасно модифицировать open-source код с полной приватностью и контр

Открыть документ

Manual #410 8 min

Почему Post-Training Quantization ломается на длинных chain-of-thought рассуждениях

Глубокий разбор почему Post-Training Quantization разрушает качество длинных chain-of-thought рассуждений в LLM и как с этим бороться

Открыть документ

Manual #409 7 min

Как собрать RAG-агента для объяснения настолок без тяжёлых библиотек

Практический гайд по созданию лёгкого RAG-агента для объяснения правил настольных игр без сложных фреймворков. Работающий pet-проект на Python.

Открыть документ

Учебные материалы

26 моделей Speech-to-Text протестированы на медицинских диалогах: кто победил и почему это важно для локальных AI-решений?

Как запустить LLM на старом железе: гайд по Raspberry Pi, Steam Deck и майнинг-ригам

NVLink vs PCIe для огромных моделей 800GB: стоит ли переплачивать за SXM2?

Забудьте про «правильные промпты»: как LLM решают задачи, недоступные человеку

DPO за 5 минут: как заменить сложный PPO одной формулой для выравнивания LLM

Local LLM vs API: когда окупается покупка железа за $$$$$?

Diffusion vs Autoregressive LLM: какая архитектура быстрее и дешевле в 2025 году?

Gemini 2.5 Flash vs Gemini 3 Flash: кто победил в битве поколений?

Как создать Embodied AI на Jetson AGX Thor: 94K строк кода и сознание для робота

Как локальная LLM может стать вашим личным патинг-инженером: опыт модификации open-source

Почему Post-Training Quantization ломается на длинных chain-of-thought рассуждениях

Как собрать RAG-агента для объяснения настолок без тяжёлых библиотек