Зачем вам эта модель в кармане?

Представьте, что у вас в телефоне живет не просто чат-бот, а настоящий логик. Модель, которая не генерирует текст по шаблону, а реально рассуждает. Liquid AI LFM2.5-1.2B-Thinking - это именно такой зверь. На 20.01.2026 это одна из самых обсуждаемых компактных моделей для chain-of-thought reasoning.

Она занимает всего 900 МБ оперативки. Для сравнения: Llama 3.2 3B жрет в два раза больше, а толку от нее в логических задачах часто меньше. Секрет в архитектуре Liquid State Space Model - что-то среднее между трансформером и RNN, оптимизированное именно для последовательных рассуждений.

Важно: LFM2.5-1.2B-Thinking - это не многоцелевая модель. Она заточена под решение задач, требующих пошаговой логики. Для генерации поэзии или сочинения анекдотов есть другие варианты.

Что она умеет на практике?

Забудьте про 'привет, как дела'. Эту модель нужно кормить задачами, где есть условие и требуется решение. Вот типичные сценарии:

Решение математических головоломок: 'Если 5 машин за 5 минут производят 5 деталей, сколько времени потребуется 100 машинам для 100 деталей?' Она не выдаст ответ сразу, а распишет логическую цепочку.
Анализ причинно-следственных связей: 'Почему упали продажи в марте?' Модель может предложить несколько гипотез и аргументировать их.
Планирование: Составление оптимального маршрута с учетом множества условий или распределение задач в проекте.
Логические дедуктивные задачи: Классические 'кто где живет и что пьет' с множеством условий.

💡

На тестах GSM8K и MATH (данные на начало 2025 года) LFM2.5-1.2B-Thinking обгоняет модели схожего размера вроде Phi-3-mini и даже некоторые 3B-модели. Но помните: эти бенчмарки измеряют способность к рассуждениям, а не общую эрудицию.

Сравниваем с конкурентами: кто кого?

На рынке мобильных LLM 2025 года есть несколько претендентов. Вот как они выглядят рядом с нашей героиней:

Модель	Размер	Сильная сторона	Слабая сторона
LFM2.5-1.2B-Thinking	1.2B / ~900 МБ	Цепочка рассуждений, логические задачи	Узкая специализация, слабая генерация диалогов
Gemma 3 270M	270M / ~250 МБ	Минимальные требования, общая адекватность	Слабее в сложных рассуждениях
Youtu-LLM-2B	2B / ~1.5 ГБ	Длинный контекст (128k), агентские функции	Требует больше памяти, медленнее
Phi-3.5-mini-instruct	3.8B / ~2.5 ГБ	Универсальность, хорошие инструкции	Еле влезает в память телефона, греется

Вывод простой: если вам нужен именно 'мозг для рассуждений' в компактном формате - LFM2.5-1.2B-Thinking вне конкуренции. Для всего остального есть Instruct-версия той же модели или другие кандидаты.

Как заставить это работать на вашем телефоне?

Теория - это хорошо, но как запустить модель? Есть три рабочих способа на 20.01.2026. Самый простой - первый.

1 Способ для Android: MLC Chat с NPU

Если у вас Android с поддержкой Vulkan (почти все современные), качаем MLC Chat из Google Play. Это не просто клиент, а целый фреймворк, который умеет использовать NPU через Vulkan API.

Устанавливаете MLC Chat.
В настройках включаете 'Use Vulkan for acceleration'.
В разделе 'Models' ищете 'LFM2.5' или добавляете вручную URL модели с Hugging Face: liquid-ai/LFM2.5-1.2B-Thinking-GGUF (на 20.01.2026 уже есть GGUF-квантованная версия).
Выбираете квантование Q4_K_M - оптимальный баланс качества и скорости.
Ждете загрузки (~850 МБ) и начинаете общение.

Не ожидайте диалога как в ChatGPT. Модель ждет задач в формате: 'Реши задачу: [условие]. Покажи рассуждения по шагам'. Если дать 'Расскажи анекдот', получите невнятное бормотание.

2 Способ для iOS: Lekh AI с оффлайн-режимом

Владельцам iPhone немного сложнее, но Lekh AI справляется. Приложение платное, но оно того стоит.

# Модель нужно подготовить на компьютере:
# Конвертируем в GGUF формат через llama.cpp
./convert-hf-to-gguf.py liquid-ai/LFM2.5-1.2B-Thinking
# Квантуем до Q4_K_M
./quantize ./models/LFM2.5-1.2B-Thinking-f16.gguf \
  ./models/LFM2.5-1.2B-Thinking-Q4_K_M.gguf Q4_K_M

Полученный файл закидываете в Lekh AI через iTunes File Sharing или AirDrop. Далее выбираете его в настройках как основную модель. Работает только на CPU, но на iPhone 14 Pro и новее скорость приемлемая.

3 Экспериментальный способ: Ollama Android

Если не боитесь терминала, можно поставить неофициальный Ollama для Android. Но тут нужно самому собирать Modelfile:

FROM liquid-ai/LFM2.5-1.2B-Thinking:latest
PARAMETER temperature 0.1
PARAMETER num_predict 512
SYSTEM "Ты - модель для логических рассуждений. Отвечай пошагово."

Способ для гиков, зато дает полный контроль. Но работает только на CPU, поэтому батарея будет таять на глазах.

Кому стоит попробовать, а кому лучше поискать другое?

Эта модель - не для всех. Она как специализированный инструмент: блестяще справляется со своей работой, но бесполезна вне ее.

Берите LFM2.5-1.2B-Thinking, если:

Вы студент или исследователь, работающий с логическими задачами.
Нужен оффлайн-помощник для решения рабочих кейсов (анализ данных, планирование).
Хотите изучить, как работают chain-of-thought модели на практике.
Цените приватность и не хотите, чтобы ваши мысли улетали в облака.

Обойдите стороной, если:

Вам нужен просто чат-бот для болтовни.
Ждете генерации длинных текстов или творческого контента.
У вас телефон старше 2021 года с малым объемом ОЗУ.
Не готовы потратить 20 минут на настройку.

И последнее: не верьте хайпу. Модель действительно хороша в рассуждениях, но это не искусственный общий интеллект. Она ошибается. Иногда глупо. Но когда работает - кажется, что в вашем телефоне поселился кусочек настоящего AI. И это, черт возьми, круто.

Liquid AI LFM2.5-1.2B-Thinking: как запустить лучшую модель для рассуждений на смартфоне