Qwen 3.6 против GPT-4o и Claude 4: тест HTML Canvas анимаций

Canvas как лакмусовая бумажка

Спросите любого разработчика, что бесит в AI-генерации кода — он скажет: анимации на Canvas. Тут нейросеть превращается в сапёра. Одна ошибка в координатах — и частицы разлетаются в бесконечность. requestAnimationFrame без условия остановки сожрёт 100% CPU. Цвета становятся грязными, если перепутать каналы.

В прошлом тесте мы уже гоняли Qwen 3.6, GPT-4o, Claude 4 (Sonnet) и Gemini 3 Pro с одним и тем же промптом про частицы и линии. Результаты оказались неожиданными даже для разработчиков, которые пишут Canvas руками. Но хватит интриг — давайте разберём, кто кого переиграл и почему локальная модель стоит вашего внимания.

Правила честного боя

Промпт: «Создай анимацию на HTML Canvas: частицы, соединяющиеся линиями, цвет меняется от синего к фиолетовому, фон тёмный, плавная смена кадров через requestAnimationFrame». Никаких подсказок про архитектуру, библиотеки или структуру. Запускали по 5 раз для каждой модели, чтобы сгладить случайность. Оценивали три метрики: визуальная сложность (0-10), средний FPS и точность следования промпту (да/нет по каждому пункту).

Модель	Визуал (0-10)	Средний FPS	Соответствие промпту
GPT-4o	8.5	58	5/5
Claude 4 (Sonnet)	9.2	55	5/5
Qwen 3.6 (72B, локально)	8.9	60	4/5

Что показали цифры

Claude выдал самую красивую картинку: мягкий градиент, живые траектории частиц, лёгкое свечение. Визуал на твёрдую девятку. Но на 5-м запуске случился фриз — canvas завис после 30 секунд работы. Баг с бесконечным циклом? Возможно. GPT-4o стабильнее: ни одного сбоя, FPS ровный, но анимация выглядит «стерильно» — как будто её рисовал инженер, а не художник. А вот Qwen 3.6 удивил. При 8.9 балла визуала и максимальном FPS (60) он единственный, кто добавил случайное мерцание частиц. Эффект, который не прописывали в промпте, но он органично вписался. Плата — один из пяти прогонов не включил смену цвета, оставив все частицы синими. Соответствие промпту 4/5, но за счёт креативности.

Кстати, для запуска Qwen 3.6 мы использовали сборку llama.cpp от мая 2026 и OpenCode. Если у вас 24 ГБ VRAM, локальная версия 72B летает. А для тех, кому нужно компактнее, вышли дистиллированные версии 9B и 14B — они медленнее, но на простых анимациях тоже справляются.

Где локальная модель обходит облачных монстров

Ладно, визуал — субъективно. Но есть объективные плюсы Qwen. Во-первых, цена: API GPT-4o стоит копейки, но при активной разработке с сотнями вызовов в день счёт улетает в космос. Qwen 3.6 на своём железе — бесплатно после покупки GPU. Во-вторых, скорость генерации: локально первый ответ приходит за 2-3 секунды (с кэшированием KV-кеша), а облачные модели добавляют латентность сети. В-третьих, конфиденциальность: код никуда не улетает.

Но есть и минус — Qwen требует точного промпта. Если написать «сделай красиво», модель выдаст чёрный квадрат. Claude и GPT умеют «домысливать» даже расплывчатые запросы. С Qwen надо конкретно: количество частиц, радиус соединения, частота кадров. Впрочем, это дело привычки.

А что с багами?

Ни одна модель не идеальна. У GPT-4o пару раз вылетал range error при работе с массивами частиц. Claude стабилен, но тяжёл — инлайновый код весил 120 КБ даже для простой анимации. Qwen 3.6 сгенерировал компактный код (45 КБ), но изредка забывал очищать canvas. Визуально это выглядело как «шлейф» — следы от предыдущих кадров оставались на экране. Для частиц это допустимо, но для чётких фигур — катастрофа.

Сравнение с другими локальными моделями тоже показательно. Например, Qwen 3.5 в задаче баг-репортов на Swift показывал себя уверенно, но Canvas — другой уровень абстракции. Тут важна не логика, а чувство ритма и пространства. Именно в этом Qwen 3.6 сделал шаг вперёд.

Так что выбирать?

Если вам нужна стабильность и красиво «из коробки» — берите Claude 4. Если дедлайны горят и нужен рабочий код без сюрпризов — GPT-4o. Если вы разработчик, который любит экспериментировать, и у вас есть 24 ГБ VRAM — ставьте Qwen 3.6. Он даст вам тот самый вайб «кода с душой», пусть и с лёгкой долей хаоса. А для долгих сессий кодинга локальный ассистент вообще незаменим — туториал по установке поможет начать.

Не советую гнаться за топовыми баллами, если вам нужно просто набросать прототип анимации. Возьмите GPT-4o — он не подведёт. Но когда захочется удивить заказчика нестандартным эффектом или сэкономить на API, вспомните про Qwen. Иногда лучшее — враг хорошего, но в случае с Qwen 3.6 «просто хорошее» уже выглядит как победа.

Подписаться на канал

Qwen 3.6 против GPT-4o и Claude 4: кто рисует Canvas анимации лучше? Полевой тест