Галлюцинации как фича, а не баг
Обычно разработчики LLM делают всё, чтобы модель не выдумывала факты. Чем меньше галлюцинаций — тем лучше. Но стартап Springboards решил пойти от обратного. Их новая модель Flint не просто терпит галлюцинации, а активно их провоцирует. Зачем? Чтобы вытащить LLM из ловушки группового мышления и заставить её выдавать по-настоящему неожиданные ответы.
В теории это звучит как ересь. На практике — работает. Вместо того чтобы полировать точность до блеска (и получать скучные, предсказуемые ответы), Flint вбрасывает в процесс генерации случайные числа. Механизм похож на «шум» в диффузионных моделях, но только для текста. Случайность ломает шаблоны, и на выходе получается то, чего вы не ждали.
Ключевая идея Flint — разнообразие ответов важнее точности. Если вам нужен один «правильный» ответ — идите к классическим LLM. Если нужно сто разных идей для мозгового штурма — Flint ваш выбор.
Случайные числа и творческий хаос
Как именно Flint использует случайность? Каждый токен при генерации получает не просто вероятность, а дополнительный шумовой сигнал, который «расшатывает» распределение. В обычной LLM температура (temperature) уже делает что-то похожее, но Flint заходит дальше — он меняет не только крутизну распределения, но и его форму. Алгоритм динамически подмешивает случайные числа к весам внимания. Результат — даже при нулевой температуре ответы не повторяются.
Springboards показали тест с числами: модель просили назвать число от 1 до 100. Обычные LLM (GPT-4, Claude) выдают 42, 7, 50 — стандартные «любимые» числа. Flint же выдала 17, 83, 91, 4, 66 — настоящий разброс. И это не случайность, а системный эффект.
Почему groupthink убивает креативность LLM
Современные LLM страдают от «группового мышления» — они обучены на одних и тех же данных, с одинаковыми loss-функциями. Даже разные модели склонны давать похожие ответы на творческие запросы. Если вы попросите пять разных LLM придумать название для стартапа, вы получите вариации на тему «Nova», «Apex», «Quantum». Flint ломает этот паттерн. Вместо консенсуса — хаос. И именно хаос часто рождает лучшие идеи.
Проблема sycophancy (когда LLM подлизывается к пользователю) тоже отсюда — модель боится быть оригинальной. В статье о sycophancy мы уже обсуждали, как fine-tuning может усугубить конформность. Flint решает задачу с другой стороны: если модель не знает «правильного» ответа и её толкают в случайность, она вынуждена выдумывать.
Важный нюанс: Flint не годится для фактологических запросов. Спросите у неё столицу Франции — и она может ответить «Лион» или «Марсель» с вероятностью 30%. Это инструмент для креатива, а не для поиска истины.
В контексте других подходов
Springboards — не единственные, кто экспериментирует с галлюцинациями. В проекте T-FLEX CAD инженеры, наоборот, борются за стабильность C#-кода, используя специальные техники для подавления галлюцинаций. Два подхода — два полюса. Flint показывает, что галлюцинации могут быть ресурсом, а не только проблемой.
Что дальше
Flint пока в бета-версии, доступ к API открыт по заявкам. Springboards обещают, что модель адаптируется под задачу: можно регулировать уровень «креативного шума» от 0 (полностью детерминированный ответ) до 1 (чистый хаос). Если подход докажет себя, мы увидим новое поколение LLM, которые умеют переключаться между режимами «точность» и «креативность». И возможно, именно такие модели станут незаменимыми для дизайнеров, маркетологов и сценаристов.
А пока — один совет. Если ваша LLM слишком предсказуема, добавьте шума. Нет, правда, иногда стоит разрешить модели галлюцинировать. Вы удивитесь тому, что она способна придумать.