Пластмассовый мир: почему AI-арт до сих пор выглядит как дешёвый пластик
Сколько раз вы смотрели на сгенерированное изображение и чувствовали: что-то не так. Оно слишком гладкое. Тени — просто градиент, кожа — силикон, металл — покрашенный пластик. Стандартные промпты вроде "реалистичное фото" приводят к одному и тому же: нейросеть схватывает общий контур, но напрочь игнорирует физику материалов. В 2026 году это уже непростительно. Особенно когда у нас есть Nano Banana 2 на базе Gemini 3 Flash Image — модель, которая умеет работать с токенами внимания на уровне инженерного моделирования. Но умение модели — это одно. Ключ в том, как вы пишете промпт.
Забудьте про "красивое фото яблока". Хотите фотореализм? Придётся научиться говорить с нейросетью на языке физики. Вот тут и вступает формула, которую я называю CAD+Physics.
CAD+Physics: как заставить нейросеть думать как инженер-оптик
Идея простая: вместо абстрактных прилагательных вы даёте модели конкретные параметры материалов, освещения и камеры. CAD (Cross-Attention Diffusion) в Nano Banana 2 позволяет тонко управлять тем, на какие токены обращать внимание. Physics — это набор ключевых слов, описывающих реальные физические свойства: subsurface scattering (подповерхностное рассеивание для кожи, воска, листьев), IOR (коэффициент преломления для стекла/воды), roughness, anisotropic для металлов.
Why it works: В Gemini 3 Flash Image архитектура Cross-Attention позволяет выделять до 256 независимых токенов внимания на патч. Когда вы пишете "subsurface scattering 0.8", модель резервирует токены для обработки световых переходов внутри объекта. Без этого — плоское закрашивание.
Весь секрет в том, чтобы совместить CAD-структуру (ключевые слова с весами) и физические параметры. Я вывел такую общую формулу:
[объект], [материал с параметрами], [освещение], [камера], [стиль -> physics]
Звучит абстрактно. Давайте разберём на конкретном примере.
1 Объект и материал с subsurface scattering
Допустим, вы хотите реалистичное яблоко. Ошибка — писать "красное яблоко, реалистично". Правильный промпт:
a red apple with waxy skin, subsurface scattering 0.9, diffuse transmission, sharp specular highlights, shallow depth of field, 85mm lens, f/2.8, volumetric lighting, soft studio light, 8k, ultra-detailed, physics-based rendering
Здесь subsurface scattering 0.9 — не магическое заклинание, а прямой сигнал модели: "обработай свет внутри объекта". Nano Banana 2 интерпретирует это как активацию специальных патчей в Cross-Attention, отвечающих за подповерхностное рассеивание. Без такого промпта яблоко будет выглядеть как из компьютерной игры 2010 года.
sss falloff 0.05 0.3 0.1 (RGB-коэффициенты рассеивания) в промпт, и текстура кожи станет живой.2 CAD-структура с весами токенов
Nano Banana 2 поддерживает весовые коэффициенты для токенов через скобки и числа. Например, (subsurface scattering:1.2) усиливает влияние термина, (plastic:0.3) ослабляет. Это чистая работа Cross-Attention.
a glass of water with ice cubes, (subsurface scattering:0.5), (caustics:1.5), (IOR 1.33:1.0), (roughness 0.05:1.0), backlight with visible refractions, anamorphic lens flare, (lens dirt:0.2)
Обратите внимание: я добавил caustics (каустики) с весом 1.5 — это заставляет модель тратить больше токенов на расчёт световых пятен. Без этого вода будет прозрачная, но плоская. С каустиками — физически корректная оптика.
Кстати, если вы хотите сравнить, как Nano Banana 2 справляется с фотореализмом по сравнению с другими моделями, рекомендуем прочитать наш тест GPT Image 1.5 против Nano Banana: кто переваривает фото лучше? — там детально разобрано, почему физический подход даёт фору.
Три главные ошибки (и как их не допустить)
Ошибка 1: игнорирование subsurface scattering
Самое частое. Люди пишут "реалистичный персик" и получают пластиковый шар. Если объект органический (фрукты, кожа, листва, мрамор), всегда добавляйте subsurface scattering. Коэффициент 0.7-0.9 для тонких объектов, 0.3-0.5 для толстых.
Ошибка 2: отсутствие оптических параметров
Стекло, вода, линзы требуют IOR (Index of Refraction). Для воды 1.33, для стекла 1.5-1.6, для алмаза 2.4. Пишите прямо в промпт: IOR 1.5. Без него модель не знает, как искривлять свет.
Без IOR: "a crystal vase with flowers" -> глянцевый цилиндр.
С IOR: "a crystal vase with flowers, (IOR 1.54:1.2), (abbe number 50:0.8), chromatic aberration" -> дисперсия света, радужные блики.
Ошибка 3: игнорирование Cross-Attention токенов
Если перегрузить промпт тридцатью терминами, модель начнёт усреднять внимание, и результат станет мыльным. Лимитируйте количество ключевых параметров до 5-7. Используйте веса для приоритезации. И помните: первые 10 токенов промпта получают максимальное внимание — ставьте самое важное в начало.
Для тех, кто хочет углубиться в технику управления токенами, советую статью Nano Banana против Gemini 2.5 Flash: битва за согласованность персонажей и 20 способов это использовать — там отлично показано, как разные модели обрабатывают сложные промпты.
Как НЕ надо делать: антипример
Вот классический плохой промпт, который многие используют:
"красивый закат на пляже, реалистичное фото, волны, песок, пальмы"
Результат: открытка из 2015 года. Песок — однородная текстура, волны — мыльная вода, небо — градиент. Почему? Потому что нет физики: ни subsurface scattering для песка (каждая песчинка рассеивает свет), ни анизотропии для воды, ни собственно каустик.
Правильный промпт с формулой CAD+Physics:
a tropical beach at golden hour, (sand subsurface scattering:0.6), (anisotropic water:1.3), (caustics:1.5), (volumetric haze:0.8), 24mm lens, f/11, hyperfocal distance, 8k raw, color graded, photorealistic nature
Разница колоссальная. Nano Banana 2 с Gemini 3 Flash Image буквально "видит" каждое слово как отдельную инструкцию для Cross-Attention. Вес 1.3 на anisotropic water выделяет дополнительные токены на расчёт световых полос на воде.
Практический шаблон: универсальная структура промпта
Чтобы не изобретать велосипед, используйте эту карту:
| Компонент | Что писать | Пример |
|---|---|---|
| Объект | Конкретное существительное с деталями | a single ripe strawberry on a marble countertop |
| Физика материала | subsurface scattering, roughness, IOR, anisotropic | (subsurface scattering:0.9), (roughness 0.1), (anisotropic:0.2) |
| Освещение | Тип света, каустики, объёмность | soft window light, (caustics:1.4), volumetric rays |
| Камера | Фокусное расстояние, диафрагма, эффекты | 100mm macro, f/2.8, shallow depth of field, chromatic aberration |
| Стиль/качество | 8k, photorealistic, physics-based rendering | 8k ultra detailed, photoreal, physically based rendering |
Я использую этот шаблон во всех своих проектах. Особенно круто он показывает себя в дизайне интерьера — мы подробно разбирали это в статье Nano Banana Pro: дизайн интерьера за 5 минут вместо 5 дней.
CAD+Physics в действии: реальный кейс
Недавно я генерировал изображения для клиента — ювелирные украшения на чёрном фоне. Обычные промпты выдавали блики, как будто кольцо освещено одной лампочкой. С формулой CAD+Physics я получил кадры, которые клиент принял за фотосъёмку в студии.
a women's gold ring with a diamond, (metal IOR 0.18:1.0), (diamond IOR 2.42:1.5), (subsurface scattering:0.2), (caustics:1.8), (anisotropic reflections:1.4), (beauty dish key light:1.0), (black card negative fill:0.5), 85mm, f/11, focus stacked
Обратите внимание: IOR для металла — 0.18 (комплексный показатель, но модель понимает). Для алмаза 2.42. Результат: алмаз играет радугой, металл — с чёткими отражениями. Никакой пластики.
Важно: Не каждое слово с весами сработает одинаково хорошо. Если модель не обучена на конкретном термине (например, "IOR 0.18"), она может его проигнорировать. Лучше сочетать — (metallic reflections:1.0), (IOR 0.18:0.5). Эмпирика: на Nano Banana 2 термин "IOR" распознаётся отлично, а вот "anisotropic" требует вес от 1.2.
Финальный совет: не бойтесь экспериментировать с токенами
Самый большой секрет, который я вынес за месяцы работы с Nano Banana 2: модель любит точность. Вместо "немного бликует" напишите "specular highlight intensity 0.6", вместо "лёгкий туман" — "volumetric scattering density 0.3". Gemini 3 Flash Image обучена на огромном количестве технических текстов, поэтому она понимает язык физики лучше, чем язык поэзии.
Если вы хотите увидеть, как Nano Banana 2 ведёт себя в сравнении с другими новинками, загляните в статью Flux.2 против Midjourney и Nano Banana Pro: тесты, промпты и где генерировать изображения дешевле. Спойлер: Nano Banana 2 часто выигрывает за счёт физичности.
И последнее: не забывайте про режимы Cross-Attention. Nano Banana 2 позволяет выбирать уровень внимания — от "low" (быстрая генерация) до "ultra" (максимум деталей). Для фотореализма всегда ставьте "ultra". Да, время генерации растёт (до 10 секунд на одно изображение), но результат того стоит.
Ну и если хотите попробовать Nano Banana 2 прямо сейчас — рекомендую платформу Antigravity AI, где модель доступна с интеграцией в Figma и API. Я сам там гоняю промпты для клиентов.