Советы по генерации изображений в Gemini, промпты и рабочий процесс пост-обработки

Ищете советы по генерации изображений в Gemini, которые выходят за рамки основ? Большинство руководств останавливаются на промптах. Но получение результатов профессионального уровня требует большего, чем просто набрать предложение и нажать Enter. Между расплывчатыми промптами, дающими банальный результат, настройками разрешения, которые работают не так, как ожидается, и сырыми файлами, требующими обработки перед публикацией, существует реальная пропасть между «AI-сгенерированным изображением» и «изображением, которое я могу реально использовать».

Это руководство охватывает полный процесс: написание промптов, дающих нужный результат, выбор правильного разрешения и соотношения сторон, а также шаги пост-обработки, превращающие сырой вывод Gemini в отполированные изображения, готовые для публикации в сети.

Что изменилось с Nano Banana 2

Google выпустил Nano Banana 2 (официально — Gemini 3.1 Flash Image) 26 февраля 2026 года. Он обеспечивает качество изображений, близкое к Pro, при скорости Flash, и бесплатен для всех пользователей. Это сочетание сделало Gemini наиболее доступным высококачественным AI-генератором изображений.

Вот с чем вы работаете в 2026 году:

  • Три модели: Gemini 3.1 Flash Image (скорость и объём), Gemini 3 Pro Image (профессиональное качество) и Gemini 2.5 Flash Image (эффективность). Flash подходит для большинства задач; Pro ориентирован на коммерческую и печатную работу.
  • Варианты разрешения: 512px, 1K (по умолчанию), 2K и 4K. Переход с 1K на 4K даёт в 16 раз больше пикселей, но стоит лишь в 2,25 раза дороже, что делает 4K удивительно экономичным.
  • 14 соотношений сторон в Flash, включая ультраширокое 8:1 и ультравысокое 1:8, а также 10 стандартных соотношений в других моделях.
  • До 14 референсных изображений на промпт (10 объектов + 5 персонажей в Pro) для сохранения стиля и внешнего вида.
  • SynthID на всём выводе: каждое изображение Gemini содержит невидимый водяной знак, встроенный в процессе генерации. Изображения из веб-интерфейса также получают видимый значок-искру.

Советы по генерации изображений в Gemini: как писать лучшие промпты

Gemini хорошо реагирует на структурированные, описательные промпты. Собственное руководство по промптам Google рекомендует строить промпты из пяти элементов:

  1. Стиль — художественный подход (фотореализм, акварель, плоская иллюстрация, 3D-рендер)
  2. Субъект — что изображено (человек, объект, сцена)
  3. Окружение — среда и фон (студия, улица, абстракция)
  4. Действие — что происходит (стоит, бежит, парит)
  5. Композиция — угол камеры и кадрирование (крупный план, широкий план, вид сверху)

Слабый промпт вроде «кот на столе» заставляет Gemini самостоятельно заполнять все детали. Структурированный промпт даёт вам контроль:

«Фотореалистичный крупный план полосатого кота, сидящего на захламлённом деревянном столе, мягкий оконный свет слева, малая глубина резкости, снято на объектив 85мм»

Используйте язык фотографии и оптики

Модели изображений Gemini понимают фотографическую терминологию. Согласно блогу Google Developers, указание фокусного расстояния объектива, схем освещения и типа плёнки даёт значительно более управляемые результаты, чем общие описания:

  • «Снято на объектив 35мм» — широкий контекст окружения
  • «Снято на объектив 85мм» — сжатие и боке в портретном стиле
  • «Снято на телеобъектив 200мм» — сжатая перспектива, изоляция объекта
  • «Плёнка Kodak Portra 400» — тёплые тона и мягкое зерно
  • «Студийный свет с контровым освещением» — профессиональный портретный вид

Рендеринг текста в изображениях

Gemini умеет рендерить текст прямо в изображениях — возможность, с которой большинство конкурентов до сих пор испытывают трудности. Ключ: оберните нужный текст в кавычки внутри промпта.

«Неоновая вывеска с надписью “OPEN LATE” розовым курсивом на тёмном кирпичном фоне»

Для длинных надписей делайте их короче и уточняйте типографику: стиль шрифта, размер относительно изображения и расположение.

Избегайте распространённых ошибок

На основе закономерностей из обсуждений сообщества и документации Google:

  • Перегрузка промпта: слишком много субъектов или деталей в одном промпте заставляет Gemini игнорировать часть из них. Если вашему изображению нужно более 3-4 ключевых элементов, разбейте задачу на базовую генерацию плюс редактирование через inpainting.
  • Расплывчатые стилевые термины: «красивый» и «высокое качество» ничего не добавляют. Используйте конкретные референсы: «в стиле Studio Ghibli» или «гиперреалистичный 3D-рендер».
  • Забытое негативное пространство: описывайте, чего вы не хотите, когда модель продолжает добавлять нежелательные элементы. «Чистый белый фон, никаких других объектов» надёжнее, чем надежда на простоту.

Шаблоны промптов для распространённых случаев

Ниже приведены базовые шаблоны, которые вы можете адаптировать. Каждый следует пятиэлементной структуре и нацелен на конкретный результат. Воспринимайте их как каркас — заменяйте субъект и стилевые детали своими, сохраняя структуру.

Шапки для блогов и статей

«Плоская иллюстрация в приглушённых землистых тонах, экран ноутбука с кодом в окружении парящих геометрических фигур, чистый белый фон, центрированная композиция, соотношение сторон 16:9»

Почему это работает: стиль («плоская иллюстрация»), цветовая палитра («приглушённые землистые тона») и композиция («центрированная, 16:9») — всё явно указано. Gemini не нужно угадывать. Для шапок блогов с текстом добавьте конкретный заголовок с помощью техники кавычек: текст "ВАШ ЗАГОЛОВОК" жирным шрифтом без засечек сверху.

Графика для социальных сетей

«Жирная минималистичная графика, текст “SALE ENDS FRIDAY” крупным белым шрифтом без засечек на градиентном фоне от тёмно-фиолетового к коралловому, квадратный формат Instagram, соотношение сторон 1:1»

После генерации используйте Image Resizer для подгонки под точные размеры платформы — Instagram (1080x1080), LinkedIn (1200x627) или X/Twitter (1600x900).

Для размеров под конкретные платформы генерируйте в 1:1 или 16:9, а затем меняйте размер, вместо того чтобы задавать точные размеры в пикселях в промпте. Поддержка соотношений сторон в Gemini приблизительна — точность на уровне пикселей обеспечивается пост-обработкой.

Мокапы продуктов

«Фотореалистичный снимок продукта: белая керамическая кофейная кружка с минималистичным логотипом на мраморной столешнице, мягкий рассеянный естественный свет, снято на объектив 50мм, малая глубина резкости, соотношение сторон 4:3»

Снимки продуктов больше всего выигрывают от фотографического языка. Указание фокусного расстояния и диафрагмы («объектив 50мм, малая глубина резкости») обеспечивает стабильные, профессионально выглядящие результаты, которые иначе потребовали бы описания точного боке и перспективы.

Портреты и фото профиля

«Профессиональный портрет [описание], студийное освещение с мягким основным светом и незначительной подсветкой, нейтральный серый фон, снято на объектив 85мм f/1.4, кадрирование по пояс»

Для сохранения внешности персонажа в нескольких изображениях включайте одинаковое физическое описание в каждый промпт. Документация Google рекомендует использовать референсные изображения — загружайте предыдущую генерацию в качестве референса, чтобы сохранять одно и то же лицо и черты на протяжении серии.

Абстрактные и художественные композиции

«Абстрактное цифровое искусство, текучие формы жидкого металла в переливающихся синих и золотых тонах, тёмный фон, драматическое объёмное освещение, ультрадетальная макроперспектива, соотношение сторон 3:4»

Абстрактные работы — область, где Gemini превосходит конкурентов. Поскольку здесь нет «правильной» анатомии или физики, которую можно исказить, модель может сосредоточиться исключительно на эстетике. Экспериментируйте с необычными сочетаниями стилей: «акварель встречается со схемой» или «ар-деко встречается с биолюминесценцией».

Итеративная доработка: от хорошего к отличному

Первая генерация редко бывает финальной. Собственная документация по лучшим практикам Google рекомендует многоэтапный подход к редактированию:

  1. Сгенерируйте основу — добейтесь правильной общей композиции и субъекта
  2. Уточняйте последующими промптами — «Сделай освещение теплее» или «Сдвинь субъект немного влево»
  3. Используйте inpainting для точечных правок — выделите конкретную область и опишите, что должно измениться
  4. Добавляйте детали последними — мелкие элементы вроде текстовых наложений, тонких текстур или фоновых объектов

Этот итеративный рабочий процесс даёт лучшие результаты, чем попытка указать всё в одном промпте. Каждый ход сохраняет контекст из предыдущих генераций, так что Gemini понимает, к чему вы стремитесь.

Руководство по разрешению и соотношению сторон

Именно здесь многие пользователи впустую тратят время и кредиты. Большинство руководств упускают одну важную деталь:

Написание «4K» или «HD» в промпте НЕ изменяет выходное разрешение. Текст промпта не влияет на размеры в пикселях. Необходимо задавать параметр image_size отдельно в API или выбирать разрешение в настройках интерфейса. Это подтверждается документацией Google и застаёт врасплох практически всех.

Двухэтапный рабочий процесс

Опытные пользователи рекомендуют подход, позволяющий снизить затраты на 40-60%:

  1. Итерируйте при разрешении 1K — дорабатывайте промпт, композицию и стиль при стандартном разрешении, где каждая генерация дёшева и быстра
  2. Создавайте финальную версию в 4K — когда вы довольны результатом, перегенерируйте при максимальном разрешении для продакшн-версии

Это позволяет не тратить кредиты 4K на экспериментальные промпты, которые вы всё равно удалите.

Выбор правильного соотношения сторон

Подбирайте соотношение сторон под конечное применение до генерации, а не после:

ПрименениеСоотношение сторонПочему
Пост в Instagram1:1Нативный квадратный формат
Stories/Reels в Instagram9:16Вертикальный полноэкранный
Шапка блога16:9Стандартный широкоэкранный
Пин в Pinterest2:3Оптимальные размеры пина
Пост в LinkedIn1.91:1Рекомендовано LinkedIn
Плакат для печати2:3 или 3:4Стандартные форматы печати

Генерация в правильном соотношении позволяет избежать артефактов обрезки. Если нужное соотношение не поддерживается, выберите ближайшее и используйте Image Resizer для финальной точной настройки по пикселям.

Процесс пост-обработки

Это та часть, о которой никто не рассказывает. Сырой вывод Gemini редко готов к публикации. Вот рабочий процесс, превращающий сгенерированное изображение в готовый к продакшну актив:

Шаг 1: Удалите видимый водяной знак

Каждое изображение, сгенерированное через веб-интерфейс Gemini или AI Studio, содержит полупрозрачный значок-искру в правом нижнем углу (48x48 или 96x96 пикселей в зависимости от разрешения). Изображения, сгенерированные через API, этого значка не содержат.

Если вы используете веб-интерфейс, этот водяной знак необходимо убрать, прежде чем изображение можно будет использовать в профессиональном контексте.

Попробуйте сами: Gemini Watermark Remover — загрузите изображение и получите чистую версию за секунды с помощью обратного альфа-смешения. Без потери качества, без регистрации.

Шаг 2: Конвертируйте в нужный формат

Gemini выдаёт файлы PNG — без потерь, но большого размера. Одна генерация в 4K легко может превысить 10 МБ. Для использования в вебе это недопустимо.

  • WebP для сайтов и веб-приложений — на 25-35% меньше эквивалентного JPEG при том же визуальном качестве
  • JPEG для email, документов и платформ, не поддерживающих WebP
  • PNG только когда нужна прозрачность или качество без потерь (печать, дизайн-активы)

Конвертируйте изображения с помощью Image Format Converter — он поддерживает конвертацию из PNG в WebP, JPEG и обратно.

Шаг 3: Сожмите под свою цель

Даже после конвертации формата изображения часто требуют дополнительного сжатия для быстрой загрузки страниц. Руководство Google по оптимизации LCP подчёркивает необходимость сжатия главных изображений и использования современных форматов, чтобы удержать Largest Contentful Paint в пределах 2,5 секунд.

Оптимальное значение для большинства веб-изображений: 80-85% качества в JPEG/WebP. Ниже 75% артефакты сжатия становятся заметны. Выше 90% экономия на размере файла незначительна.

Image Compressor позволяет задать точный уровень качества и предварительно просмотреть результат перед скачиванием.

Шаг 4: Удалите метаданные перед публикацией

Изображения Gemini содержат метаданные, которые вы, возможно, не захотите публиковать. С ноября 2025 года изображения Nano Banana Pro включают учётные данные содержимого C2PA — криптографические данные о происхождении, которые раскрывают факт AI-генерации изображения, использованную модель и историю редактирования.

Все изображения Gemini также содержат стандартные данные EXIF. Если вы редактировали изображение в каком-либо приложении, оно могло получить дополнительные метаданные, включая версии программного обеспечения, данные GPS с вашего устройства или метки времени.

Удалите всё это с помощью EXIF Data Remover перед публикацией или распространением.

Почему этот процесс важен

Рассмотрим цифры на примере типичного изображения Gemini в 4K:

ЭтапФорматПриблизительный размер
Сырой выводPNG8–12 МБ
После удаления водяного знакаPNG8–12 МБ
После конвертации в WebPWebP2–4 МБ
После сжатия (85% качества)WebP400–800 КБ
После удаления метаданныхWebP350–750 КБ

Это снижение размера файла на 90-95% без видимой потери качества. Для записи в блоге с тремя AI-сгенерированными изображениями разница — между страницей, загружающейся за 1,5 секунды, и страницей, которая грузится 8+ секунд.

Полный рабочий процесс вкратце

Генерация (Gemini) → Удаление водяного знака → Конвертация формата → Сжатие → Удаление метаданных → Публикация

Каждый шаг бесплатен и занимает секунды с браузерными инструментами. Никакого десктопного ПО, никаких аккаунтов, никаких подписок.

Устранение распространённых проблем

Размытый или низкокачественный вывод

Это самая распространённая жалоба в сообществах Gemini. Обычные причины:

  • Вы смотрите на превью, а не на полное изображение. В веб-приложении Gemini нажмите «Скачать в полном размере» — встроенный предварительный просмотр сжат.
  • Ваше устройство масштабирует изображение. Некоторые мобильные устройства и браузеры автоматически сжимают скачиваемые изображения. Проверьте настройки сохранения изображений на вашем устройстве.
  • Вы используете разрешение по умолчанию. 1K подходит для миниатюр, но выглядит размыто при большом отображении. Перегенерируйте в 2K или 4K для продакшн-использования.

Gemini игнорирует часть промпта

Длинные, сложные промпты страдают от того, что сообщество называет «хрупкостью промпта». Gemini может опускать или переосмыслять элементы, когда промпт превышает его эффективный предел внимания.

Решение: разбивайте работу на этапы. Сначала сгенерируйте базовую сцену, затем используйте функции inpainting и редактирования Gemini для итеративного добавления деталей. Официальное руководство Google рекомендует этот многоходовой подход для сложных композиций.

Блокировка фильтрами безопасности

Фильтры безопасности Gemini полностью блокируют некоторые промпты (ошибка IMAGE_SAFETY). Отключить эти фильтры невозможно. Если вас блокируют:

  • Перефразируйте промпт с менее неоднозначными формулировками
  • Удалите термины, которые могут быть восприняты как насилие, откровенный контент или упоминания реальных людей
  • Для продуктовых или медицинских изображений попробуйте описать контекст: «медицинская иллюстрация для образовательных материалов» помогает модели понять намерение

Ограничения скорости и ошибки 503

В часы пик (9:00–17:00 по тихоокеанскому времени) ошибки 503 становятся значительно чаще. Сообщения сообщества с конца 2025 по начало 2026 года указывают, что процент неудачных запросов к модели Pro в периоды высокого трафика может достигать 30-45%. Пользователи бесплатного уровня сталкиваются с особенно жёсткими ограничениями.

Стратегии: генерируйте в нерабочее время, используйте Batch API для несрочных задач (скидка 50% при 24-часовом выполнении) или перейдите на уровень Tier 2 (расходы от $250) для 2000 RPM на Flash.

Часто задаваемые вопросы

Действительно ли написание «4K» в промпте Gemini даёт изображение в 4K?

Нет. Текст промпта не влияет на выходное разрешение. Необходимо задавать параметр image_size в API или выбирать разрешение в настройках интерфейса. Это распространённое заблуждение — слово «4K» в промпте может влиять на стиль (более чёткий, более детальный), но не изменит фактические размеры в пикселях.

Почему на моих изображениях Gemini есть значок-искра?

Google добавляет видимый значок-искру (водяной знак Nano Banana) к изображениям, сгенерированным через веб-интерфейс и AI Studio. Изображения, сгенерированные через API, этого видимого водяного знака не имеют. Все изображения Gemini — независимо от способа генерации — содержат невидимый водяной знак SynthID, который нельзя удалить.

Можно ли использовать изображения, сгенерированные Gemini, в коммерческих целях?

Да, при условии соблюдения условий использования Google. Сгенерированные изображения принадлежат вам. Однако учтите, что европейские регуляции, вступающие в силу в августе 2026 года, могут потребовать раскрытия факта AI-генерации контента в определённых контекстах.

Как сохранить одинаковый внешний вид персонажа в нескольких изображениях?

Загрузите предыдущую генерацию в качестве референсного изображения. Gemini поддерживает до 14 референсных изображений на промпт (10 объектов + 5 персонажей в Pro). Включайте одинаковое физическое описание в каждый промпт и используйте технику «мысленной подписи» из руководства по многоходовому редактированию Google для сохранения контекста между ходами.

В чём разница между видимым водяным знаком и SynthID?

Видимый значок-искра — это наложение поверх изображения, которое можно удалить (это просто пиксели поверх вашего изображения). SynthID принципиально иной — он встраивается непосредственно в процессе генерации пикселей с помощью метода Tournament Sampling. Он выживает при масштабировании, обрезке, изменении цвета и сжатии. Ни один инструмент не может надёжно удалить SynthID без ухудшения качества изображения.

От сгенерированного к готовому для продакшна

Разница между случайным пользователем Gemini и тем, кто создаёт профессиональный результат, — не в модели, а в рабочем процессе. Хорошие промпты дают вам 70% результата. Процесс пост-обработки обеспечивает остальное: удаление водяных знаков, конвертация в эффективные форматы, сжатие для быстрой загрузки и удаление метаданных для конфиденциальности.

Каждый шаг этого рабочего процесса можно выполнить бесплатно с помощью браузерных инструментов. Начните с Gemini Watermark Remover, чтобы очистить последнюю генерацию, затем пройдите через весь процесс. Весь цикл занимает менее минуты на изображение.