Как создавать Ghibli style изображения GPT-4o через GPTunneL?

Ghibli‑style изображения в GPT‑4o через GPTunneL — пошаговое руководство

Нейросети, способные превращать текст в изображения, открывают новые возможности для творчества и работы. Одной из таких продвинутых моделей стала GPT-4o от OpenAI, которую недавно обновили. Теперь модель способна создавать изображения высочайшего качества, включая грамотный текст, людей, пейзажи и многое другое. 

В этой статье мы расскажем, как использовать эту функцию, и поделимся практическими советами для получения наилучшего результата в GPTunneL.

Что такое генерация изображений в GPT-4o?

GPT-4o — это мультимодальная модель, которая может обрабатывать и создавать не только текст, но и изображения. По сути, при запросе на создание картинки GPT-4o задействует встроенные функции. Это позволяет генерировать уникальные изображения по вашим текстовым описаниям.

Генерация изображений может быть полезна для самых разных задач:

  • Создание иллюстраций для статей, постов в блогах или социальных сетях. 
  • Разработка концептов для дизайна, слайдов для презентаций или творческих проектов. 
  • Редактирование или изменение уже готовых изображений.
  • Визуализация идей, которые сложно описать словами.
  • Получение изображений с точным отображением текста, например, для инфографики или макетов. 

На платформе GPTunneL модель GPT-4o предлагает несколько уровней качества генерации: Low, Medium и High. Они различаются не только ценой, но и другими важными параметрами.

  • Low (Низкое): Самый быстрый и дешевый вариант. Подходит для быстрых черновиков, концептов или изображений, где не нужна высокая детализация. Качество изображения ниже, может быть меньше внимания к мелким деталям и согласованности. 
  • Medium (Среднее): Оптимальный баланс между скоростью, стоимостью и качеством. Обеспечивает лучшую детализацию и согласованность по сравнению с Low, но быстрее и дешевле, чем High. Рекомендуется для большинства задач. Позволяет использовать прозрачный фон.
  • High (Высокое): Максимальное качество генерации. Изображения будут наиболее детализированными, с лучшей согласованностью и вниманием к мелочам. Генерация занимает больше времени и стоит дороже, так как используется значительно больше токенов. Лучше всего подходит для финальных изображений, требующих высокой четкости и точности. Позволяет использовать прозрачный фон. 

Как запустить генерацию изображения (в том числе Ghibli Style!)

Процесс создания изображения с помощью GPT-4o достаточно интуитивен. Вам нужно найти эту модель в Креатив.Лаб – нашей лаборатории по работе с нейросетями для генерации  изображений и видео. Затем,  просто введите текстовое описание желаемого изображения в поле ввода запроса, как вы это делаете при обычной текстовой беседе. Модель автоматически распознает намерение создать визуальный контент и предложит сгенерировать картинку.

Интерфейс Креатив.Лаб в GPTunneL

В общем виде процесс выглядит так:

  • Выберите одну из трех версий модели GPT-4o Image Generation в Креатив.Лаб: High, Medium и Low.
  • Введите подробное текстовое описание изображения, которое вы хотите получить.
  • Отправьте запрос.
  • Модель сгенерирует изображение на основе вашего описания.

Как писать эффективные текстовые промпты

Качество и точность сгенерированного изображения напрямую зависят от того, насколько хорошо составлен ваш промпт. GPT-4o лучше следует инструкциям, чем предыдущие модели, и может обрабатывать до 10-20 различных объектов в запросе. 

Вот несколько ключевых советов по составлению хороших промптов, протестированных в GPT-4o Image Generation (High):

Будьте максимально конкретны

  • Чем точнее вы опишете свой замысел, тем лучше модель его поймет. Указывайте не только основные объекты, но и их детали, окружение, фон. 
  • Совет: Вместо «кошка сидит на окне» попробуйте «Пушистый рыжий кот сидит на деревянном подоконнике старого дома, выглядывая в окно в дождливый день в стиле студии Гибли».
Промпт: ghibli Пушистый рыжий кот сидит на деревянном подоконнике старого дома, выглядывая в окно в дождливый день  --size 1536x1024. Опубликовано в галерее GPTunneL.

Описывайте стиль и атмосферу. 

  • Укажите, в каком стиле должно быть изображение (фотореализм, иллюстрация, акварель, цифровая живопись и т.д. , какое настроение оно должно передавать (спокойное, драматичное, веселое). 
  • Совет: Добавьте фразы вроде в «стиле импрессионизма», «яркое и солнечное», «таинственная ночная сцена».

Уточняйте композицию и ракурс

  • Подумайте о том, как объекты расположены в кадре. Укажите, если нужен крупный план, общий вид, определенная перспектива.
  • Совет: Используйте слова «крупный план лица», «вид сверху», «широкий кадр».
Промпт: Крупный план чашки кофе на деревянном столе: пар поднимается вверх, рядом лежит открытая книга. На чашке должна быть надпись красивым, но хорошо читаемым шрифтом: 'Чашка кофе копирайтера GPTunneL'. Добавь мелкие детали — тени от кружки, лёгкие трещинки на обложке книги и несколько кофейных зёрен на столе.  --size 1536x1024. Опубликовано в галерее GPTunneL.

Работайте с цветом и освещением 

  • Опишите цветовую палитру, которая вам нужна, и тип освещения. Это сильно влияет на финальное изображение. 
  • Совет: «Теплый закатный свет», «холодные синие тона», «контрастное освещение».
Промпт: Деревенский дом на фоне поля при тёплом закатном свете: длинные тени от деревьев, мягкое золотистое свечение на стенах, небо окрашено в оранжево-розовые оттенки. Добавь мелкие детали — дымок из трубы, старую лавочку под окном и несколько птиц, летящих на закате.  --size 1536x1024. Опубликовано в галерее GPTunneL.

Добавляйте действия

  • Если объекты должны совершать какие-то действия, четко опишите их. 
  • Совет: «Человек бежит под дождем», «птица взлетает с ветки».
Промпт: Городская улица в дождливый вечер: человек в лёгком пальто бежит под проливным дождём, капли воды блестят на мостовой. Добавь мелкие детали — зонтик, вывернутый порывом ветра, и отражения неоновых вывесок в мокром асфальте.   --size 1536x1024. Опубликовано в галерее GPTunneL.

Для изображений с текстом будьте точны

  • GPT-4o хорошо справляется с добавлением текста, но важно четко указать сам текст, его желаемое расположение и, если возможно, стиль.
  • Совет: «Нарисуй вывеску с надписью «Кафе 'Уют», расположенную над дверью. Шрифт винтажный, вывеска светится теплым светом.»
Промпт: Изобрази вход в светлое и оживлённое городское кафе. Над дверью — яркая, аккуратная вывеска с надписью 'Кафе "Уют"', выполненная чистым рукописным шрифтом с лёгким изгибом. Цвет вывески — мягкий бежевый фон и тёплые коричневые буквы. Под основной вывеской добавь небольшую табличку со слоганом: 'Тепло в каждой чашке'. Табличка выполнена в том же стиле — лёгкий рукописный шрифт, светлая подсветка. Фасад здания светлый, оштукатуренный, с большими окнами и свежими цветами в горшках у входа. На улице приятная солнечная погода, мягкий дневной свет. Атмосфера лёгкая, гостеприимная и тёплая. --size 1536x1024. Опубликовано в галерее GPTunneL.

Использование изображений в качестве вложений 

В отличие от других генераторов изображений, GPT-4o поддерживает нативную модификацию изображений. Вы можете загружать изображения и использовать их как отправную точку или референс для создания совершенно новых изображений. Давайте посмотрим, как это работает на практике в GPTunneL.

  • Первым делом, вам нужно загрузить ваше изображение прямо в Креатив.Лаб. Система поддерживает различные популярные форматы, такие как PNG, JPEG и WEBP.
  • Затем вы просто вводите текстовый запрос, который описывает то, что именно вы хотите изменить или создать на основе загруженного изображения.

И вот результат: вы получаете новое изображение, где модификации были внесены только в те аспекты, которые вы указали в запросе. Это уникальная возможность GPT-4o, ведь далеко не каждый генератор изображений умеет так тонко и избирательно работать с референсными картинками.

Что стоит учитывать при генерации

Несмотря на продвинутые возможности, у генерации изображений есть свои особенности и ограничения:

  • Сложность запросов. Хотя модель и обрабатывает больше объектов, слишком длинные и запутанные промпты могут привести к неожиданным результатам или "галлюцинациям". 
  • Точность деталей. Иногда модель может неточно воспроизвести мелкие детали или определенные аспекты запроса. 
  • Мультиязычный текст. Могут возникать небольшие сложности с нелатинскими символами или сложными шрифтами.
  • Редактирование. Изменение отдельных частей изображения или лиц может быть не всегда последовательным, особенно если промпт не четко описывает то, что вам нужно.
  • Ограничения контента. У генератора изображений GPT-4o и на самой платформе GPTunneL существуют правила использования, запрещающие создание изображений определенного содержания (например, откровенно спорного, нарушающего авторские права или содержащего реальных людей без разрешения). 

Заключение

Генерация изображений в GPT-4o — мощный и удобный инструмент, который интегрирован прямо в диалоговую модель. Используя подробные и четкие текстовые описания, а также применяя итеративный подход, вы сможете воплощать свои идеи в визуальную форму. Экспериментируйте с промптами, изучайте возможности модели, и вы увидите, как легко можно создавать уникальные изображения для любых ваших задач. Попробуйте сами на платформе GPTunneL!

Попробовать в GPTunneL