Как заставить нейросети генерировать нормальные картинки
Пост публикуется по просьбам трудящихся.
Видит Бог, я не хотела так много писать про искусственный интеллект. Однако то меня попросят выступить на эту тему на радио Sputnik, то подписчики пожалуются, цитата: «Яндексовский Шедеврум вообще залипательная штука. Правда картинки иногда выдаёт странные, будто и не по-русски запрос был».
На что я, на свою беду, уточнила:
«Рассказать, как быстро делать норм подсказки для генерации картинок с помощью нейросетей? Если интересно, залайкайте».
Ну вы и залайкали. Так что приступим.
Не претендуя на истину в последней инстанции и предвидя вопли подписчиков «Ну это же очевидно!», я расскажу про свой способ генерации рекламных баннеров и не только, а также дам полезный совет маркетологам в конце.
Погнали!
1) Нахожу картинку, которая мне плюс-минус нравится, и которую я беру за основу. Например, вот:
2) Далее иду в чат-бот и прошу его описать эту картинку следующей формулой:
"Действуй, как дизайнер рекламных баннеров. Проанализируй это изображение и сделай подробное описание всех элементов, стилей, слоев, атмосферы и настроения"
3) Чат-бот выдает мне то или иное решение, например:
Я рекомендую попробовать разные чат-боты для описания понравившегося вам изображения.
4) После этого мы идем в сервис генерации изображения и вставляем туда ту подсказку (ее еще называют "промпт"), которую нам выдал чат-бот. В начале сообщения пишем "Создай изображение".
Например, вот:
По итогу получаем довольно сносный результат!
5) Для наилучших результатов я рекомендую попробовать разные сочетания чат-ботов и генерации изображений. Интересно, что "Шедеврум" от Яндекса в принципе отказалась изображать российского военного:
Сберовские нейросети пыжились и даже родили что-то сносное:
Это скриншот генерации в Telegram-боте сберовской нейросети Kandinsky
А это пример генерации в сберовской нейросети Fusion Brain. Впрочем, позднее она тоже сломалась и отказалась генерировать изображения:
Вражеский Chat GPT оказался куда более сговорчивым на военно-патриотическую тематику и выдал несколько сносных вариантов, например, вот:
Самый лучший результат, как мне показалось, выдало следующее сочетание: промпт от hailuo.ai и генерация изображения от Kandinsky/Chat GPT.
Однако я рекомендую вам попробовать разные варианты!
6) Если вы маркетолог, то вы можете это использовать в своей работе для создания рекламных баннеров. Например, смотрите аналоги/конкурентов среди РСЯ (рекламная сеть Яндекса, баннеры, которые распространяет Яндекс), здесь.
Выбираете ту, которая больше всего подходит вашей тематике, следуете указанному ранее алгоритму, и генерируете изображение. Например, для этой картинки: