Нейрокомикс: непобедимая пятерка iConText Group

На создание комикса у команды iConText Group ушла неделя. Решили выбрать классическую нуарную стилистику, для которой характерны мрачная атмосфера и контрастные сочетания цветов. За основу взяли пятерку непобедимых героев — ассоциация с пятью диджитал-агентствами, входящими в iConText Group. Поэтому работу над созданием комикса начали именно с поиска персонажей, которые бы олицетворяли компании внутри группы. C помощью нейросетей разработали сценарий и приступили к генерации картинок. Оказалось, всё намного сложнее, чем на первый взгляд. Но результат того стоил.

Нейрокомикс: непобедимая пятерка iConText Group
© Sostav.ru

Непобедимая пятерка iConText Group

Агентства группы стали персонажами комиксаПервым делом авторы описали персонажей, олицетворяющих агентства iConText Group , и с учетом этого попросили ChatGPT создать сюжет для комикса, а именно — рассказать, как герои встретились и почему решили объединиться.

Каких героев взяли за основу

Главными героями выступали животные с характерными чертами, у каждого была своя профессия, которая соотносилась с деятельностью компании.

icontext — леопард-фокусник. Создает магию для клиентов, используя различные инструменты диджитал-маркетинга для достижения их целей: проводит аналитику, разрабатывает performance-стратегии и управляет рекламой.Zen Mobile Agency — японский кот-ниндзя. Знает все о мобильной рекламе и продвижении мобильных продуктов и маневрирует между телефонами, словно Джеки Чан на пике своей карьеры.CPAExchange — енот-доставщик. Доставляет конверсии до клиентов и использует для этого все каналы трафика: контекстную рекламу, социальные и тизерные сети, email и прочие.Registratura — сокол-программист. Занимается performance-маркетингом и использует передовые технологии, чтобы открыть все двери в мире бизнеса и увеличить конверсию клиентам.iSEO — собака-детектив. Раскрывает тайны поисковых систем, знает все о поисковой оптимизации и умеет вывести любой сайт на вершину поисковых запросов.

В итоге нейросеть сгенерировала около семи текстов. Чтобы комикс получился интереснее, авторы несколько раз просили ChatGPT изменить язык повествования: убрать официозность, упростить, сделать смешнее.

После попросили ввести в сюжет антигероев, добавили кульминацию и развязку. Когда сюжет был готов, поставили задачу нейросети расписать комикс в виде диалогов. Однако диалоги получались слишком длинные, поэтому несколько раз приходилось их сокращать с помощью ChatGPT, делать более емкими.

Чем острее сюжет, тем динамичнее разметкаСледующий шаг — генерация изображений на основе созданных диалогов. Для реализации задуманного выбрали Midjourney.

Вдохновившись дюжиной комиксов и проанализировав особенности построения сетки для каждого сюжета, команда сделала выводы: чем острее сюжет, тем динамичнее должна выглядеть разметка на изображении.

И наоборот: чем спокойнее сюжет, тем меньше динамики.

Стоит отметить, что команда долго искала нужную стилистику. Самое сложное было сохранить ее на изображениях на протяжении всего комикса.

Пример промта: A kind Japanese ninja cat with a red bandage on his forehead, many different poses in the style of a superhero in one picture, on a white background in the style of Marvel comics.

Финальный промт: Cartoon superhero ninja cat, in the style of noir comic art, dark and gritty cityscapes, blue and red, ultrafine detail, marvel comics, weathercore, innovative page design --ar 16:9.

Команда разделила генерацию на несколько этапов. Сначала создавали основных персонажей. Подробные описания главных героев позволили из раза в раз генерировать похожих животных (проблема с изображениями людей заключается в том, что нейросеть каждый раз добавляет разные лица, если только это не известные личности).

Более подробно разберем генерацию каждого персонажа. Сначала команда описывала самого героя, потом стилистику изображения, а потом техническую настройку для выведения рисунка

Пример промта: a cartoon of a detective dog in a suit in action, in the style of noir comic art, dark and gritty cityscapes, blue and red, ultrafine detail, marvel comics, weathercore, innovative page design --ar 16:9.

На основе понравившейся картинки команда iConText Group генерировала в Midjourney новое изображение. Например, просили в такой же стилистике представить этого же персонажа, но в другой позе. По аналогии работали с каждым персонажем.

После отрисовки героев необходимо было сгенерировать фон для каждого сюжета. Для этого команда использовала новую функцию фотошопа — Generative Fill, которая на основе маленькой части изображения дорисовывает оставшуюся область в той же стилистике. Первое, что сделали, — вырезали каждого персонажа с фона, по умолчанию созданного Midjourney. Потом отдельно сгенерировали в нейросети фон, подходящий под настроение каждого сюжета.

Пример работы с Generative Fill:

На последнем этапе команда в Figma собирала разные изображения (героев, фоны) в единую картинку. Сверху дополнительно наложили шум для поддержания единой стилистики.

Неудачные попыткиChatGPT далеко не с первого раза выдал текст, который бы отражал деятельность агентств, входящих в группу. Даже после подробных описаний нейросеть долго не могла логически сопоставить персонажа и компанию, так как не погружена в специфику конкретного бизнеса.

Что касается работы с Midjourney, чтобы добиться желаемого результата, команда сгенерировала порядка 500 изображений: на разных картинках нейросеть не сохраняла общую стилистику комикса.

Если просто закидывать в Midjourney какой-то референс, без уточняющего промта, нейросеть выдает странный результат.

Рекомендации по работе с нейросетями от iConText GroupЛайфхак 1. Если добавить в запрос «many different poses, on a white background», нейросеть выдаст одного персонажа в разных позах на одной картинке, с белым бэкграундом.

Лайфхак 2. Настройка «--ar» позволяет задать для изображения нужные пропорции. По умолчанию нейросеть генерирует квадрат. Если же задать параметр «--ar 16:9», то вы получите горизонтальные иллюстрации. И, наоборот, если указать «--ar 9:16», то вертикальные. К слову, такие картинки отлично подходят для формата сторис.

Лайфхак 3. Закидывайте референсы с нужными запросами. Это позволяет быстрее добиться желаемого результата.

Лайфхак 4. Не забывайте заходить в Community Feed. Вводите ключевые слова и выбирайте из готового, иногда это сильно экономит время. Если вам нужна уникальная генерация, комьюнити поможет вам сформировать промт. Найдите стилистику изображения, которая вам подходит, и заберите описание.

Какой главный инсайт?

Нейросети — отличный инструмент, который помогает экономить время, поэтому не нужно их бояться. Но отдавать всё им на откуп еще рано. Искусственный интеллект не может быть на 100% вовлечен в процесс, погружен в специфику бизнеса. Так, команде iConText Group пришлось дорисовывать свет, соединять фон с персонажем. Да и сам сюжет ChatGPT смог сгенерировать только на основании подробных описаний (читай: указаний).

Поэтому главный вывод, который можно сделать: без ручного труда и идей, которые выдает человеческий разум, пока не обойтись. И это здорово! Но никто не отменяет возможность тестирования нейросетей. Если хотите с ними работать, регулярно следите за обновлениями и экспериментируйте.

Состав творческой группы

Главный редактор iConText Group: Полина МихайловаАрт-директор iConText Group: Рустам БродниковГрафический дизайнер iConText Group: Мария Матвеева