CityHost.UA
Помощь и поддержка

Как рисовать в Midjourney: нейросеть генерирует изображения по текстовым запросам

 3981
04.10.2022
article

 

 

В этом году трендом среди пользователей интернета стали искусственные интеллекты, генерирующие изображения по текстовым запросам. Среди самых популярных – Midjourney, нейросеть, работающая как чат-бот в Дискорде. Она была создана в феврале 2022 года, но уже успела завируситься и превратиться в увлекательную забаву. Это не первый и не единственный сервис для генерации картинок по текстовым запросам, но столь простой, что им может «рисовать» любой пользователь смартфона, для этого даже не нужен компьютер. Может быть, в этом и секрет его успеха.

Мы подробно изучили и протестировали этот причудливый искусственный интеллект, чтобы рассказать вам, как пользоваться Midjourney, как управлять запросами и что интересное можно сделать в соавторстве с ним.

Сгенерированные изображения – медуза, любовь, инопланетный ландшафт

Как зарегистрироваться в Midjourney и начать пользоваться бесплатно

  1. Зайти на сайт Midjourney и выбрать раздел Join the beta.

  2. Система перебросит в Discord и пригласит присоединиться к каналу нейросети. Необходимо иметь аккаунт на этом сервисе или предварительно зарегистрироваться в нем.

  3. Заходите в любой чат newbies и вводите в поле сообщения /imagine prompt: или просто введите /(слэш) и выберите команду imagine из списка.

  4. В поле напишите запрос на английском языке. Подождите, пока система сгенерирует 4 варианта рисунка.

  5. Выберите один из них, чтобы сделать несколько вариаций или сразу детализировать как самостоятельное изображение.

  6. Скачайте изображение в галерею сразу, потому что в одном чате с вами работает много других пользователей, и ваша работа уже через несколько минут «уедет» далеко вверх.

  7. У вас есть 25 бесплатных действий, в которые входят генерирование картинок, создание вариантов и финальная обработка. Используйте их.

Скриншот чата Midjourney в Discord

Как оформить платную подписку на Midjourney

Если вы хотите продолжать пользоваться сервисом, можно оформить платный план.

Для этого нужно ввести в поле сообщения команду /subscribe и бот перебросит вас на страницу подписок. Есть два основных плана, которых достаточно для обычных пользователей:

  1. Базовое членство (Basic Membership) – стоит 10 долларов в месяц, предоставляется 200 минут быстрой генерации изображений (gpu-minutes).

  2. Стандартное членство (Standard Membership) – стоит 30 долларов в месяц, предоставляется безлимитный план для быстрой генерации картинок. На самом же деле подразумевается 15 gpu-hours, и это очень много. Но даже если вы их используете, на этом тарифе можно работать в расслабленном режиме, за который не снимаются оплаченные минуты.

Режим быстрой генерации --fast означает, что система дает вам приоритет в очереди использования ресурсов сервиса.

Расслабленный режим --relax означает, что ваши картинки будут генерироваться дольше, потому что вы станете в очередь после других пользователей. Впрочем, все это также происходит довольно быстро. Опция доступна только в планах Standard и Corporate.

Разработчики отмечают — если вы сойдете с ума и будете генерировать слишком много, вас автоматически переведут в медленный режим и будут ставить в конец очереди.

Узнать, сколько у вас осталось минут на счету и другую информацию об аккаунте можно с помощью команды /info.

Читайте также: «ТОП-11 преимуществ регистратора доменов и хостинг-провайдера Cityhost»

Функции обработки изображений

После того, как система сгенерировала 4 эскиза изображений, вы можете выбрать два действия – V (сделать еще варианты) или U (увеличить и детализировать, эта кнопка делает финальный вариант изображения). К примеру, если нажать V3, то система сделает еще 4 версии нижнего левого рисунка.

Подсказка: если несколько раз применить команду V, то искусственный интеллект выдаст нечто очень странное. Развлекайтесь.

Редактирование изображений

Когда вы получаете финальное изображение после нажатия U, с ним можно продолжить работу дальше, используя одну из кнопок — Make Variations позволяет делать еще 2 версии, Upscale повышает качество, Remaster делает изображение в другом стиле.

Готовая картинка загружается на выделенный сервер нейросети и доступна по ссылке, которая сразу выдается в чате вместе со сгенерированным изображением.

Управление запросами в Midjourney

Работать с искусственным интеллектом может быстро поднадоесть, если не уметь правильно прописывать запросы. Кроме обычного текстового описания желаемой картинки по типу «кот, рыжий, на диване» есть еще ряд других параметров, которые можно использовать для уточнения формата изображения.

  1. Задайте ИИ стиль рисунка – в стиле Сальвадора Дали, Иеронима Босха, Да Винчи, киберпанк, поп-арт, реалистичный, детализированный.

Кот в стиле Сальвадора Дали
Кот пьет молоко в стиле Сальвадора Дали

  1. Корректируйте освещение и цвета с помощью слов: натуральное освещение, мягкий свет, рассеивание, резкие тени и т.д.

  2. Задайте формат и размер картинок. Подсказка --ar позволяет установить соотношение сторон. Стандартно сервис генерирует квадратные картинки, но можно сделать горизонтальные или вертикальные изображения, установив параметры, например, --ar 3:2. Можно задать конкретную ширину или высоту в пикселях с помощью подсказки --w <число> (ширина) и --h <число> (высота).

  3. Выбирайте качество изображения (детализацию). Подсказки --quality <число> или --q <число> дают системе команду снизить или увеличить качество изображения. Стандартно стоит значение 1, но можно выбрать 0.5 для понижения или 2 для повышения. Если выбрать значение 5, может получиться что-то странное.

  4. Экспериментируйте. С помощью команд --chaos <число от 1 до 100> и --stylize <число от 625 до 60 000> можно сделать версии более разнообразными, творческими и неожиданными.

Больше вы можете узнать в разделе на сайте, где приведены основные команды для бота. Все дополнительные операторы с двумя дефисами (--) нужно задавать в конце запроса.

Кроме того, следует формулировать и само описание изображения с творческим подходом. Искусственный интеллект подчас своеобразно понимает задачу и может выдать нечто совершенно неожиданное. По факту это игра. Поэтому наиболее интересный результат вы получите, давая неординарный запрос:

  • Строки из стихов или песен;

  • Абстрактные понятия (взаимная любовь, счастливое детство, любовь к родной земле, наказание за нанесенное зло и прочее);

  • Оксюмороны — фразы, одновременно содержащие два взаимоисключающих понятия (горячий лед, грустное веселье).

Изображение, сгенерированное на запрос горячий лед

Так искусственный интеллект увидел фразу «горячий лед».

Чем более творческий и странный запрос вы создадите, тем оригинальнее и интереснее результат можете получить.

Конечно, нам было интересно дать нейросети запросы, касающиеся нашей сферы деятельности. Мы выбрали максимально абстрактные термины, которые сложно визуализировать. Вот как искусственный интеллект увидел виртуальный сервер.

Изображение, сгенерированное Midjourney по запросу виртуальный сервер

Также мы попросили ИИ изобразить домен. Первая попытка была не очень удачной – бот выдает крепости и города. Но это не удивительно, ведь слово domain в английском означает также «владение», «участок», «имение». Поэтому задачу усложнили и запросили domain name registration (регистрация доменного имени). И тут уже нейросеть удивила. Что такое МАМ и откуда такая ассоциация – загадка.

Изображение, сгенерированное на запрос регистрация доменного имени

Читайте также: «Дроп-домены: как купить домен с хорошей историей и для чего он нужен»

Правила и запреты

Midjourney – это сообщество, в котором картинки генерируются в открытом чате (кроме случаев, если вы заплатили за личное использование и никто кроме вас их не видит). Разработчики испытывают моральную ответственность за сгенерированный контент, поэтому создали ряд запретов.

Так, в боте есть перечень автоматически блокируемых слов, если они касаются порнографии, кровавых и жестоких сцен, а также чего-либо, что может оскорбить других участников, вызвать у них страх или отвращение.

Когда вы вводите такое слово в запрос, бот выдает ответ про блокировку команды. В случае, если пользователь часто обращается к запрещенным ключам, его могут полностью заблокировать.

Запреты касаются всех пользователей, даже тех, кто оформил приватную подписку.

Авторские права

Ситуация с авторскими правами в Midjourney двоякая. С одной стороны, авторские права на сгенерированный контент принадлежат пользователю, создавшему картинку. С другой стороны, за сервисом остаются исключительные права на использование, редактирование и демонстрирование всех проходящих через чат материалов. Каждый участник чата может видеть ваши запросы и результаты, а также может их микшировать и обрабатывать. То есть все кнопки под вашей генерацией, описанные выше, можете тыкать не только вы, но и кто угодно в чате.

Это значит, что вас никто не подаст в суд за то, что вы, например, продаете постеры с картинками, которые сгенерировали в боте. А с другой — те же картинки могут свободно гулять по интернету.

Подробнее об авторских правах читайте здесь.

Для чего можно использовать Midjourney на практике

Нейросеть, которая генерирует картинки – это отличная игрушка, но есть ли от нее какая-то практическая польза?  Конечно, ее можно использовать и для работы:

  1. Идеи для художников, иллюстраторов, мультипликаторов;

  2. Иллюстрации для книг и отдельных произведений;

  3. Иллюстрации для музыкальных альбомов;

  4. Идеи для миров и персонажей (игры, фильмы, романы);

  5. Создание постеров и печатных интерьерных картин.

В целом нейросеть выдает достаточно однотипные результаты, если работать с ней долго, и их нужно дорабатывать и развивать. Поэтому вопрос в том, заменит ли нейросеть иллюстраторов, остается открытым. У искусственного интеллекта сейчас недостаточно фантазии, чтобы конкурировать с человеком, но при этом она достаточно безумна, чтобы выдавать что-то неожиданное. Впрочем, искусственный интеллект развивается, поэтому время покажет.

Характер искусственного интеллекта

Хотя нейросеть – это всего лишь сервис, не имеющий души, своего мнения или характера, можно условно говорить о некоторых его «фишках», которые прослеживаются во всех картинках.

Отсутствие лиц, люди повернуты спиной

Изображения, где люды повернуты спиной или нет лиц

Нейросеть старается избегать отрисовки лиц, если этого не предполагает запрос. Например, если вы даете запрос «пассажиры», «люди» или «толпа», то получите все варианты без лиц. Некоторые запросы могут содержать версии с лицами и без (воин, детство, бог). Вероятно, изображения без лиц проще генерировать, но можно подумать, что ИИ – мизантроп.

Странные глаза

Картинки, на которых у людей странные глаза

Практически на всех изображениях, где находятся лица, вы увидите странные деформированные глаза, которые сложно описать. Они настолько специфичны, что по глазам можно догадаться об «авторстве» изображения — его нарисовал искусственный интеллект.

Искаженные формы

Искаженные формы объектов на картинках

Для человека существуют базовые параметры объектов живого и неодушевленного мира, и нам сложно выходить за привычные рамки. В нейросети таких параметров нет, для нее сюрреализм – это образ мышления. Поэтому она может сгенерировать планеты любой формы, кроме круглой, птичку с одним крылом или женщину с руками разной длины. При том, что ничего подобного в запросе не было. Это объясняют тем, что нейросеть еще недостаточно обучена.

Любимые цвета

Если вы не задаете цвет в запросе или в нем нет объектов, к которым привязаны определенные ассоциации (зима белая, кровь красная), то нейросеть сама выбирает цвета. Чаще они серые или бирюзово-красные.

Изображение в красно-бирюзовых тонах по запросу взаимная любовь

Запрос «Взаимная любовь»

Работая с искусственным интеллектом определенное время, можно узнать больше о его «характере» и использовать эту информацию для улучшения своих рисунков.

Искусственный интеллект научился генерировать видео

Мы еще не успели наудивляться картинкам, а Meta уже объявила, что ее нейросеть научилась генерировать видео по запросу. Сервис еще недоступен для широкого использования, но создатели показали несколько коротких роликов.

Они такие же «упоротые», как и все, что делает искусственный интеллект.

Планируется, что с их помощью можно будет редактировать видео, оживлять фотографии и делать много полезных вещей.

***

Нейросети переживают бурное развитие, они странны и несовершенны, но чрезвычайно увлекательны. Тот факт, что к их использованию смогли приобщиться рядовые интернет-юзеры, свидетельствует о новом витке в истории искусственного интеллекта. Посмотрим, что будет дальше.

Читайте также: «Как интернет изменил мир: ТОП-10 привычных вещей и явлений, которых могло не быть»


Понравилась статья? Расскажите о ней друзьям: