CityHost.UA
Допомога і підтримка

Як малювати в Midjourney: нейромережа генерує зображення за текстовими запитами

 3977
04.10.2022
article

 

 

Цього року трендом серед користувачів інтернету стали штучні інтелекти, які генерують зображення за текстовими запитами. Серед найпопулярніших — Midjourney, нейромережа, яка працює як чат-бот у Дискорді. Вона була створена у лютому 2022 року, але вже встигла завіруситися і перетворитися на захоплюючу забавку. Це не перший і не єдиний сервіс для генерації картинок за текстовими запитами, але настільки простий, що ним може «малювати» будь-який користувач смартфона, для цього навіть не потрібен комп’ютер. Можливо, в цьому і секрет його успіху. 

Ми детально вивчили та протестували цей химерний штучний інтелект, щоб розказати вам, як користуватися Midjourney, як керувати запитами і що цікавого можна зробити у співавторстві з ним.

Згенеровані зображення - медуза, любов, інопланетний ландшафт

Як зареєструватися в Midjourney і почати користуватися безкоштовно

  1. Зайти на сайт Midjourney та обрати розділ Join the beta. 

  2. Система перекине у Discord і запросить приєднатися до каналу нейромережі. Потрібно мати акаунт на цьому сервісі або попередньо зареєструватися в ньому. 

  3. Заходьте у будь-який чат newbies і вводьте у полі повідомлення /imagine prompt: або просто введіть /(слеш) і виберіть команду imagine зі списку. 

  4. Напишіть у полі запит англійською мовою. Зачекайте, доки система згенерує 4 варіанти малюнку. 

  5. Оберіть один із них, щоб зробити ще декілька варіацій або одразу деталізувати як самостійне зображення. 

  6. Скачайте зображення в галерею одразу, бо в одному чаті з вами працює багато інших користувачів, і ваша робота вже за кілька хвилин «поїде» далеко вгору. 

  7. Ви маєте 25 безкоштовних дій, у які входять генерування картинок, створення варіантів та фінальна обробка. Використовуйте їх. 

 

Скріншот чату Midjourney в Discord

Як оформити платну підписку на Midjourney

Якщо ви хочете продовжувати користуватися сервісом, то можна оформити платний план. 

Для цього потрібно ввести у полі повідомлення команду /subscribe і бот перекине вас на сторінку підписок. Є два основних плани, яких достатньо для звичайних користувачів:

  1. Базове членство (Basic Membership) — коштує 10 доларів на місяць, надається 200 хвилин швидкої генерації зображень (gpu-minutes). 

  2. Стандартне членство (Standard Membership) — коштує 30 доларів на місяць, надається безлімітний план для швидкої генерації картинок. Насправді ж мається на увазі 15 gpu-hours, і це дуже багато. Але навіть якщо ви їх використаєте, на цьому тарифі є можливість працювати у розслабленому режимі, за який не знімаються оплачені хвилини. 

Режим швидкої генерації --fast означає, що система дає вам пріоритет у черзі на використання ресурсів сервісу. 

Розслаблений режим --relax означає, що ваші картинки генеруватимуться довше, бо ви станете в чергу за іншими користувачами. Втім, це відбувається також доволі швидко. Ця опція доступна тільки в планах Standard і Corporate. 

Розробники зазначають — якщо ви з’їдете з глузду і будете генерувати занадто багато, вас автоматично переведуть у повільний режим і ставитимуть в кінець черги.

Дізнатися, скільки у вас залишилося хвилин на рахунку та іншу інформацію про акаунт можна за допомогою команди /info.

Читайте також: «ТОП-11 переваг реєстратора доменів та хостинг-провайдера Cityhost» 

Функції обробки зображень

Після того, як система згенерувала 4 ескізи зображень, ви можете вибрати дві дії — V (зробити ще варіанти) або U (збільшити та деталізувати, ця кнопка робить фінальний варіант зображення). Наприклад, якщо натиснути V3, то система зробить ще 4 версії нижнього лівого малюнка. 

Підказка: якщо декілька разів застосувати команду V, то штучний інтелекти видасть щось дуже дивне. Розважайтеся.

Редагування зображень

Коли ви отримуєте фінальне зображення після натискання U, з ним можна продовжити працювати далі, використавши одну з кнопок — Make Variations дозволяє робити ще 2 версії, Upscale підвищує якість, Remaster робить зображення в іншому стилі.

Готова картинка завантажується на виділений сервер нейромережі та доступна за посиланням, яке одразу видається в чаті разом зі згенерованим зображенням. 

Керування запитами в Midjourney

Працювати зі штучним інтелектом може швидко набриднути, якщо не вміти правильно прописувати запити. Крім звичайного текстового опису бажаної картинки на кшталт «кіт, рудий, на дивані» є ще ряд інших параметрів, які можна використовувати для уточнення формату зображення. 

  1. Задайте ШІ стиль малюнку — у стилі Сальвадора Далі, Ієроніма Босха, Да Вінчі, кіберпанк, поп-арт, реалістичний, деталізований. 
    Кіт у стилі Сальвадора Далі

Кіт п’є молоко у стилі Сальвадора Далі

  1. Корегуйте освітлення і кольори за допомогою слів: натуральне освітлення, м’яке світло, розсіювання, різкі тіні тощо. 

  2. Задавайте формат та розмір картинок. Підказка --ar дозволяє встановити співвідношення сторін. Стандартно сервіс генерує квадратні картинки, але можна зробити горизонтальні або вертикальні зображення, встановивши параметри, наприклад, --ar 3:2. Можна задати конкретну ширину або висоту в пікселях за допомогою підказки --w <число> (ширина) і --h <число> (висота).

  3. Обирайте якість зображення (деталізацію). Підказки --quality <число> або --q <число> дають системі команду знизити або збільшити якість зображення. Стандартно стоїть значення 1, але можна обрати 0.5 для пониження або 2 для підвищення. Якщо обрати значення 5, може вийти щось чудернацьке.  

  4. Експериментуйте. За допомогою команд --chaos <число від 1 до 100> та --stylize <число від 625 до 60 000> можна зробити версії більш різноманітними, творчими і несподіваними. 

Більше ви можете дізнатися у розділі на сайті, де приведені основні команди для бота. Всі додаткові оператори з двома рисками (--) потрібно ставити у кінці запиту. 

Крім того, варто формулювати і сам опис зображення з творчим підходом. Штучний інтелект часом своєрідно розуміє завдання і може видати дещо цілком несподіване. По факту це гра. Тому найцікавіший результат ви отримаєте, даючи неординарний запит:

  • Рядки із віршів або пісень; 

  • Абстрактні поняття (взаємна любов, щасливе дитинство, любов до рідної землі, покарання за нанесене зло та інше);

  • Оксюморони — фрази, які одночасно містять два взаємовиключних поняття (гаряча крига, сумні веселощі).

Зображення, згенероване на запит гаряча крига

Так штучний інтелект побачив фразу «гаряча крига».   

Чим більш творчий і дивний запит ви створите, тим більш оригінальний і цікавий результат можете отримати. 

Звісно, нам було цікаво дати нейромережі запити, які стосуються нашої сфери діяльності. Ми вибрали максимально абстрактні терміни, які складно візуалізувати. От як штучний інтелект побачив віртуальний сервер.

Зображення, згенероване Midjourney на запит віртуальний сервер

Також ми попросили ШІ зобразити домен. Перша спроба була не дуже вдалою — бот видає фортеці та міста. Але це не дивно, адже слово domain в англійській означає також «володіння», «ділянка», «маєток». Тому задачу ускладнили і дали запит domain name registration (реєстрація доменного імені). І тут уже нейромережа здивувала. Що таке МАМ і звідки така асоціація — загадка. 

Зображення, згенероване Midjourney на запит реєстрація доменного імені

Читайте також: «Дроп-домени: як купити домен з хорошою історією і для чого він потрібен» 

Правила і заборони

Midjourney — це спільнота, в якій картинки генеруються у відкритому чаті (крім випадків, якщо ви заплатили за приватне використання і ніхто крім вас їх не бачить). Розробники відчувають моральну відповідальність за згенерований контент, тому створили ряд заборон. 

Так, у боті є перелік слів, які автоматично блокуються, якщо вони стосуються порнографії, кривавих та жорстоких сцен, а також будь-чого, що може образити інших учасників, викликати у них страх чи огиду.

Коли ви вводите таке слово в запит, бот видає відповідь про блокування команди. В разі, якщо користувач часто звертається до заборонених ключів, його можуть повністю заблокувати. 

Заборони стосуються всіх користувачів, навіть тих, хто оформив приватну підписку. 

Авторські права

Ситуація з авторськими правами у Midjourney двояка. З одного боку, авторські права на згенерований контент належать користувачу, який створив картинку. З іншого боку, за сервісом залишаються виключні права на використання, редагування і демонстрування всіх матеріалів, які проходять через чат. Кожен учасник чату може бачити ваші запити і результати, а також може їх мікшувати і обробляти. Тобто оті всі кнопки під вашою генерацією, описані вище, можете тицяти не лише ви, а й будь-хто в чаті. 

Це означає, що на вас ніхто не подасть в суд за те, що ви, наприклад, продаєте постери з картинками, які згенерували в боті. А з іншого — ті ж самі картинки можуть вільно гуляти по інтернету.

Докладніше про авторські права читайте тут.

Для чого можна використовувати Midjourney на практиці

Нейромережа, яка генерує картинки — це чудова іграшка, але чи є від неї якась практична користь? Звісно, її можна використовувати і для роботи:

  1. Ідеї для художників, ілюстраторів, мультиплікаторів;

  2. Ілюстрації для книг та окремих творів;

  3. Ілюстрації для музичних альбомів;

  4. Ідеї для світів і персонажів (ігри, фільми, романи);

  5. Створення постерів та друкованих інтер’єрних картин.

В цілому нейромережа видає доволі однотипні результати, якщо працювати з нею довго, і їх потрібно допрацьовувати і розвивати. Тому запитання про те, чи замінить нейромережа ілюстраторів, залишається відкритим. У штучного інтелекту зараз недостатньо фантазії, щоб конкурувати з людиною, але при цьому вона достатньо безумна, щоб видавати щось неочікуване. Втім, штучний інтелект розвивається, тому час покаже. 

Характер штучного інтелекту

Хоча нейромережа — це всього лише сервіс, який не має душі, своєї думки чи характеру, можна умовно говорити про деякі його «фішки», які прослідковуються в усіх картинках. 

Відсутність облич, люди повернуті спиною

Зображення, де люди повернуті спиною або немає обличь

Нейромережа старається уникати відмальовки облич, якщо цього не передбачає запит. Наприклад, якщо ви даєте запит «пасажири», «люди» або «натовп», то отримаєте всі варіанти без облич. Деякі запити можуть містити версії з обличчями і без (воїн, дитинство, бог). Можливо, зображення без облич простіше генерувати, але можна подумати, що ШІ — мізантроп. 

Дивні очі

Картинки, на яких у людей дивні очі

Практично на всіх зображеннях, де присутні обличчя, ви побачите дивні деформовані очі, які складно описати. Вони настільки специфічні, що по очах можна здогадатися про «авторство» зображення — його малював штучний інтелект. 

Спотворені та викривлені форми

Спотворені форми об'єктів на картинках

Для людини існують базові параметри об’єктів живого та неживого світу, і нам складно виходити за звичні межі. У нейромережі таких параметрів немає, для неї сюрреалізм — це спосіб мислення. Тому вона може згенерувати планети будь-якої форми, крім круглої, пташку з одним крилом або жінку з руками різної довжини. При тому що нічого подібного в запиті не було. Це пояснюють тим, що нейромережа ще недостатньо навчена. 

Улюблені кольори

Якщо ви не задаєте кольори у запиті або в ньому немає об’єктів, до яких прив’язані певні асоціації (зима біла, кров червона), то нейромережа сама обирає кольори. Найчастіше вони сірі або бірюзово-червоні. 

Зображення у червоно-бірюзових тонах на запит взаємне кохання

Запит «Взаємна любов»  

Працюючи зі штучним інтелектом певний час, можна дізнатися більше про його «характер» та використовувати цю інформацію для покращення своїх малюнків. 

Штучний інтелект навчився генерувати відео

Ми ще не встигли надивуватися картинкам, а Meta вже оголосила, що її нейромережа навчилася генерувати відео за запитом. Сервіс ще недоступний для широкого використання, але творці продемонстрували кілька коротких роликів.

Вони такі ж «упороті», як і все, що робить штучний інтелект. 

Планується, що за їхньою допомогою можна буде редагувати відео, оживляти фотографії та робити багато корисних речей. 

***

Нейромережі переживають бурхливий розвиток, вони дивні та недосконалі, але надзвичайно захоплюючі. Той факт, що до їхнього використання змогли долучитися пересічні інтернет-юзери, свідчить про новий виток в історії штучного інтелекту. Подивимося, що буде далі. 

Читайте також: «Як інтернет змінив світ: ТОП-10 звичних речей та явищ, яких могло не бути» 


Сподобалася стаття? Розкажіть про неї друзям: