Jak rysować w Midjourney: sieć neuronowa, która generuje obrazy na podstawie opisu

Jak zarejestrować się w Midjourney i zacząć korzystać za darmo
Jak wykupić płatną subskrypcję na Midjourney
Funkcje przetwarzania obrazów
Zarządzanie zapytaniami w Midjourney
Zasady i zakazy
Prawa autorskie
Do czego można wykorzystać Midjourney w praktyce
Charakter sztucznej inteligencji
Sztuczna inteligencja nauczyła się generować wideo

W tym roku trendem wśród użytkowników internetu stały się sztuczne inteligencje generujące obrazy na podstawie tekstowych zapytań. Wśród najpopularniejszych – Midjourney, sieć neuronowa działająca jak chatbot w Discordzie. Została stworzona w lutym 2022 roku, ale już zdążyła się rozprzestrzenić i stać się fascynującą zabawą. To nie pierwszy i nie jedyny serwis do generowania obrazków na podstawie tekstowych zapytań, ale tak prosty, że może "rysować" każdy użytkownik smartfona, do tego nie potrzebny jest nawet komputer. Może w tym tkwi sekret jej sukcesu.

Szczegółowo zbadaliśmy i przetestowaliśmy tę dziwaczną sztuczną inteligencję, aby opowiedzieć wam, jak korzystać z Midjourney, jak zarządzać zapytaniami i co ciekawego można zrobić w współpracy z nią.

sieć neuronowa rysuje na podstawie opisu – meduza, miłość, kosmiczny krajobraz

Sieć neuronowa rysuje jak prawdziwy artysta

Jak zarejestrować się w Midjourney i zacząć korzystać za darmo

Wejdź na stronę Midjourney i wybierz sekcję Dołącz do beta.
System przeniesie cię do Discorda i zaprosi do dołączenia do kanału sieci neuronowej. Musisz mieć konto na tym serwisie lub wcześniej się zarejestrować.
Wejdź do dowolnego czatu newbies i wpisz w polu wiadomości /imagine prompt: lub po prostu wpisz /(ukośnik) i wybierz polecenie imagine z listy.
W polu napisz zapytanie w języku angielskim. Poczekaj, aż system wygeneruje 4 wersje rysunku.
Wybierz jedną z nich, aby zrobić kilka wariacji lub od razu szczegółowo określić jako samodzielny obraz.
Pobierz obraz do galerii od razu, ponieważ w jednym czacie z tobą pracuje wielu innych użytkowników, a twoja praca już za kilka minut "ucieknie" daleko w górę.
Masz 25 darmowych działań, które obejmują generowanie obrazków, tworzenie wariantów i finalne przetwarzanie. Wykorzystaj je.

midjourney jak korzystać

Opanowujemy Midjourney — jak korzystać z chatbota w Discordzie

Jak wykupić płatną subskrypcję na Midjourney

Jeśli chcesz dalej korzystać z serwisu, możesz wykupić płatny plan.

Aby to zrobić, musisz wpisać w polu wiadomości polecenie /subscribe, a bot przeniesie cię na stronę subskrypcji. Są dwa podstawowe plany, które wystarczą dla zwykłych użytkowników:

Podstawowe członkostwo (Basic Membership) – kosztuje 10 dolarów miesięcznie, zapewnia 200 minut szybkiej generacji obrazów (gpu-minutes).
Standardowe członkostwo (Standard Membership) – kosztuje 30 dolarów miesięcznie, zapewnia nielimitowany plan szybkiej generacji obrazków. W rzeczywistości oznacza to 15 gpu-hours, co jest bardzo dużo. Ale nawet jeśli je wykorzystasz, na tym taryfie można pracować w trybie relaksu, za który nie są odejmowane opłacone minuty.

Tryb szybkiej generacji --fast oznacza, że system daje ci priorytet w kolejce korzystania z zasobów serwisu.

Tryb relaksu --relax oznacza, że twoje obrazki będą generowane dłużej, ponieważ staniesz w kolejce za innymi użytkownikami. Niemniej jednak wszystko to również odbywa się dość szybko. Opcja ta jest dostępna tylko w planach Standard i Corporate.

Twórcy zauważają — jeśli oszalejesz i będziesz generować zbyt wiele, automatycznie zostaniesz przeniesiony do trybu wolnego i będziesz umieszczany na końcu kolejki.

Możesz sprawdzić, ile minut pozostało na twoim koncie i inne informacje o koncie za pomocą polecenia /info.

Przeczytaj także: «TOP-11 zalet rejestratora domen i dostawcy hostingu Cityhost»

Funkcje przetwarzania obrazów

Po tym, jak system wygeneruje 4 szkice obrazów, możesz wybrać dwie akcje – V (zrób jeszcze warianty) lub U (powiększ i szczegółowo określ, ten przycisk tworzy ostateczną wersję obrazu). Na przykład, jeśli naciśniesz V3, system zrobi jeszcze 4 wersje dolnego lewego rysunku.

Wskazówka: jeśli kilka razy zastosujesz polecenie V, sztuczna inteligencja wyda coś bardzo dziwnego. Baw się dobrze.

midjourney - sieć neuronowa, która generuje obrazki

Sieć neuronowa rysuje online w czasie rzeczywistym — możesz zobaczyć, jak powstaje obrazek na twoje zapytanie

Kiedy otrzymasz ostateczny obraz po naciśnięciu U, możesz kontynuować pracę dalej, korzystając z jednego z przycisków — Make Variations pozwala na zrobienie jeszcze 2 wersji, Upscale podnosi jakość, Remaster robi obraz w innym stylu.

Gotowy obraz jest ładowany na dedykowany serwer sieci neuronowej i dostępny pod linkiem, który natychmiast jest wydawany w czacie razem z wygenerowanym obrazem.

Zarządzanie zapytaniami w Midjourney

Praca z sztuczną inteligencją może szybko znudzić, jeśli nie umiesz poprawnie formułować zapytań. Oprócz zwykłego opisu tekstowego pożądanej obrazki, takiego jak «kot, rudy, na kanapie», istnieje jeszcze szereg innych parametrów, które można wykorzystać do precyzowania formatu obrazu.

Nadaj AI styl rysunku – w stylu Salvadora Dalego, Hieronima Boscha, Da Vinci, cyberpunk, pop-art, realistyczny, szczegółowy.

Sieć neuronowa rysuje online - Kot w stylu Salvadora Dalego
Kot pije mleko w stylu Salvadora Dalego

Koryguj oświetlenie i kolory za pomocą słów: naturalne oświetlenie, miękkie światło, rozproszenie, ostre cienie itp.
Określ format i rozmiar obrazków. Wskazówka --ar pozwala ustawić proporcje. Standardowo serwis generuje kwadratowe obrazki, ale można zrobić poziome lub pionowe obrazy, ustawiając parametry, na przykład --ar 3:2. Można określić konkretną szerokość lub wysokość w pikselach za pomocą wskazówki --w <liczba> (szerokość) i --h <liczba> (wysokość).
Wybierz jakość obrazu (szczegółowość). Wskazówki --quality <liczba> lub --q <liczba> dają systemowi polecenie obniżenia lub zwiększenia jakości obrazu. Standardowo wartość wynosi 1, ale można wybrać 0.5 dla obniżenia lub 2 dla zwiększenia. Jeśli wybierzesz wartość 5, może powstać coś dziwnego.
Eksperymentuj. Za pomocą poleceń --chaos <liczba od 1 do 100> i --stylize <liczba od 625 do 60 000> można uczynić wersje bardziej różnorodnymi, kreatywnymi i nieprzewidywalnymi.

Więcej możesz się dowiedzieć w sekcji na stronie, gdzie przedstawione są podstawowe polecenia dla bota. Wszystkie dodatkowe operatory z dwoma myślnikami (--) należy podawać na końcu zapytania.

Ponadto należy formułować samo opisanie obrazu z twórczym podejściem. Sztuczna inteligencja czasami specyficznie rozumie zadanie i może wydać coś całkowicie nieoczekiwanego. W rzeczywistości to gra. Dlatego najbardziej interesujący wynik uzyskasz, dając niebanalne zapytanie:

Linijki z wierszy lub piosenek;
Abstrakcyjne pojęcia (wzajemna miłość, szczęśliwe dzieciństwo, miłość do ojczyzny, kara za wyrządzone zło itp.);
Oksymorony — frazy, które jednocześnie zawierają dwa wzajemnie wykluczające się pojęcia (gorący lód, smutna radość).

Midjourney rysuje obraz na zapytanie gorący lód

Tak sztuczna inteligencja zobaczyła frazę «gorący lód».

Im bardziej twórcze i dziwne zapytanie stworzysz, tym oryginalniejszy i ciekawszy wynik możesz uzyskać.

Oczywiście, interesowało nas, aby dać sieci neuronowej zapytania dotyczące naszej sfery działalności. Wybraliśmy maksymalnie abstrakcyjne terminy, które trudno zwizualizować. Oto jak sztuczna inteligencja zobaczyła serwer wirtualny.

Midjourney - sieć neuronowa rysuje na podstawie opisu pojęcie serwer wirtualny

Tak Midjourney zobaczył serwer wirtualny

Poprosiliśmy również AI o zobrazowanie domeny. Pierwsza próba nie była zbyt udana – bot wydaje fortece i miasta. Ale to nie dziwi, ponieważ słowo domain po angielsku oznacza również «własność», «działkę», «majątek». Dlatego zadanie zostało utrudnione i poprosiliśmy o rejestrację nazwy domeny (domain name registration). I tutaj sieć neuronowa zaskoczyła. Co to jest MAM i skąd taka asocjacja – zagadka.

Obraz wygenerowany na zapytanie rejestracja nazwy domeny

Przeczytaj także: «Domeny drop: jak kupić domenę z dobrą historią i do czego jest potrzebna»

Zasady i zakazy

Midjourney – to społeczność, w której obrazki generowane są w otwartym czacie (z wyjątkiem przypadków, gdy zapłaciłeś za osobiste korzystanie i nikt poza tobą ich nie widzi). Twórcy odczuwają moralną odpowiedzialność za generowany kontent, dlatego stworzyli szereg zakazów.

Tak, w bocie znajduje się lista automatycznie blokowanych słów, jeśli dotyczą one pornografii, krwawych i brutalnych scen, a także czegokolwiek, co może obrazić innych uczestników, wywołać u nich strach lub odrazę.

Kiedy wpisujesz takie słowo w zapytaniu, bot wydaje odpowiedź o blokadzie polecenia. W przypadku, gdy użytkownik często korzysta z zabronionych kluczy, może zostać całkowicie zablokowany.

Zakazy dotyczą wszystkich użytkowników, nawet tych, którzy wykupili prywatną subskrypcję.

Prawa autorskie

Sytuacja z prawami autorskimi w Midjourney jest dwuznaczna. Z jednej strony, prawa autorskie do wygenerowanego kontentu należą do użytkownika, który stworzył obrazek. Z drugiej strony, serwis zachowuje wyłączne prawa do używania, edytowania i demonstrowania wszystkich materiałów przechodzących przez czat. Każdy uczestnik czatu może widzieć twoje zapytania i wyniki, a także może je miksować i przetwarzać. To znaczy, że wszystkie przyciski pod twoją generacją, opisane powyżej, mogą naciskać nie tylko ty, ale i ktokolwiek w czacie.

To oznacza, że nikt nie może cię pozwać za to, że na przykład sprzedajesz plakaty z obrazkami, które wygenerowałeś w bocie. A z drugiej strony — te same obrazki mogą swobodnie krążyć po internecie.

Więcej o prawach autorskich czytaj tutaj.

Do czego można wykorzystać Midjourney w praktyce

Sieć neuronowa, która generuje obrazki – to świetna zabawka, ale czy ma jakąś praktyczną użyteczność? Oczywiście, można ją wykorzystać również do pracy:

Pomysły dla artystów, ilustratorów, animatorów;
Ilustracje do książek i pojedynczych dzieł;
Ilustracje do albumów muzycznych;
Pomysły dla światów i postaci (gry, filmy, powieści);
Tworzenie plakatów i drukowanych obrazów do wnętrz.

Ogólnie rzecz biorąc, sieć neuronowa wydaje dość jednorodne wyniki, jeśli pracujesz z nią długo, i trzeba je dopracowywać i rozwijać. Dlatego pytanie, czy sieć neuronowa zastąpi ilustratorów, pozostaje otwarte. Sztuczna inteligencja obecnie nie ma wystarczającej wyobraźni, aby konkurować z człowiekiem, ale jednocześnie jest wystarczająco szalona, aby wydawać coś nieoczekiwanego. Niemniej jednak sztuczna inteligencja się rozwija, więc czas pokaże.

Charakter sztucznej inteligencji

Chociaż sieć neuronowa – to tylko serwis, który nie ma duszy, swojego zdania ani charakteru, można umownie mówić o niektórych jej «cechach», które są widoczne we wszystkich obrazkach.

Brak twarzy, ludzie odwróceni plecami

Sieć neuronowa rysuje obrazy, gdzie ludzie są odwróceni plecami lub nie mają twarzy

Sieć neuronowa stara się unikać rysowania twarzy, jeśli nie przewiduje tego zapytanie. Na przykład, jeśli dajesz zapytanie «pasażerowie», «ludzie» lub «tłum», to otrzymasz wszystkie wersje bez twarzy. Niektóre zapytania mogą zawierać wersje z twarzami i bez (wojownik, dzieciństwo, bóg). Prawdopodobnie obrazy bez twarzy są łatwiejsze do wygenerowania, ale można pomyśleć, że AI – to mizantrop.

Dziwne oczy

Midjourney generuje obrazki, na których ludzie mają dziwne oczy

Na praktycznie wszystkich obrazach, gdzie znajdują się twarze, zobaczysz dziwne zdeformowane oczy, które trudno opisać. Są tak specyficzne, że po oczach można zgadnąć o «autorze» obrazu — namalowała go sztuczna inteligencja.

Zniekształcone formy

Sieć neuronowa Midjourney rysuje zniekształcone formy obiektów na obrazkach

Dla człowieka istnieją podstawowe parametry obiektów żywego i nieożywionego świata, i trudno nam wyjść poza przyzwyczajone ramy. W sieci neuronowej takich parametrów nie ma, dla niej surrealizm – to sposób myślenia. Dlatego może wygenerować planety w dowolnym kształcie, poza okrągłym, ptaszka z jednym skrzydłem lub kobietę z rękami o różnej długości. Przy tym, że nic podobnego nie było w zapytaniu. Tłumaczą to tym, że sieć neuronowa jest jeszcze niewystarczająco wykształcona.

Ulubione kolory

Jeśli nie określisz koloru w zapytaniu lub nie ma w nim obiektów, do których przypisane są określone skojarzenia (zima biała, krew czerwona), to sieć neuronowa sama wybiera kolory. Często są one szare lub turkusowo-czerwone.

Obraz wygenerowany przez Midjourney w czerwono-turkusowych tonach na zapytanie wzajemna miłość

Zapytanie «Wzajemna miłość»

Pracując z sztuczną inteligencją przez pewien czas, można dowiedzieć się więcej o jej «charakterze» i wykorzystać tę informację do poprawy swoich rysunków.

Sztuczna inteligencja nauczyła się generować wideo

Jeszcze nie zdążyliśmy się zachwycić obrazkami, a Meta już ogłosiła, że jej sieć neuronowa nauczyła się generować wideo na żądanie. Serwis jeszcze nie jest dostępny dla szerokiego użytku, ale twórcy pokazali kilka krótkich filmów.

Wideo stworzone przez sieć neuronową - rycerz na koniu

Są one tak samo «odjechane», jak wszystko, co robi sztuczna inteligencja.

Sieć neuronowa tworzy wideo - pies je lody

Planowane jest, że za ich pomocą będzie można edytować wideo, ożywiać zdjęcia i robić wiele przydatnych rzeczy.

***

Sieci neuronowe przeżywają burzliwy rozwój, są dziwne i niedoskonałe, ale niezwykle fascynujące. Fakt, że do ich używania mogli przyłączyć się zwykli użytkownicy internetu, świadczy o nowym etapie w historii sztucznej inteligencji. Zobaczymy, co będzie dalej.

Przeczytaj także: «Jak internet zmienił świat: TOP-10 zwykłych rzeczy i zjawisk, których mogło nie być»