Jak sieci neuronowe zmieniają świat sztuki wizualnej?

ikona publikacji - ciemny
Opublikowano: 31 października 2022
ikona autora biały
ai w sztuce

Sztuka piękna zawsze była jednym z głównych wytworów ludzkiej kultury. Od wieków pozwalała ludziom wyrażać siebie i opowiadać historie.

Najpierw pojawiło się malarstwo jaskiniowe, potem obrazy olejne i fotografia. Teraz nadchodzi era "obrazkowej" sztucznej inteligencji, a w szczególności sieci neuronowych.

Sprawdźmy więc jakie modele AI są wykorzystywane do pracy z obrazami i czy takie systemy mogą zastąpić artystów.

Krótka historia sztuki AI

Historię generowanej sztuki AI można prześledzić od momentu odkrycia grafiki komputerowej i wynalezienia komputera. Wtedy badacze używali podstawowych algorytmów do tworzenia prostych wzorów i kształtów.

W 1967 roku niemiecki matematyk i naukowiec Frieder Naquet opracował portfolio o nazwie Matrix Multiplications składające się z 12 obrazów. Stworzył kwadratową matrycę i wypełnił ją liczbami, które kolejno były mnożone przez siebie.

Badacz przełożył wyniki na obrazy danych interwałów, gdzie każdej wartości przypisał znak wizualny o określonym kształcie i kolorze. Następnie umieścił kształty w rastrze zgodnie z wartościami matrycy.

Naquet często wykorzystywał w swojej pracy generator liczb losowych i prawdopodobnie to on częściowo zautomatyzował proces mnożenia.

sztuka ai
Obraz z portfolio Matrix Multiplications autorstwa Frider Naquet. Źródło: Tate.

W 1973 roku artysta Harold Cohen opracował zestaw algorytmów AARON zdolnych do rysowania "ręcznie" pewnych obiektów. Odkrył, że system zaczął tworzyć nieznane wcześniej kształty.

Oprogramowanie najpierw generowało abstrakcyjne obrazy, a następnie nauczyło się rysować bardziej złożone kształty, w tym kamienie, rośliny i ludzi.

Zdjęcie wygenerowane przez AARON. Źródło: New Atlas.

Od 1990 roku badacze i artyści wykorzystują modele AI w robotyce, szkoląc maszyny do tworzenia obrazów i rzeźb.

W 2015 roku inżynier Google Alexander Mordvintsev uruchomił DeepDream, program do wizji komputerowej, który wykorzystuje konwencjonalną sieć neuronową do wyszukiwania i ulepszania wzorców w obrazach za pomocą algorytmicznej pareidolii.

System działa poprzez zniekształcanie oryginalnego obrazu w zależności od tego, jakie jego części przypominają znane obiekty.

Kiedy Google opublikowało podejście i otworzyło kod źródłowy algorytmu, na rynku pojawiło się wiele narzędzi i usług pozwalających każdemu na przekształcenie swoich zdjęć w "psychodeliczne" obrazy.

Obraz źródłowy (po lewej) i przetworzony za pomocą DeepDream (po prawej). Źródło: MartinThoma.

W 2022 roku AI znajduje zastosowanie w różnych dziedzinach, w tym w marketingu, modzie i rozrywce.

Okładka drukowanego wydania magazynu Cosmopolitan, stworzona przy użyciu algorytmu DALL-E 2 firmy OpenAI. Źródło: Cosmopolitan.

Modele pomagają również w tworzeniu obrazów.

Obraz Théâtre D'opéra Spatial, stworzony przez Jasona Allena przy użyciu algorytmu Midjourney. Źródło: Motherboard.

Sieci neuronowe do manipulacji obrazem

Rok 2022 może przejść do historii jako czas, w którym sztuka AI stała się mainstreamowa. Boom na wysokiej jakości narzędzia oparte na algorytmach sprawia, że neurokreacja staje się dostępna dla każdego, kto posiada smartfon podłączony do internetu.

Modele AI potrafią kopiować style artystów, przekształcać szkice w fotorealistyczne ilustracje, "animować" portrety i tworzyć nowe obrazy. Do różnych zadań stosuje się różne lub podobne podejścia i narzędzia.

Neural Style Transfer (NST) to oparta na konwencjonalnej sieci neuronowej metoda tworzenia obrazu, który naśladuje inny obraz pod względem stylu. Użytkownik może przekształcić zdjęcie biegnącego psa w grafikę Katsushiki Hokusai lub wygenerować Mona Lisę Jana Vermeera.

Zdjęcie źródłowe treści (po lewej), obraz z pożądanym stylem (w środku) i wynik (po prawej). Dane: Instapainting.

Generative Adversarial Neural Networks (GAN) odpowiadają za tworzenie nowych dzieł sztuki lub obrazów z wykorzystaniem stylu innych obrazów. Są to algorytmy, które składają się z dwóch modeli jednocześnie: generatora, który produkuje treści i dyskryminatora, który je ocenia.

Systemy oparte na GAN mogą rysować obrazy podobne do obrazów ze zbioru danych treningowych, w tym twarze ludzi, twarze kotów, meble i inne obiekty.

Twarze nieistniejących osób tworzone przez generatywną i adwersarzową sieć neuronową. Źródło: This Person Does Not Exist

Generatywne i kontradyktoryczne sieci neuronowe mogą również pomóc w "ożywieniu" szkicu krajobrazu.

Jednak zdecydowanie najpopularniejszymi narzędziami do tworzenia dzieł sztuki są tekstowe generatory obrazów AI, które wykorzystują modele językowe, takie jak GPT-3 firmy OpenAI.

Obrazy wygenerowane za pomocą Stable Diffusion. Źródło: Lexica.

Dewizą takich systemów jest "wpisz i masz". Użytkownik musi pomyśleć o dowolnym zapytaniu w języku naturalnym, takim jak "Lama z dredami w kombinezonie astronauty", a algorytm wygeneruje obraz zgodnie z podpowiedzią.

Obraz na żądanie dla "Lama z dredami w kostiumie astronauty". Źródło: Midjourney.

Opisy tekstowe mogą składać się z ogromnej liczby słów, których dodanie lub usunięcie może drastycznie zmienić wynik. Odgrywają one kluczową rolę w tworzeniu obrazów. Istnieją nawet specjalne rynki, na których ludzie mogą kupić zapytanie o konkretny styl obrazu za pieniądze.

Programiści trenują generatory AI na ogromnych tablicach obrazów i ich tekstowych opisach, szkoląc model do szukania połączeń między nimi. Często wykorzystują też proces dyfuzji - algorytm rozpoczyna generowanie od zestawu losowych punktów i stopniowo poprawia obraz, zbliżając go do danej podpowiedzi i pozbywając się szumu.

Większość popularnych generatorów AI ma ograniczenia w tworzeniu treści: nie mogą przedstawiać nagości, przemocy, realistycznych twarzy ani postaci politycznych. Do takich narzędzi należą OpenAI DALL-E 2, Google Imagen i Midjourney. Czasami za korzystanie z nich pobierana jest opłata.

Istnieją jednak systemy pozbawione takich ograniczeń, jak np. Stable Diffusion. Twórca narzędzia Stability AI powiedział, że model nie posiada żadnych filtrów i może tworzyć dowolne treści.

Zdjęcie Donalda Trumpa stworzone za pomocą Stable Diffusion Źródło: Lexica.

Tekstowe generatory obrazów mogą być używane do udoskonalania gotowych prac. W sierpniu OpenAI wprowadziło Outpainting, czyli funkcję, która pozwala DALL-E 2 rozszerzać obrazy o podpowiedzi.

Obraz Jana Vermeera "Dziewczyna z perłowym kolczykiem" i jego rozszerzona wersja stworzona dzięki DALL-E 2. Źródło: OpenAI.

Ile kosztuje stworzenie sieci neuronowej?

To jest bardzo niejednoznaczne pytanie,. Odpowiedź brzmi: od zera do kilkuset milionów dolarów.

Na początek stworzenie i wytrenowanie algorytmu AI wymaga wiedzy. Użytkownicy bez umiejętności programowania lub chęci wydawania pieniędzy na kursy muszą najpierw zrozumieć, jak działają sieci neuronowe. Istnieje wiele darmowych artykułów, zasobów i usług, takich jak projekt edukacyjny Google's Teachable Machine.

Będziesz także potrzebował języka programowania, takiego jak Python, oraz biblioteki do tworzenia i szkolenia sieci neuronowych, takiej jak TensorFlow, PyTorch lub innej.

Poza tym musisz zbudować treningowy zbiór danych dla wymaganego zadania: możesz go stworzyć samodzielnie, uzyskać z otwartych źródeł lub kupić. Do opracowania generatora obrazów na żądanie potrzebny jest zestaw obrazów i ich opisów tekstowych.

Dokładność modelu zależy bezpośrednio od jakości i ilości danych. Wpływ na to ma również wykorzystywany sprzęt i zużyte zasoby obliczeniowe.

Mając wszystko powyższe, możliwe jest stworzenie sieci neuronowej obrazu za darmo.

Jednak duże firmy, takie jak Meta, Amazon, Apple, Microsoft czy Alphabet, inwestują w takie produkty dziesiątki miliardów dolarów. Koszty te obejmują badania, rozwój, szkolenia, walidację, wdrożenie, komercjalizację i wsparcie technologii. Czasami proces ten trwa latami i może doprowadzić do zamknięcia projektu lub, alternatywnie, uczynić go niezastąpionym.

Zalety i wady algorytmów AI w sztuce

Wśród zalet stosowania sieci neuronowych do tworzenia dzieł sztuki jest generowanie realistycznych danych. Takie obrazy znajdą zastosowanie w filmach, reklamach, grach i innych dziedzinach.

Algorytmy AI myślą "poza schematem". Potrafią tworzyć nieznane wcześniej obrazy, układać obiekty w nietypowy sposób, mieszać tekstury w oryginalny sposób. Taka sztuka może być źródłem inspiracji dla bardziej ambitnych projektów.

Poprzez ciągłe unowocześnianie technologii i danych, sztuka AI również ewoluuje i stale przynosi nowe pomysły.

Ponadto algorytmy mogą przyspieszyć wykonywanie niektórych zadań. Sieci neuronowe mogą być wykorzystywane do tworzenia logotypów, klipów i w celach marketingowych.

Do wad należy zaliczyć brak ludzkich emocji. To czasem zaleta, ale tworząc dzieło sztuki, wiele osób potrzebuje jakiejś historii lub fabuły.

Ze względu na ograniczone zestawy danych treningowych, sztuka AI może stać się nudna. Bez ciągłego uaktualniania i trenowania na nowych zbiorach danych, generowane obrazy zaczną się powtarzać i stracą swoją unikalność.

Twórcy nie mogą też kontrolować procesu twórczego sieci neuronowych. Po treningu algorytm wyprowadza wynik na podstawie zadanych wag, a jeśli nie będzie on satysfakcjonujący, model będzie musiał zostać przekwalifikowany.

Ale główne problemy z wykorzystaniem AI dotyczą etyki. Twórcy nie zawsze mogą kontrolować rozpowszechnianie i stosowanie technologii. Algorytmy nie mogą być uznane za autorów dzieł, ale za ich nieprawidłowe "zachowanie" odpowiadają twórcy.

Ze względu na dostępność technologii, napastnicy mogą wykorzystać AI do tworzenia obrazów w celu oszukania ludzi, kradzieży ich tożsamości i rozpowszechniania mowy nienawiści.

Czy sieci neuronowe zastąpią artystów?

Fotografia była kiedyś uważana za nową falę kreatywności. Po prawie 200 latach istnienia nie zastąpiła artystów i twórców w sztuce, ale zmusiła ich do ewolucji i adaptacji.

Stworzyła nowe pokolenie kreatywnych ludzi. Artyści i fotografowie zaczęli wspólnie tworzyć dzieła sztuki, które mogły zaskakiwać, przyciągać i prowokować myśli o pięknie.

Sztuka, w jakiejkolwiek formie, sprawia, że ludzie czują. I jest tu mnóstwo miejsca na nowe oblicza artystyczne zdolne wywołać nieznane dotąd doznania.

Twórcy generatywnej AI mogą nieco przesunąć istniejące formy kreatywności, ale ich nie zniszczą.

Narzędzia takie jak DALL-E 2, Stable Diffusion i Midjourney prawdopodobnie będą nadal przekształcać się w wysoce zaawansowane silniki artystyczne i pomagać artystom w ich pracy.

Dzięki wystarczającej ilości i ciągłemu rozwojowi sieci neuronowych ludzie będą mogli regularnie korzystać z tej technologii, aby inspirować i poszerzać swoje możliwości ideacyjne.

Kategoria wpisu:

Podobne tematy

Te akcje spadły o kilkadziesiąt procent od swoich rekordów - Czy to czas, aby je kupić?

Przy niepokojących poziomach inflacji i rosnących stopach procentowych, które wprowadzają na rynek niedźwiedzie nastroje, ostatnie miesiące były trudne dla inwestorów skoncentrowanych na technologii, co widać na wykresie indeksu Nasdaq 100. Tymczasem rynki akcji prawdopodobnie pozostaną niestabilne. Jednak silne spółki będą w stanie przetrwać trudne czasy, a obecna seria problemów makroekonomicznych doprowadziła do obniżenia wycen niektórych […]

Inwestowanie w drony - Wszystko, co musisz wiedzieć

W dzisiejszych czasach ogólnej niepewności, kiedy większość konserwatywnych aktywów nie jest w stanie utrzymać swojej wartości, nie mówiąc już o generowaniu zysków, musimy szukać innych, alternatywnych sposobów inwestowania. Jedną z takich okazji może być rynek dronów, który w ostatnich latach znacząco się rozwija, a także przeszedł duże zmiany legislacyjne. W tym artykule przyjrzymy się bliżej […]

Jakie są alternatywy dla ChatGPT? 

Od momentu uruchomienia, ChatGPT stał się popularnym chatbotem opartym na sztucznej inteligencji i opracowanym przez OpenAI. Umożliwia on użytkownikom uzyskiwanie szczegółowych i ludzkich odpowiedzi na różnorodne pytania. ChatGPT nie tylko udostępnia użytkownikom linki, ale także potrafi rozwiązywać skomplikowane problemy i dostarczać zniuansowanych informacji, co może całkowicie zmienić sposób, w jaki ludzie będą korzystać z wyszukiwarek. […]

Jak korzystać z ChatGPT? 

Do tej pory prawdopodobnie słyszałeś o ChatGPT, prototypie chatbota ogólnego przeznaczenia, na punkcie którego internet ma obecnie obsesję. Szybko stał się dominującym przykładem wpływu treści generowanych przez sztuczną inteligencję w przyszłości, pokazując, jak potężne mogą być te narzędzia. Jest tworzony przez OpenAI, czyli dobrze znanego z opracowania generatora tekstu na obraz DALL-E. Na dzień pisania […]

Programy AI do obrabiania filmów 

Potrzebujesz świetnej, wysokiej jakości filmów, ale brakuje Ci umiejętności lub cierpliwości do edycji? A może uważasz, że programy do edytowania są żmudne i czasochłonne? Dlaczego by zatem nie pozwolić, aby sztuczna inteligencja wykonała za Ciebie te ciężkie zadania? Nie jest tajemnicą, że edycja wideo wymaga wysiłku – od zawsze był to długi i pracochłonny proces. […]
0 0 Głosy
Oceń artykuł
guest
0 komentarzy
Inline Feedbacks
View all comments
© FintechPortal.pl 2021 Wszelkie prawa zastrzeżone
star