Sztuka piękna zawsze była jednym z głównych wytworów ludzkiej kultury. Od wieków pozwalała ludziom wyrażać siebie i opowiadać historie.
Najpierw pojawiło się malarstwo jaskiniowe, potem obrazy olejne i fotografia. Teraz nadchodzi era „obrazkowej” sztucznej inteligencji, a w szczególności sieci neuronowych.
Sprawdźmy więc jakie modele AI są wykorzystywane do pracy z obrazami i czy takie systemy mogą zastąpić artystów.
Krótka historia sztuki AI
Historię generowanej sztuki AI można prześledzić od momentu odkrycia grafiki komputerowej i wynalezienia komputera. Wtedy badacze używali podstawowych algorytmów do tworzenia prostych wzorów i kształtów.
W 1967 roku niemiecki matematyk i naukowiec Frieder Naquet opracował portfolio o nazwie Matrix Multiplications składające się z 12 obrazów. Stworzył kwadratową matrycę i wypełnił ją liczbami, które kolejno były mnożone przez siebie.
Badacz przełożył wyniki na obrazy danych interwałów, gdzie każdej wartości przypisał znak wizualny o określonym kształcie i kolorze. Następnie umieścił kształty w rastrze zgodnie z wartościami matrycy.
Naquet często wykorzystywał w swojej pracy generator liczb losowych i prawdopodobnie to on częściowo zautomatyzował proces mnożenia.
W 1973 roku artysta Harold Cohen opracował zestaw algorytmów AARON zdolnych do rysowania „ręcznie” pewnych obiektów. Odkrył, że system zaczął tworzyć nieznane wcześniej kształty.
Oprogramowanie najpierw generowało abstrakcyjne obrazy, a następnie nauczyło się rysować bardziej złożone kształty, w tym kamienie, rośliny i ludzi.
Od 1990 roku badacze i artyści wykorzystują modele AI w robotyce, szkoląc maszyny do tworzenia obrazów i rzeźb.
W 2015 roku inżynier Google Alexander Mordvintsev uruchomił DeepDream, program do wizji komputerowej, który wykorzystuje konwencjonalną sieć neuronową do wyszukiwania i ulepszania wzorców w obrazach za pomocą algorytmicznej pareidolii.
System działa poprzez zniekształcanie oryginalnego obrazu w zależności od tego, jakie jego części przypominają znane obiekty.
Kiedy Google opublikowało podejście i otworzyło kod źródłowy algorytmu, na rynku pojawiło się wiele narzędzi i usług pozwalających każdemu na przekształcenie swoich zdjęć w „psychodeliczne” obrazy.
W 2022 roku AI znajduje zastosowanie w różnych dziedzinach, w tym w marketingu, modzie i rozrywce.
Modele pomagają również w tworzeniu obrazów.
Sieci neuronowe do manipulacji obrazem
Rok 2022 może przejść do historii jako czas, w którym sztuka AI stała się mainstreamowa. Boom na wysokiej jakości narzędzia oparte na algorytmach sprawia, że neurokreacja staje się dostępna dla każdego, kto posiada smartfon podłączony do internetu.
Modele AI potrafią kopiować style artystów, przekształcać szkice w fotorealistyczne ilustracje, „animować” portrety i tworzyć nowe obrazy. Do różnych zadań stosuje się różne lub podobne podejścia i narzędzia.
Neural Style Transfer (NST) to oparta na konwencjonalnej sieci neuronowej metoda tworzenia obrazu, który naśladuje inny obraz pod względem stylu. Użytkownik może przekształcić zdjęcie biegnącego psa w grafikę Katsushiki Hokusai lub wygenerować Mona Lisę Jana Vermeera.
Generative Adversarial Neural Networks (GAN) odpowiadają za tworzenie nowych dzieł sztuki lub obrazów z wykorzystaniem stylu innych obrazów. Są to algorytmy, które składają się z dwóch modeli jednocześnie: generatora, który produkuje treści i dyskryminatora, który je ocenia.
Systemy oparte na GAN mogą rysować obrazy podobne do obrazów ze zbioru danych treningowych, w tym twarze ludzi, twarze kotów, meble i inne obiekty.
Generatywne i kontradyktoryczne sieci neuronowe mogą również pomóc w „ożywieniu” szkicu krajobrazu.
Jednak zdecydowanie najpopularniejszymi narzędziami do tworzenia dzieł sztuki są tekstowe generatory obrazów AI, które wykorzystują modele językowe, takie jak GPT-3 firmy OpenAI.
Dewizą takich systemów jest „wpisz i masz”. Użytkownik musi pomyśleć o dowolnym zapytaniu w języku naturalnym, takim jak „Lama z dredami w kombinezonie astronauty”, a algorytm wygeneruje obraz zgodnie z podpowiedzią.
Opisy tekstowe mogą składać się z ogromnej liczby słów, których dodanie lub usunięcie może drastycznie zmienić wynik. Odgrywają one kluczową rolę w tworzeniu obrazów. Istnieją nawet specjalne rynki, na których ludzie mogą kupić zapytanie o konkretny styl obrazu za pieniądze.
Programiści trenują generatory AI na ogromnych tablicach obrazów i ich tekstowych opisach, szkoląc model do szukania połączeń między nimi. Często wykorzystują też proces dyfuzji – algorytm rozpoczyna generowanie od zestawu losowych punktów i stopniowo poprawia obraz, zbliżając go do danej podpowiedzi i pozbywając się szumu.
Większość popularnych generatorów AI ma ograniczenia w tworzeniu treści: nie mogą przedstawiać nagości, przemocy, realistycznych twarzy ani postaci politycznych. Do takich narzędzi należą OpenAI DALL-E 2, Google Imagen i Midjourney. Czasami za korzystanie z nich pobierana jest opłata.
Istnieją jednak systemy pozbawione takich ograniczeń, jak np. Stable Diffusion. Twórca narzędzia Stability AI powiedział, że model nie posiada żadnych filtrów i może tworzyć dowolne treści.
Tekstowe generatory obrazów mogą być używane do udoskonalania gotowych prac. W sierpniu OpenAI wprowadziło Outpainting, czyli funkcję, która pozwala DALL-E 2 rozszerzać obrazy o podpowiedzi.
Ile kosztuje stworzenie sieci neuronowej?
To jest bardzo niejednoznaczne pytanie,. Odpowiedź brzmi: od zera do kilkuset milionów dolarów.
Na początek stworzenie i wytrenowanie algorytmu AI wymaga wiedzy. Użytkownicy bez umiejętności programowania lub chęci wydawania pieniędzy na kursy muszą najpierw zrozumieć, jak działają sieci neuronowe. Istnieje wiele darmowych artykułów, zasobów i usług, takich jak projekt edukacyjny Google’s Teachable Machine.
Będziesz także potrzebował języka programowania, takiego jak Python, oraz biblioteki do tworzenia i szkolenia sieci neuronowych, takiej jak TensorFlow, PyTorch lub innej.
Poza tym musisz zbudować treningowy zbiór danych dla wymaganego zadania: możesz go stworzyć samodzielnie, uzyskać z otwartych źródeł lub kupić. Do opracowania generatora obrazów na żądanie potrzebny jest zestaw obrazów i ich opisów tekstowych.
Dokładność modelu zależy bezpośrednio od jakości i ilości danych. Wpływ na to ma również wykorzystywany sprzęt i zużyte zasoby obliczeniowe.
Mając wszystko powyższe, możliwe jest stworzenie sieci neuronowej obrazu za darmo.
Jednak duże firmy, takie jak Meta, Amazon, Apple, Microsoft czy Alphabet, inwestują w takie produkty dziesiątki miliardów dolarów. Koszty te obejmują badania, rozwój, szkolenia, walidację, wdrożenie, komercjalizację i wsparcie technologii. Czasami proces ten trwa latami i może doprowadzić do zamknięcia projektu lub, alternatywnie, uczynić go niezastąpionym.
Zalety i wady algorytmów AI w sztuce
Wśród zalet stosowania sieci neuronowych do tworzenia dzieł sztuki jest generowanie realistycznych danych. Takie obrazy znajdą zastosowanie w filmach, reklamach, grach i innych dziedzinach.
Algorytmy AI myślą „poza schematem”. Potrafią tworzyć nieznane wcześniej obrazy, układać obiekty w nietypowy sposób, mieszać tekstury w oryginalny sposób. Taka sztuka może być źródłem inspiracji dla bardziej ambitnych projektów.
Poprzez ciągłe unowocześnianie technologii i danych, sztuka AI również ewoluuje i stale przynosi nowe pomysły.
Ponadto algorytmy mogą przyspieszyć wykonywanie niektórych zadań. Sieci neuronowe mogą być wykorzystywane do tworzenia logotypów, klipów i w celach marketingowych.
Do wad należy zaliczyć brak ludzkich emocji. To czasem zaleta, ale tworząc dzieło sztuki, wiele osób potrzebuje jakiejś historii lub fabuły.
Ze względu na ograniczone zestawy danych treningowych, sztuka AI może stać się nudna. Bez ciągłego uaktualniania i trenowania na nowych zbiorach danych, generowane obrazy zaczną się powtarzać i stracą swoją unikalność.
Twórcy nie mogą też kontrolować procesu twórczego sieci neuronowych. Po treningu algorytm wyprowadza wynik na podstawie zadanych wag, a jeśli nie będzie on satysfakcjonujący, model będzie musiał zostać przekwalifikowany.
Ale główne problemy z wykorzystaniem AI dotyczą etyki. Twórcy nie zawsze mogą kontrolować rozpowszechnianie i stosowanie technologii. Algorytmy nie mogą być uznane za autorów dzieł, ale za ich nieprawidłowe „zachowanie” odpowiadają twórcy.
Ze względu na dostępność technologii, napastnicy mogą wykorzystać AI do tworzenia obrazów w celu oszukania ludzi, kradzieży ich tożsamości i rozpowszechniania mowy nienawiści.
Czy sieci neuronowe zastąpią artystów?
Fotografia była kiedyś uważana za nową falę kreatywności. Po prawie 200 latach istnienia nie zastąpiła artystów i twórców w sztuce, ale zmusiła ich do ewolucji i adaptacji.
Stworzyła nowe pokolenie kreatywnych ludzi. Artyści i fotografowie zaczęli wspólnie tworzyć dzieła sztuki, które mogły zaskakiwać, przyciągać i prowokować myśli o pięknie.
Sztuka, w jakiejkolwiek formie, sprawia, że ludzie czują. I jest tu mnóstwo miejsca na nowe oblicza artystyczne zdolne wywołać nieznane dotąd doznania.
Twórcy generatywnej AI mogą nieco przesunąć istniejące formy kreatywności, ale ich nie zniszczą.
Narzędzia takie jak DALL-E 2, Stable Diffusion i Midjourney prawdopodobnie będą nadal przekształcać się w wysoce zaawansowane silniki artystyczne i pomagać artystom w ich pracy.
Dzięki wystarczającej ilości i ciągłemu rozwojowi sieci neuronowych ludzie będą mogli regularnie korzystać z tej technologii, aby inspirować i poszerzać swoje możliwości ideacyjne.