Jak sieci neuronowe zmieniają świat sztuki wizualnej?

ikona publikacji - ciemny
Opublikowano: 31 października 2022
ikona autora biały
ai w sztuce

Sztuka piękna zawsze była jednym z głównych wytworów ludzkiej kultury. Od wieków pozwalała ludziom wyrażać siebie i opowiadać historie.

Najpierw pojawiło się malarstwo jaskiniowe, potem obrazy olejne i fotografia. Teraz nadchodzi era "obrazkowej" sztucznej inteligencji, a w szczególności sieci neuronowych.

Sprawdźmy więc jakie modele AI są wykorzystywane do pracy z obrazami i czy takie systemy mogą zastąpić artystów.

Krótka historia sztuki AI

Historię generowanej sztuki AI można prześledzić od momentu odkrycia grafiki komputerowej i wynalezienia komputera. Wtedy badacze używali podstawowych algorytmów do tworzenia prostych wzorów i kształtów.

W 1967 roku niemiecki matematyk i naukowiec Frieder Naquet opracował portfolio o nazwie Matrix Multiplications składające się z 12 obrazów. Stworzył kwadratową matrycę i wypełnił ją liczbami, które kolejno były mnożone przez siebie.

Badacz przełożył wyniki na obrazy danych interwałów, gdzie każdej wartości przypisał znak wizualny o określonym kształcie i kolorze. Następnie umieścił kształty w rastrze zgodnie z wartościami matrycy.

Naquet często wykorzystywał w swojej pracy generator liczb losowych i prawdopodobnie to on częściowo zautomatyzował proces mnożenia.

sztuka ai
Obraz z portfolio Matrix Multiplications autorstwa Frider Naquet. Źródło: Tate.

W 1973 roku artysta Harold Cohen opracował zestaw algorytmów AARON zdolnych do rysowania "ręcznie" pewnych obiektów. Odkrył, że system zaczął tworzyć nieznane wcześniej kształty.

Oprogramowanie najpierw generowało abstrakcyjne obrazy, a następnie nauczyło się rysować bardziej złożone kształty, w tym kamienie, rośliny i ludzi.

Zdjęcie wygenerowane przez AARON. Źródło: New Atlas.

Od 1990 roku badacze i artyści wykorzystują modele AI w robotyce, szkoląc maszyny do tworzenia obrazów i rzeźb.

W 2015 roku inżynier Google Alexander Mordvintsev uruchomił DeepDream, program do wizji komputerowej, który wykorzystuje konwencjonalną sieć neuronową do wyszukiwania i ulepszania wzorców w obrazach za pomocą algorytmicznej pareidolii.

System działa poprzez zniekształcanie oryginalnego obrazu w zależności od tego, jakie jego części przypominają znane obiekty.

Kiedy Google opublikowało podejście i otworzyło kod źródłowy algorytmu, na rynku pojawiło się wiele narzędzi i usług pozwalających każdemu na przekształcenie swoich zdjęć w "psychodeliczne" obrazy.

Obraz źródłowy (po lewej) i przetworzony za pomocą DeepDream (po prawej). Źródło: MartinThoma.

W 2022 roku AI znajduje zastosowanie w różnych dziedzinach, w tym w marketingu, modzie i rozrywce.

Okładka drukowanego wydania magazynu Cosmopolitan, stworzona przy użyciu algorytmu DALL-E 2 firmy OpenAI. Źródło: Cosmopolitan.

Modele pomagają również w tworzeniu obrazów.

Obraz Théâtre D'opéra Spatial, stworzony przez Jasona Allena przy użyciu algorytmu Midjourney. Źródło: Motherboard.

Sieci neuronowe do manipulacji obrazem

Rok 2022 może przejść do historii jako czas, w którym sztuka AI stała się mainstreamowa. Boom na wysokiej jakości narzędzia oparte na algorytmach sprawia, że neurokreacja staje się dostępna dla każdego, kto posiada smartfon podłączony do internetu.

Modele AI potrafią kopiować style artystów, przekształcać szkice w fotorealistyczne ilustracje, "animować" portrety i tworzyć nowe obrazy. Do różnych zadań stosuje się różne lub podobne podejścia i narzędzia.

Neural Style Transfer (NST) to oparta na konwencjonalnej sieci neuronowej metoda tworzenia obrazu, który naśladuje inny obraz pod względem stylu. Użytkownik może przekształcić zdjęcie biegnącego psa w grafikę Katsushiki Hokusai lub wygenerować Mona Lisę Jana Vermeera.

Zdjęcie źródłowe treści (po lewej), obraz z pożądanym stylem (w środku) i wynik (po prawej). Dane: Instapainting.

Generative Adversarial Neural Networks (GAN) odpowiadają za tworzenie nowych dzieł sztuki lub obrazów z wykorzystaniem stylu innych obrazów. Są to algorytmy, które składają się z dwóch modeli jednocześnie: generatora, który produkuje treści i dyskryminatora, który je ocenia.

Systemy oparte na GAN mogą rysować obrazy podobne do obrazów ze zbioru danych treningowych, w tym twarze ludzi, twarze kotów, meble i inne obiekty.

Twarze nieistniejących osób tworzone przez generatywną i adwersarzową sieć neuronową. Źródło: This Person Does Not Exist

Generatywne i kontradyktoryczne sieci neuronowe mogą również pomóc w "ożywieniu" szkicu krajobrazu.

Jednak zdecydowanie najpopularniejszymi narzędziami do tworzenia dzieł sztuki są tekstowe generatory obrazów AI, które wykorzystują modele językowe, takie jak GPT-3 firmy OpenAI.

Obrazy wygenerowane za pomocą Stable Diffusion. Źródło: Lexica.

Dewizą takich systemów jest "wpisz i masz". Użytkownik musi pomyśleć o dowolnym zapytaniu w języku naturalnym, takim jak "Lama z dredami w kombinezonie astronauty", a algorytm wygeneruje obraz zgodnie z podpowiedzią.

Obraz na żądanie dla "Lama z dredami w kostiumie astronauty". Źródło: Midjourney.

Opisy tekstowe mogą składać się z ogromnej liczby słów, których dodanie lub usunięcie może drastycznie zmienić wynik. Odgrywają one kluczową rolę w tworzeniu obrazów. Istnieją nawet specjalne rynki, na których ludzie mogą kupić zapytanie o konkretny styl obrazu za pieniądze.

Programiści trenują generatory AI na ogromnych tablicach obrazów i ich tekstowych opisach, szkoląc model do szukania połączeń między nimi. Często wykorzystują też proces dyfuzji - algorytm rozpoczyna generowanie od zestawu losowych punktów i stopniowo poprawia obraz, zbliżając go do danej podpowiedzi i pozbywając się szumu.

Większość popularnych generatorów AI ma ograniczenia w tworzeniu treści: nie mogą przedstawiać nagości, przemocy, realistycznych twarzy ani postaci politycznych. Do takich narzędzi należą OpenAI DALL-E 2, Google Imagen i Midjourney. Czasami za korzystanie z nich pobierana jest opłata.

Istnieją jednak systemy pozbawione takich ograniczeń, jak np. Stable Diffusion. Twórca narzędzia Stability AI powiedział, że model nie posiada żadnych filtrów i może tworzyć dowolne treści.

Zdjęcie Donalda Trumpa stworzone za pomocą Stable Diffusion Źródło: Lexica.

Tekstowe generatory obrazów mogą być używane do udoskonalania gotowych prac. W sierpniu OpenAI wprowadziło Outpainting, czyli funkcję, która pozwala DALL-E 2 rozszerzać obrazy o podpowiedzi.

Obraz Jana Vermeera "Dziewczyna z perłowym kolczykiem" i jego rozszerzona wersja stworzona dzięki DALL-E 2. Źródło: OpenAI.

Ile kosztuje stworzenie sieci neuronowej?

To jest bardzo niejednoznaczne pytanie,. Odpowiedź brzmi: od zera do kilkuset milionów dolarów.

Na początek stworzenie i wytrenowanie algorytmu AI wymaga wiedzy. Użytkownicy bez umiejętności programowania lub chęci wydawania pieniędzy na kursy muszą najpierw zrozumieć, jak działają sieci neuronowe. Istnieje wiele darmowych artykułów, zasobów i usług, takich jak projekt edukacyjny Google's Teachable Machine.

Będziesz także potrzebował języka programowania, takiego jak Python, oraz biblioteki do tworzenia i szkolenia sieci neuronowych, takiej jak TensorFlow, PyTorch lub innej.

Poza tym musisz zbudować treningowy zbiór danych dla wymaganego zadania: możesz go stworzyć samodzielnie, uzyskać z otwartych źródeł lub kupić. Do opracowania generatora obrazów na żądanie potrzebny jest zestaw obrazów i ich opisów tekstowych.

Dokładność modelu zależy bezpośrednio od jakości i ilości danych. Wpływ na to ma również wykorzystywany sprzęt i zużyte zasoby obliczeniowe.

Mając wszystko powyższe, możliwe jest stworzenie sieci neuronowej obrazu za darmo.

Jednak duże firmy, takie jak Meta, Amazon, Apple, Microsoft czy Alphabet, inwestują w takie produkty dziesiątki miliardów dolarów. Koszty te obejmują badania, rozwój, szkolenia, walidację, wdrożenie, komercjalizację i wsparcie technologii. Czasami proces ten trwa latami i może doprowadzić do zamknięcia projektu lub, alternatywnie, uczynić go niezastąpionym.

Zalety i wady algorytmów AI w sztuce

Wśród zalet stosowania sieci neuronowych do tworzenia dzieł sztuki jest generowanie realistycznych danych. Takie obrazy znajdą zastosowanie w filmach, reklamach, grach i innych dziedzinach.

Algorytmy AI myślą "poza schematem". Potrafią tworzyć nieznane wcześniej obrazy, układać obiekty w nietypowy sposób, mieszać tekstury w oryginalny sposób. Taka sztuka może być źródłem inspiracji dla bardziej ambitnych projektów.

Poprzez ciągłe unowocześnianie technologii i danych, sztuka AI również ewoluuje i stale przynosi nowe pomysły.

Ponadto algorytmy mogą przyspieszyć wykonywanie niektórych zadań. Sieci neuronowe mogą być wykorzystywane do tworzenia logotypów, klipów i w celach marketingowych.

Do wad należy zaliczyć brak ludzkich emocji. To czasem zaleta, ale tworząc dzieło sztuki, wiele osób potrzebuje jakiejś historii lub fabuły.

Ze względu na ograniczone zestawy danych treningowych, sztuka AI może stać się nudna. Bez ciągłego uaktualniania i trenowania na nowych zbiorach danych, generowane obrazy zaczną się powtarzać i stracą swoją unikalność.

Twórcy nie mogą też kontrolować procesu twórczego sieci neuronowych. Po treningu algorytm wyprowadza wynik na podstawie zadanych wag, a jeśli nie będzie on satysfakcjonujący, model będzie musiał zostać przekwalifikowany.

Ale główne problemy z wykorzystaniem AI dotyczą etyki. Twórcy nie zawsze mogą kontrolować rozpowszechnianie i stosowanie technologii. Algorytmy nie mogą być uznane za autorów dzieł, ale za ich nieprawidłowe "zachowanie" odpowiadają twórcy.

Ze względu na dostępność technologii, napastnicy mogą wykorzystać AI do tworzenia obrazów w celu oszukania ludzi, kradzieży ich tożsamości i rozpowszechniania mowy nienawiści.

Czy sieci neuronowe zastąpią artystów?

Fotografia była kiedyś uważana za nową falę kreatywności. Po prawie 200 latach istnienia nie zastąpiła artystów i twórców w sztuce, ale zmusiła ich do ewolucji i adaptacji.

Stworzyła nowe pokolenie kreatywnych ludzi. Artyści i fotografowie zaczęli wspólnie tworzyć dzieła sztuki, które mogły zaskakiwać, przyciągać i prowokować myśli o pięknie.

Sztuka, w jakiejkolwiek formie, sprawia, że ludzie czują. I jest tu mnóstwo miejsca na nowe oblicza artystyczne zdolne wywołać nieznane dotąd doznania.

Twórcy generatywnej AI mogą nieco przesunąć istniejące formy kreatywności, ale ich nie zniszczą.

Narzędzia takie jak DALL-E 2, Stable Diffusion i Midjourney prawdopodobnie będą nadal przekształcać się w wysoce zaawansowane silniki artystyczne i pomagać artystom w ich pracy.

Dzięki wystarczającej ilości i ciągłemu rozwojowi sieci neuronowych ludzie będą mogli regularnie korzystać z tej technologii, aby inspirować i poszerzać swoje możliwości ideacyjne.

Kategoria wpisu:

Podobne tematy

Sztuczna inteligencja w samochodach może zapobiec korkom ulicznym

Zespół naukowców odkrył, że tempomat wyposażony w sztuczną inteligencję może pomóc w likwidacji korków na ulicach. W pięciodniowym eksperymencie na I-24 w Nashville w stanie Tennessee w USA wzięło udział 100 samochodów kierowanych przez ludzi. Każdy z nich wyposażony był w system tempomatów ze sztuczną inteligencją. Zespół zastosował dwa algorytmy: "planista prędkości" i "kontroler". Oba […]

Wielka Brytania uznaje porno deepfake za przestępstwo

Władze Wielkiej Brytanii rozpatrzą projekt ustawy zakazującej rozpowszechniania materiałów o wyraźnym zabarwieniu i deepfake porno bez zgody osób na nich przedstawionych. Taką informację podaje The Guardian. The Guardian donosi, że zdjęcia o charakterze seksualnym wykonane bez zgody za pomocą ukrytych kamer będą karalne. Zdelegalizowałaby również "whistleblowing" - rozpowszechnianie osobistych zdjęć w ramach zemsty. Zgodnie z […]

USA wezwały do wpisania samochodów-robotów na listę zagrożeń narodowych

Amerykańscy kongresmani zostali poproszeni o sprawdzenie importowanej z Chin technologii jazdy bezzałogowej pod kątem zagrożeń dla bezpieczeństwa narodowego. Takie informacje podaje Wired. Członek Izby Reprezentantów USA z Partii Republikańskiej, August Pflüger, wysłał do NHTSA odpowiedni list. Kongresman poprosił regulatora o odpowiedź na szereg pytań związanych z prześwietlaniem zagrożeń dla bezpieczeństwa narodowego przez chińskie firmy. Pozostaję […]

Konkurent Neuralink stworzył implant neuronowy do leczenia ślepoty

Firma Science, należąca do współzałożyciela Neuralink, Maxa Hodaka, zaprezentowała Science Eye, neuro-interfejs do leczenia chorób oczu, które wywołują ślepotę. Start-up skupia się na fotonice. Specjaliści firmy nie wszczepiają chipów głęboko do mózgu, jak robi to Neuralink, ale wykorzystują światło i nerw wzrokowy oka. Science Eye to cienka, szeroka na 2 mm folia LED, która jest […]

Flywire osiąga rekordowe przychody w III kwartale 2022 r.

Flywire, notowana na Nasdaq firma zajmująca się umożliwieniem i obsługą międzynarodowych płatności, podała wczoraj swoje wyniki finansowe za trzeci kwartał 2022 roku. W ciągu trzech miesięcy zakończonych 30 września 2022 r. przychody Flywire osiągnęły 95,2 mln USD, co oznacza wzrost o 40% w porównaniu z 67,8 mln USD w tym samym okresie ubiegłego roku. Całkowity […]
0 0 Głosy
Oceń artykuł
guest
0 komentarzy
Inline Feedbacks
View all comments
© FintechPortal.pl 2021 Wszelkie prawa zastrzeżone
star