OpenAI prezentuje model generacji obrazów POINT-E 3D

ikona publikacji - ciemny
Opublikowano: 22 grudnia 2022
ikona autora biały
openai

OpenAI udostępniło nowy algorytm generowania obrazów 3D przez zapytanie tekstowe POINT-E.

Według badań, model ten wymaga jednego procesora graficznego Nvidia V100 i około dwóch minut na stworzenie obrazu.

Algorytm nie tworzy obiektów 3D w tradycyjnym rozumieniu. Generuje "chmury punktów" lub dyskretne zestawy punktów danych w przestrzeni, które reprezentują trójwymiarowy kształt.

Badacze zauważyli, że takie dane są obliczeniowo łatwiejsze do zsyntetyzowania. Nie obejmują one jednak szczegółowej struktury, kształtu czy faktury obiektu.

Aby obejść to ograniczenie, zespół OpenAI wytrenował dodatkowy system AI do konwersji chmur punktów POINT-E na siatki.

Sam POINT-E składa się z dwóch części:

  • Model konwersji tekstu na obraz;
  • Model konwersji obrazów 3D.

Model konwersji tekstu na obraz działa podobnie jak w DALL-E 2. Został wytrenowany na etykietowanych obrazach, dzięki czemu algorytm rozumie skojarzenia między słowami a pojęciami wizualnymi.

Model image-to-3D został wytrenowany na parach obraz-trójwymiarowy obiekt.

Na przykład, jeśli wprowadzono zapytanie tekstowe "Cat eats burrito", POINT-E najpierw wygeneruje syntetyczny obraz zgodnie ze wskazówką tekstową. Drugi model zsyntetyzuje następnie przybliżoną "chmurę" z 1024 punktów, a następnie wzmocni obiekt 3D do 4096 punktów.

Po wytrenowaniu modeli na zbiorze danych "kilku milionów" obiektów 3D i związanych z nimi metadanych, naukowcy stwierdzili, że POINT-E może tworzyć kolorowe chmury punktów, aby dopasować je do wskazówek tekstowych. Uznali oni nieidealną wydajność modelu, ale zwrócili uwagę na szybkość generowania.

"Chociaż nasza metoda ma gorsze wyniki w tej ocenie niż metody state-of-the-art, daje próbki w niewielkim ułamku czasu. Może to uczynić go bardziej praktycznym dla niektórych zastosowań lub pozwolić na lepsze wykrywanie obiektów 3D"

OpenAI zamieściło otwarty kod źródłowy projektów na GitHubie.

Przypomnijmy, że w grudniu firma wprowadziła ChatGPT, chatbota opartego na rozbudowanym modelu językowym.

W kwietniu OpenAI wydało drugą wersję tekstowego generatora obrazów DALL-E.

Kategoria wpisu:

Podobne tematy

Sztuczna inteligencja: ogromny trend technologiczny czy bańka?

Wprowadzenie ChatGPT przez OpenAI i związany z tym szum sprawiły, że generatywna AI znalazła się na radarze firm venture capital i technologicznych, które chcą zainwestować pieniądze w czasach kryzysu. Narzędzia generatywnej sztucznej inteligencji OpenAI mogą pozornie robić wszystko, od pisania poezji i kodu po tworzenie dzieł sztuki. wywołało wiele emocji w tej dziedzinie. A zarówno […]

Revolut opóźnia wydanie własnej kryptowaluty

Revolut, londyński challenger bank z siedzibą w Londynie, opóźnił uruchomienie swojej natywnej kryptowaluty o nazwie RevCoin. Financial News (FN) poinformował, że upadek giełdy kryptowalut FTX może być głównym powodem, powołując się na osoby zaznajomione ze sprawą. Revolut opóźnia debiut RevCoin Kryptowaluta miała ujrzeć światło dzienne pod koniec ubiegłego roku, ale plany Revoluta uległy zmianie. Przedłużająca […]

Akcje Google (GOOGL)  - jak inwestować, cena, kurs, wykres, dywidendy, gdzie kupić

Google (Alphabet) to amerykańska firma technologiczna, która zaczynała od produktów i usług w branży internetowej i oprogramowania komputerowego. Dziś jednak jej macki sięgają znacznie dalej i można ją nazwać gigantem technologicznym. Jest właścicielem wielu spółek zależnych, które zajmują się rozwojem sztucznej inteligencji, uczenia maszynowego, technologii chmury czy środków służących poprawie ludzkiego zdrowia. W 2009 roku […]

Tysiące użytkowników PayPal ofiarą wycieku danych

Konta 34 942 użytkowników PayPal zostały zhakowane między 2 a 6 grudnia 2022 roku przez nieuprawnione osoby poprzez atak typu credential stuffing. Hakerzy potencjalnie uzyskali dostęp do danych osobowych klientów, w tym ich imienia i nazwiska, adresu, daty urodzenia, numeru identyfikacji podatkowej i numeru ubezpieczenia społecznego. Ataki typu credential stuffing mają miejsce, gdy hakerzy próbują […]

Akcje Apple (AAPL) - jak inwestować, cena, kurs, wykres, dywidendy, gdzie kupić

Na świecie jest ponad 600 milionów użytkowników Apple. Posiadają oni około 1,4 miliarda aktywnych urządzeń Apple (iPhone, iPad, iPod, Mac i inne). Same te liczby są niesamowite, a także stawiają Apple w czołówce najbardziej wartościowych firm na świecie (według magazynu Forbes). To oczywiście czyni firmę bardzo interesującą z perspektywy inwestowania w akcje. W tym obszernym […]
0 0 Głosy
Oceń artykuł
guest
0 komentarzy
Inline Feedbacks
View all comments
© FintechPortal.pl 2021 Wszelkie prawa zastrzeżone
star