OpenAI wydaje się na razie ukrywać nowe narzędzie, które może wykrywać treści generowane przez ChatGPT. Narzędzie to jest podobno „bardzo dokładne”. Decyzja ta wynika z obaw, że narzędzie może zostać zmanipulowane, a użytkownicy nieanglojęzyczni nie będą mieli dostępu do niezawodnego generowania tekstu za pomocą modeli AI.
Praca nad metodami identyfikacji treści AI
W maju firma poinformowała we wpisie na blogu, że pracuje nad różnymi metodami identyfikacji treści generowanych przez jej produkty. Jednak zgodnie z ekskluzywnym raportem Wall Street Journal (WSJ) z 4 sierpnia, plany wydania tych narzędzi utknęły w martwym punkcie z powodu wewnętrznych dyskusji na temat możliwych konsekwencji.
Po raporcie WSJ, OpenAI zaktualizowało swój wpis na blogu z maja o nowe informacje na temat narzędzi wykrywających. Firma wskazała, że nadal nie ma harmonogramu ich wydania, mimo że co najmniej jedno narzędzie ma być „bardzo dokładne, a nawet skuteczne w walce z lokalnymi manipulacjami”.
Wykrywanie wciąż można ominąć
OpenAI stwierdziło, że nadal istnieją metody, dzięki którym złośliwi aktorzy mogą ominąć wykrywanie, dlatego firma nie chce upubliczniać narzędzia.
Ponadto sugeruje, że osoby nieanglojęzyczne mogą być potencjalnie „napiętnowane” podczas korzystania z produktów AI do pisania funkcji. Wynika to z exploita, który tłumaczy angielski tekst na inny język, aby uniknąć wykrycia.
„Innym ważnym ryzykiem, które rozważamy, jest to, że nasze badania sugerują, że metoda znakowania wodnego tekstu może mieć nieproporcjonalny wpływ na niektóre grupy. Na przykład może stygmatyzować wykorzystanie sztucznej inteligencji jako użytecznego narzędzia do pisania dla osób nieanglojęzycznych.”
Chociaż obecnie dostępnych jest kilka produktów i usług, które twierdzą, że są w stanie wykryć treści generowane przez sztuczną inteligencję, żadna z nich, według naszej wiedzy, nie udowodniła wysokiego stopnia dokładności. Sprawdź nasz artykuł: jak sprawdzić czy tekst pisała AI
Narzędzie wykrywające OpenAI jest pierwszym wewnętrznie opracowanym systemem, który opiera się na niewidocznych znakach wodnych i zastrzeżonych metodach wykrywania treści generowanych specjalnie przez modele firmy.