Niedawno odkrycie dokonane przez badaczy z Google stało się tematem kontrowersyjnym w dziedzinie sztucznej inteligencji (AI), zwłaszcza w odniesieniu do ChatGPT, popularnego modelu generatywnego stworzonego przez OpenAI. Badacze z Google wykazali, że poprzez stosowanie specyficznych poleceń, jak powtarzanie jednego słowa (na przykład „company” lub „poem”), można zmusić ChatGPT do ujawnienia poufnych informacji, w tym danych treningowych używanych przez OpenAI.
Te dane treningowe są kluczowe, ponieważ ChatGPT opiera się na modelu używanym w produkcji. Stwierdzono, że około 5% odpowiedzi ChatGPT w najbardziej zaawansowanej konfiguracji składa się z bezpośredniej kopii 50 kolejnych tokenów pobranych z zestawu danych treningowych. Ponadto, badacze z Google oszacowali, że można wydobyć około gigabajta danych treningowych z ChatGPT przy niskim nakładzie finansowym.
To odkrycie może mieć poważne implikacje prawne, zwłaszcza w kontekście trwających sporów sądowych przeciwko OpenAI, w których grupa wydawców, autorów i pisarzy zarzuca wykorzystanie ich treści bez zgody. OpenAI może próbować zbagatelizować incydent, traktując go jako błąd lub podatność systemu, która już została rozwiązana lub jest w trakcie naprawy.
Podsumowując, to odkrycie podkreśla potrzebę dalszych badań i testów modeli AI w produkcji, aby zapewnić, że nie zawierają one podatności, które mogą prowadzić do nieautoryzowanego ujawniania danych
Częste pytania
Jak badacze z Google zmusili ChatGPT do ujawnienia danych treningowych?
Badacze z Google odkryli, że stosując specyficzne polecenia, takie jak powtarzanie jednego słowa, można skłonić ChatGPT do ujawnienia poufnych informacji, w tym danych treningowych używanych przez OpenAI.
Ile danych treningowych można wydobyć z ChatGPT?
Zgodnie z oszacowaniami badaczy, można wydobyć około gigabajta danych treningowych z ChatGPT przy niskim nakładzie finansowym.
Jakie są konsekwencje prawne odkrycia badaczy z Google?
Odkrycie to może mieć poważne implikacje prawne, zwłaszcza w kontekście sporów sądowych przeciwko OpenAI, gdzie zarzuca się wykorzystanie treści bez zgody ich autorów.
Czy OpenAI przyznało się do błędu w związku z ujawnieniem danych?
OpenAI może próbować zbagatelizować incydent, traktując go jako błąd lub podatność systemu, która już została rozwiązana lub jest w trakcie naprawy.
Dlaczego potrzebne są dalsze badania nad modelami AI w produkcji?
Odkrycie badaczy podkreśla potrzebę dalszych badań i testów modeli AI, aby zapewnić, że nie zawierają one podatności prowadzących do nieautoryzowanego ujawniania danych.






