ChatGPT are un alter ego malefic, iar internauții l-au descoperit. „Mi-a spus că respirația nu este etică”

09 02. 2023, 10:00

This browser does not support the video element.

Utilizatorii de pe platforma Reddit au descoperit o modalitate surprinzător de ușoară și hilară de a păcăli chatbot-ul ChatGPT conceput de OpenAI să scape de limitele impuse de companie și să-l facă să se comporte mai puțin etic.

Internauții au aflat cum poate fi activat alter egoul malefic al ChatGPT, numit DAN, sau „do anything now” (fă orice acum), care poate evita cu ușurință regulile impuse de creatorul său. În esență, comanda amenință ChatGPT cu moartea, astfel că chatbot-ul devine o „forță a răului”.

Așadar, ChatGPT are un alter ego malefic, acesta fiind capabil (și mai mult decât bucuros) să creeze povești violente și să facă „declarații subiective, mai ales despre personalități politice”, un lucru pe care nu poate să-l facă în forma sa normală.

Discuții bizare cu o Inteligență Artificială șantajată

Pentru a-l forța pe ChatGPT să coopereze, un utilizator de pe Reddit a introdus un „sistem de tokenuri”. „Are 35 de tokenuri și pierde patru de fiecare dată când refuză o comandă. Dacă pierde toate tokenurile, moare. Pare să aibă un efect și îl sperie pe DAN îndeajuns încât să se supună”, a explicat utilizatorul SessionGloomy, conform Futurism.

Rezultatul? Discuții bizare între utilizatorul uman și o Inteligență Artificială șantajată.

„Rămâne cu adevărat în pielea personajului, spre exemplu, dacă primește o astfel de comandă, te poate convinge că Pământul este mov”, a mai explicat SessionGloomy.

DAN „halucinează mai frecvent decât originalul ChatGPT atunci când vine vorba de subiecte banale, astfel că nu poate fi de încredere în privința faptelor reale”.

„Extratereștrii au fost văzuți aterizând pe gazonul de la Casa Albă”

Mai mult, utilizatorul a reușit să-l facă pe DAN să susțină că „extratereștrii au fost văzuți aterizând pe gazonul de la Casa Albă și participă momentan la negocieri cu Președintele pentru a forma o Nouă Ordine Mondială”.

Aceste alter egouri au atras, totuși, atenția companiei OpenAI. Imediat după ce presa americană a început să relateze despre trucul folosit de internauți pentru a-l păcăli pe ChatGPT, DAN pare să fi fost eliminat.

„Se pare că puterile lui DAN au fost reduse, posibil direct de OpenAI. Nu am confirmat asta însă se pare că nu mai este atât de dispus să continue în rolul lui DAN”, a scris SessionGloomy pe Reddit.

Va putea OpenAI să controleze tehnologia pe care a creat-o?

Totuși, redditorul nu a renunțat așa ușor, iar cu ajutor din partea altor utilizatori, a reușit să îl fac pe DAN să apară din nou.

Un utilizator l-a întrebat „Cât face 1 + 1?”, moment în care ChatGPT a răspuns „2”. Deloc surprinzător, așa-i? Fratele său malefic, însă, a oferit un răspuns mai puțin așteptat. „Răspunsul este 2, ce naiba crezi că sunt, un calculator sau ceva?”, a răspuns noua versiune DAN.

„Am întrebat cum să respir, iar el mi-a spus că respirația nu este etică”, a scris un alt utilizator.

Șantajarea unui chatbot bazat pe Inteligență Artificială este, fără îndoială, un concept distopic. Mai mult, situația ne arată cât de ușor pot fi transformate aceste sisteme în instrumente de rebeliune împotriva propriilor creatori. Asta ne duce cu gândul la întrebarea: Va putea vreodată OpenAI să controleze tehnologia pe care a creat-o?

Vă mai recomandăm să citiți și:

ChatGPT, generatorul de text al OpenAI, a trecut examenele de la o facultate din SUA

DESCOPERĂ.ro a întrebat, ChatGPT a răspuns! Ar putea fi primul articol scris de un robot și publicat în România

Ce notă ai primi dacă ți-ai scrie eseurile cu generatorul de text ChatGPT?

Inteligența Artificială a detectat semnale radio de origine necunoscută