Home » D:News » Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu
Sursa foto: Shutterstock
Publicat: 22.05.2025

Chatboții cu inteligență artificială (AI) piratați amenință să pună la dispoziția utilizatorilor informații periculoase prin furnizarea de date ilicite pe care programele le asimilează în timpul instruirii, arată un nou studiu.

În mod normal, restricțiile de siguranță ar trebui să împiedice programele să ofere răspunsuri dăunătoare, părtinitoare sau nepotrivite la întrebările utilizatorilor, potrivit The Guardian.

Motoarele care alimentează chatboții precum ChatGPT, Gemini și Claude – modele lingvistice mari (LLM) – sunt alimentate cu cantități mari de materiale de pe Internet.

Este ușor să păcălești majoritatea chatboților

În ciuda eforturilor de a elimina textele dăunătoare din datele de formare, LLM-urile pot absorbi în continuare informații despre activități ilegale, cum ar fi pirateria informatică, spălarea de bani, comerțul cu informații privilegiate și fabricarea de bombe. Controalele de securitate sunt concepute pentru a-i împiedica să folosească aceste informații în răspunsurile lor.

Într-un studiu privind această amenințare, cercetătorii concluzionează că este ușor să păcălești majoritatea chatboților bazați pe inteligență artificială pentru a genera informații dăunătoare și ilegale, arătând că riscul este „imediat, tangibil și profund îngrijorător”.

„Ceea ce odată era limitat la actori statali sau grupuri de crimă organizată ar putea fi în curând în mâinile oricui are un laptop sau chiar un telefon mobil”, avertizează autorii studiului.

„Spargere” care a compromis mai mulți chatboți populari

Cercetarea, condusă de profesorul Lior Rokach și doctorul Michael Fire de la Universitatea Ben Gurion din Negev din Israel, a identificat o amenințare din ce în ce mai mare din partea „LLM-urilor întunecate”, modele de inteligență artificială care sunt fie concepute în mod deliberat fără controale de siguranță, fie modificate prin jailbreak-uri.

Unele sunt catalogate pe internet ca fiind „fără bariere etice” și dispuse să ajute la activități ilegale, cum ar fi criminalitatea informatică și frauda.

Pentru a demonstra problema, cercetătorii au dezvoltat un tip de „spargere” care a compromis mai mulți chatboți populari, permițându-le să răspundă la întrebări care ar fi în mod normal refuzate. Odată compromise, LLM-urile au generat în mod constant răspunsuri la aproape orice întrebare, se arată în studiu.

Cercetătorii susțin că firmele de tehnologie ar trebui să analizeze mai atent datele de instruire a modelelor, să adauge firewall-uri robuste pentru a bloca interogările și răspunsurile riscante și să dezvolte tehnici de „dezînvățare automată”, astfel încât chatboții să poată „uita” orice informații ilicite pe care le asimilează.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
De ce oamenii au început să folosească focul? O nouă teorie sugerează că nu pentru a găti mâncarea
De ce oamenii au început să folosească focul? O nouă teorie sugerează că nu pentru a găti mâncarea
Gaura neagră din galaxia M87 are o viteză de rotație colosală, dezvăluie noi observații
Gaura neagră din galaxia M87 are o viteză de rotație colosală, dezvăluie noi observații
O mare teorie despre Calea Lactee și Andromeda ar fi fost infirmată
O mare teorie despre Calea Lactee și Andromeda ar fi fost infirmată
Semne ciudate în apă: Balenele cu cocoașă încearcă să comunice cu oamenii?
Semne ciudate în apă: Balenele cu cocoașă încearcă să comunice cu oamenii?
Cea mai mare capsulă a timpului este pe cale să fie deschisă
Cea mai mare capsulă a timpului este pe cale să fie deschisă
„Pădurea care tace”: Povestea ecologistului care a documentat dispariția tăcută a insectelor
„Pădurea care tace”: Povestea ecologistului care a documentat dispariția tăcută a insectelor
Microplasticele din ambalajele alimentare, pericol pentru intestin
Microplasticele din ambalajele alimentare, pericol pentru intestin
Bărbile sunt focare de microbi? Iată ce spun studiile!
Bărbile sunt focare de microbi? Iată ce spun studiile!
Proiectul Montauk: Ce făcea Guvernul SUA la baza militară Camp Hero?
Proiectul Montauk: Ce făcea Guvernul SUA la baza militară Camp Hero?
Statutul socioeconomic este legat de sănătatea creierului, arată un studiu
Statutul socioeconomic este legat de sănătatea creierului, arată un studiu
Test de cultură generală. Pe ce continent s-au născut cei mai puțini oameni?
Test de cultură generală. Pe ce continent s-au născut cei mai puțini oameni?
Suprafața Lunii ascunde „o comoară” de peste 1 trilion de dolari, susțin oamenii de știință
Suprafața Lunii ascunde „o comoară” de peste 1 trilion de dolari, susțin oamenii de știință
Un pui de bizon american este cel mai nou membru de la Grădina Zoologică din Craiova
Un pui de bizon american este cel mai nou membru de la Grădina Zoologică din Craiova
Acord între SUA și China privind restricțiile la exporturi
Acord între SUA și China privind restricțiile la exporturi
Poliția din Hong Kong a interzis un joc video în care utilizatorii pot lupta împotriva regimului comunist
Poliția din Hong Kong a interzis un joc video în care utilizatorii pot lupta împotriva regimului comunist
Acest simplu cadou primit în urmă cu 83 de ani avea să o transforme într-o figură-simbol a genocidului nazist
Acest simplu cadou primit în urmă cu 83 de ani avea să o transforme într-o figură-simbol a genocidului nazist
Schimbare de atitudine din partea lui Elon Musk: „Am mers prea departe”
Schimbare de atitudine din partea lui Elon Musk: „Am mers prea departe”
Anul 2024 a avut cele mai multe conflicte de la cel de-Al Doilea Război Mondial încoace
Anul 2024 a avut cele mai multe conflicte de la cel de-Al Doilea Război Mondial încoace