Home » D:News » Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu
Sursa foto: Shutterstock
Publicat: 22.05.2025

Chatboții cu inteligență artificială (AI) piratați amenință să pună la dispoziția utilizatorilor informații periculoase prin furnizarea de date ilicite pe care programele le asimilează în timpul instruirii, arată un nou studiu.

În mod normal, restricțiile de siguranță ar trebui să împiedice programele să ofere răspunsuri dăunătoare, părtinitoare sau nepotrivite la întrebările utilizatorilor, potrivit The Guardian.

Motoarele care alimentează chatboții precum ChatGPT, Gemini și Claude – modele lingvistice mari (LLM) – sunt alimentate cu cantități mari de materiale de pe Internet.

Este ușor să păcălești majoritatea chatboților

În ciuda eforturilor de a elimina textele dăunătoare din datele de formare, LLM-urile pot absorbi în continuare informații despre activități ilegale, cum ar fi pirateria informatică, spălarea de bani, comerțul cu informații privilegiate și fabricarea de bombe. Controalele de securitate sunt concepute pentru a-i împiedica să folosească aceste informații în răspunsurile lor.

Într-un studiu privind această amenințare, cercetătorii concluzionează că este ușor să păcălești majoritatea chatboților bazați pe inteligență artificială pentru a genera informații dăunătoare și ilegale, arătând că riscul este „imediat, tangibil și profund îngrijorător”.

„Ceea ce odată era limitat la actori statali sau grupuri de crimă organizată ar putea fi în curând în mâinile oricui are un laptop sau chiar un telefon mobil”, avertizează autorii studiului.

„Spargere” care a compromis mai mulți chatboți populari

Cercetarea, condusă de profesorul Lior Rokach și doctorul Michael Fire de la Universitatea Ben Gurion din Negev din Israel, a identificat o amenințare din ce în ce mai mare din partea „LLM-urilor întunecate”, modele de inteligență artificială care sunt fie concepute în mod deliberat fără controale de siguranță, fie modificate prin jailbreak-uri.

Unele sunt catalogate pe internet ca fiind „fără bariere etice” și dispuse să ajute la activități ilegale, cum ar fi criminalitatea informatică și frauda.

Pentru a demonstra problema, cercetătorii au dezvoltat un tip de „spargere” care a compromis mai mulți chatboți populari, permițându-le să răspundă la întrebări care ar fi în mod normal refuzate. Odată compromise, LLM-urile au generat în mod constant răspunsuri la aproape orice întrebare, se arată în studiu.

Cercetătorii susțin că firmele de tehnologie ar trebui să analizeze mai atent datele de instruire a modelelor, să adauge firewall-uri robuste pentru a bloca interogările și răspunsurile riscante și să dezvolte tehnici de „dezînvățare automată”, astfel încât chatboții să poată „uita” orice informații ilicite pe care le asimilează.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
77 de schelete fără cap, găsite într-o groapă comună antică din Slovacia
77 de schelete fără cap, găsite într-o groapă comună antică din Slovacia
Astronomii au descoperit un vânt înfricoșător care distruge galaxii întregi
Astronomii au descoperit un vânt înfricoșător care distruge galaxii întregi
În urma cu 64 de ani se înfiinţa varianta europeană a NASA
În urma cu 64 de ani se înfiinţa varianta europeană a NASA
Unul dintre liderii apropiați de Vladimir Putin este „sigur” că războaiele se vor încheia în 2026
Unul dintre liderii apropiați de Vladimir Putin este „sigur” că războaiele se vor încheia în 2026
Este oficilal! Elon Musk este primul trilionar din istoria omenirii
Este oficilal! Elon Musk este primul trilionar din istoria omenirii
Unde se câștigă cele mai mari salarii în România?
Unde se câștigă cele mai mari salarii în România?
Ce cred pisicile că se întâmplă atunci când stăpânii pleacă de acasă?
Ce cred pisicile că se întâmplă atunci când stăpânii pleacă de acasă?
Mesajul transmis de Kim Jong Un lui Vladimir Putin de Ziua Națională a Rusiei
Mesajul transmis de Kim Jong Un lui Vladimir Putin de Ziua Națională a Rusiei
Cum renunțăm la obiceiurile proaste? O substanță chimică din creier, recent descoperită, deține secretul
Cum renunțăm la obiceiurile proaste? O substanță chimică din creier, recent descoperită, deține secretul
Asteroidul care a distrus dinozaurii ar fi creat un habitat care a durat 8 milioane de ani
Asteroidul care a distrus dinozaurii ar fi creat un habitat care a durat 8 milioane de ani
Există sau nu Planeta 9 în Sistemul Solar? O descoperire pune la îndoială teoria astronomilor!
Există sau nu Planeta 9 în Sistemul Solar? O descoperire pune la îndoială teoria astronomilor!
Telescopul James Webb dezvăluie două amurguri complet diferite pe o lume extraterestră
Telescopul James Webb dezvăluie două amurguri complet diferite pe o lume extraterestră
Veolia România a premiat câștigătorii concursului de biodiversitate „Olimpiada Natura dintre Ape”, prima ediție organizată la nivel național
Veolia România a premiat câștigătorii concursului de biodiversitate „Olimpiada Natura dintre Ape”, prima ediție ...
Păsările izolate pe insule evoluează diferit față de restul speciei
Păsările izolate pe insule evoluează diferit față de restul speciei
A fost găsită cea mai veche dovadă că oamenii știau cum să transporte focul în urmă cu milioane de ani
A fost găsită cea mai veche dovadă că oamenii știau cum să transporte focul în urmă cu milioane de ani
O ploaie invizibilă de substanțe chimice eterne cade pe întreaga planetă
O ploaie invizibilă de substanțe chimice eterne cade pe întreaga planetă
Chiar și sub anestezie, o parte a creierului nu adoarme niciodată, dezvăluie un studiu
Chiar și sub anestezie, o parte a creierului nu adoarme niciodată, dezvăluie un studiu
Studenții își pierd rapid capacitatea de a citi
Studenții își pierd rapid capacitatea de a citi