Home » D:News » Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu
Sursa foto: Shutterstock
Publicat: 22.05.2025

Chatboții cu inteligență artificială (AI) piratați amenință să pună la dispoziția utilizatorilor informații periculoase prin furnizarea de date ilicite pe care programele le asimilează în timpul instruirii, arată un nou studiu.

În mod normal, restricțiile de siguranță ar trebui să împiedice programele să ofere răspunsuri dăunătoare, părtinitoare sau nepotrivite la întrebările utilizatorilor, potrivit The Guardian.

Motoarele care alimentează chatboții precum ChatGPT, Gemini și Claude – modele lingvistice mari (LLM) – sunt alimentate cu cantități mari de materiale de pe Internet.

Este ușor să păcălești majoritatea chatboților

În ciuda eforturilor de a elimina textele dăunătoare din datele de formare, LLM-urile pot absorbi în continuare informații despre activități ilegale, cum ar fi pirateria informatică, spălarea de bani, comerțul cu informații privilegiate și fabricarea de bombe. Controalele de securitate sunt concepute pentru a-i împiedica să folosească aceste informații în răspunsurile lor.

Într-un studiu privind această amenințare, cercetătorii concluzionează că este ușor să păcălești majoritatea chatboților bazați pe inteligență artificială pentru a genera informații dăunătoare și ilegale, arătând că riscul este „imediat, tangibil și profund îngrijorător”.

„Ceea ce odată era limitat la actori statali sau grupuri de crimă organizată ar putea fi în curând în mâinile oricui are un laptop sau chiar un telefon mobil”, avertizează autorii studiului.

„Spargere” care a compromis mai mulți chatboți populari

Cercetarea, condusă de profesorul Lior Rokach și doctorul Michael Fire de la Universitatea Ben Gurion din Negev din Israel, a identificat o amenințare din ce în ce mai mare din partea „LLM-urilor întunecate”, modele de inteligență artificială care sunt fie concepute în mod deliberat fără controale de siguranță, fie modificate prin jailbreak-uri.

Unele sunt catalogate pe internet ca fiind „fără bariere etice” și dispuse să ajute la activități ilegale, cum ar fi criminalitatea informatică și frauda.

Pentru a demonstra problema, cercetătorii au dezvoltat un tip de „spargere” care a compromis mai mulți chatboți populari, permițându-le să răspundă la întrebări care ar fi în mod normal refuzate. Odată compromise, LLM-urile au generat în mod constant răspunsuri la aproape orice întrebare, se arată în studiu.

Cercetătorii susțin că firmele de tehnologie ar trebui să analizeze mai atent datele de instruire a modelelor, să adauge firewall-uri robuste pentru a bloca interogările și răspunsurile riscante și să dezvolte tehnici de „dezînvățare automată”, astfel încât chatboții să poată „uita” orice informații ilicite pe care le asimilează.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Proiect cultural fără precedent: Constantin Brâncuși, celebrat simultan pe 6 continente
Proiect cultural fără precedent: Constantin Brâncuși, celebrat simultan pe 6 continente
De ce este bine să dezactivezi funcția de WiFi de pe telefon atunci când pleci de acasă?
De ce este bine să dezactivezi funcția de WiFi de pe telefon atunci când pleci de acasă?
Cea mai bună rețetă de Conopidă la cuptor – un deliciu sănătos pentru toată familia (P)
Cea mai bună rețetă de Conopidă la cuptor – un deliciu sănătos pentru toată familia (P)
Meseriile care vor dispărea până în 2030, 2045 sau 2050
Meseriile care vor dispărea până în 2030, 2045 sau 2050
O nouă analiză ADN rescrie povestea unei femei care a trăit acum aproape 2.000 de ani
O nouă analiză ADN rescrie povestea unei femei care a trăit acum aproape 2.000 de ani
Pământurile rare care pun Groenlanda pe harta marilor mize globale
Pământurile rare care pun Groenlanda pe harta marilor mize globale
Gripă sau răceală? Testul de 60 de secunde care te ajută să îți dai seama
Gripă sau răceală? Testul de 60 de secunde care te ajută să îți dai seama
De ce aleg berzele să zboare împreună și cum își perfecționează rutele de migrație pe parcursul vieții?
De ce aleg berzele să zboare împreună și cum își perfecționează rutele de migrație pe parcursul vieții?
Arheologii au descoperit trompeta cu care celții îi înspăimântau pe romani în bătălie
Arheologii au descoperit trompeta cu care celții îi înspăimântau pe romani în bătălie
Ikigai, filozofia japoneză care te ajută să găsești sensul vieții în fiecare zi
Ikigai, filozofia japoneză care te ajută să găsești sensul vieții în fiecare zi
Fenomenul „365 de nasturi”: cum un comentariu pe TikTok a devenit filozofia anului 2026
Fenomenul „365 de nasturi”: cum un comentariu pe TikTok a devenit filozofia anului 2026
Trucul simplu și confirmat științific prin care poți reduce anxietatea
Trucul simplu și confirmat științific prin care poți reduce anxietatea
Cele 3 semne clare că scrâșnești din dinți fără să-ți dai seama!
Cele 3 semne clare că scrâșnești din dinți fără să-ți dai seama!
Test de cultură generală. Care este diferența dintre sodiu și sare?
Test de cultură generală. Care este diferența dintre sodiu și sare?
Impresionant: A fost dezvăluită cea mai clară hartă a distribuției materiei întunecate
Impresionant: A fost dezvăluită cea mai clară hartă a distribuției materiei întunecate
Meteorologii anunță că încă nu scăpăm de frig! Ce urmează în următoarele două săptămâni?
Meteorologii anunță că încă nu scăpăm de frig! Ce urmează în următoarele două săptămâni?
Plasturii wellness, noul accesoriu pe care medicii îl compară cu un ceai scump
Plasturii wellness, noul accesoriu pe care medicii îl compară cu un ceai scump
ONG-ul care lansează cursuri de nutriție pentru pacienții oncologici
ONG-ul care lansează cursuri de nutriție pentru pacienții oncologici