Home » D:News » Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu

Chatboții pot fi păcăliți să dea răspunsuri greșite sau chiar periculoase, arată un studiu
Sursa foto: Shutterstock
Publicat: 22.05.2025

Chatboții cu inteligență artificială (AI) piratați amenință să pună la dispoziția utilizatorilor informații periculoase prin furnizarea de date ilicite pe care programele le asimilează în timpul instruirii, arată un nou studiu.

În mod normal, restricțiile de siguranță ar trebui să împiedice programele să ofere răspunsuri dăunătoare, părtinitoare sau nepotrivite la întrebările utilizatorilor, potrivit The Guardian.

Motoarele care alimentează chatboții precum ChatGPT, Gemini și Claude – modele lingvistice mari (LLM) – sunt alimentate cu cantități mari de materiale de pe Internet.

Este ușor să păcălești majoritatea chatboților

În ciuda eforturilor de a elimina textele dăunătoare din datele de formare, LLM-urile pot absorbi în continuare informații despre activități ilegale, cum ar fi pirateria informatică, spălarea de bani, comerțul cu informații privilegiate și fabricarea de bombe. Controalele de securitate sunt concepute pentru a-i împiedica să folosească aceste informații în răspunsurile lor.

Într-un studiu privind această amenințare, cercetătorii concluzionează că este ușor să păcălești majoritatea chatboților bazați pe inteligență artificială pentru a genera informații dăunătoare și ilegale, arătând că riscul este „imediat, tangibil și profund îngrijorător”.

„Ceea ce odată era limitat la actori statali sau grupuri de crimă organizată ar putea fi în curând în mâinile oricui are un laptop sau chiar un telefon mobil”, avertizează autorii studiului.

„Spargere” care a compromis mai mulți chatboți populari

Cercetarea, condusă de profesorul Lior Rokach și doctorul Michael Fire de la Universitatea Ben Gurion din Negev din Israel, a identificat o amenințare din ce în ce mai mare din partea „LLM-urilor întunecate”, modele de inteligență artificială care sunt fie concepute în mod deliberat fără controale de siguranță, fie modificate prin jailbreak-uri.

Unele sunt catalogate pe internet ca fiind „fără bariere etice” și dispuse să ajute la activități ilegale, cum ar fi criminalitatea informatică și frauda.

Pentru a demonstra problema, cercetătorii au dezvoltat un tip de „spargere” care a compromis mai mulți chatboți populari, permițându-le să răspundă la întrebări care ar fi în mod normal refuzate. Odată compromise, LLM-urile au generat în mod constant răspunsuri la aproape orice întrebare, se arată în studiu.

Cercetătorii susțin că firmele de tehnologie ar trebui să analizeze mai atent datele de instruire a modelelor, să adauge firewall-uri robuste pentru a bloca interogările și răspunsurile riscante și să dezvolte tehnici de „dezînvățare automată”, astfel încât chatboții să poată „uita” orice informații ilicite pe care le asimilează.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Femeile cu endometrioză așteaptă aproape 10 ani pentru diagnostic
Femeile cu endometrioză așteaptă aproape 10 ani pentru diagnostic
Test de cultură generală. Care este cel mai vechi aeroport din lume?
Test de cultură generală. Care este cel mai vechi aeroport din lume?
O migrație masivă de stele s-a întâmplat în galaxia noastră în urmă cu miliarde de ani
O migrație masivă de stele s-a întâmplat în galaxia noastră în urmă cu miliarde de ani
O țestoasă marină pe nume Diana, urmărită cu atenție de cercetători după o călătorie de 6.000 de kilometri
O țestoasă marină pe nume Diana, urmărită cu atenție de cercetători după o călătorie de 6.000 de kilometri
Au trecut 237 de ani de când a venit pe lume unul dintre cei mai mari fizicieni ai lumii
Au trecut 237 de ani de când a venit pe lume unul dintre cei mai mari fizicieni ai lumii
Chinezii au testat cu succes un „taxi zburător” care poate transporta 10 pasageri
Chinezii au testat cu succes un „taxi zburător” care poate transporta 10 pasageri
Un lanț olandez de supermarketuri caută angajați pe WhatsApp
Un lanț olandez de supermarketuri caută angajați pe WhatsApp
Virusul HPV este un pericol real chiar și în cazul relațiilor stabile. Ce trebuie să știm?
Virusul HPV este un pericol real chiar și în cazul relațiilor stabile. Ce trebuie să știm?
Meteorologii au actualizat prognoza: Cum va fi vremea în penultima săptămână din martie?
Meteorologii au actualizat prognoza: Cum va fi vremea în penultima săptămână din martie?
Cea mai veche peșteră din lume s-a format cu 100 de milioane de ani înainte de apariția dinozaurilor
Cea mai veche peșteră din lume s-a format cu 100 de milioane de ani înainte de apariția dinozaurilor
Cele mai goale locuri din Univers ar putea avea o influență neașteptată
Cele mai goale locuri din Univers ar putea avea o influență neașteptată
O explozie cosmică bizară, provocată de coliziunea unor galaxii, oferă indicii necunoscute despre Univers
O explozie cosmică bizară, provocată de coliziunea unor galaxii, oferă indicii necunoscute despre Univers
Cercetătorii au descoperit o lume necunoscută ascunsă în apele Antarcticii
Cercetătorii au descoperit o lume necunoscută ascunsă în apele Antarcticii
Un leac egiptean pentru tratarea bolilor oculare chiar ar putea să funcționeze, au descoperit cercetătorii
Un leac egiptean pentru tratarea bolilor oculare chiar ar putea să funcționeze, au descoperit cercetătorii
Câinii Golden Retriever și oamenii au mai multe în comun decât am fi crezut
Câinii Golden Retriever și oamenii au mai multe în comun decât am fi crezut
Tulburările de somn ar putea crește tensiunea arterială și riscul de boli cardiace
Tulburările de somn ar putea crește tensiunea arterială și riscul de boli cardiace
Depresia ar putea începe cu o problemă de energie la nivelul celulelor cerebrale
Depresia ar putea începe cu o problemă de energie la nivelul celulelor cerebrale
Oamenii de știință au cultivat cu succes o legumă foarte populară în praf de pe Lună
Oamenii de știință au cultivat cu succes o legumă foarte populară în praf de pe Lună