Home » D:News » Testele care verifică siguranța și eficacitatea Inteligenței Artificiale, profund eronate

Testele care verifică siguranța și eficacitatea Inteligenței Artificiale, profund eronate

Testele care verifică siguranța și eficacitatea Inteligenței Artificiale, profund eronate
Sursa foto: Shutterstock
Publicat: 06.11.2025

Experții au descoperit puncte slabe, unele grave, în sute de teste utilizate pentru a verifica siguranța și eficacitatea noilor modele de inteligență artificială (IA) lansate pe piață.

Informaticieni de la Institutul de Securitate IA al guvernului britanic și experți de la universități precum Stanford, Berkeley și Oxford au examinat peste 440 de teste de referință care oferă o importantă plasă de siguranță.

Ei au descoperit defecte care „subminează validitatea afirmațiilor rezultate”, că „aproape toate … au puncte slabe în cel puțin un domeniu”, iar scorurile rezultate ar putea fi „irelevante sau chiar înșelătoare”.

Defăimarea caracterului și sinucidere

Multe dintre criteriile de referință sunt utilizate pentru a evalua cele mai recente modele de IA lansate de marile companii de tehnologie, a declarat autorul principal al studiului, Andrew Bean, cercetător la Oxford Internet Institute.

În absența unei reglementări naționale privind IA în Marea Britanie și SUA, criteriile de referință sunt utilizate pentru a verifica dacă noile IA sunt sigure, se aliniază intereselor umane și își ating capacitățile declarate în materie de raționament, matematică și codificare, potrivit The Guardian.

Ancheta privind testele are loc pe fondul preocupărilor crescânde cu privire la siguranța și eficacitatea AI-urilor, care sunt lansate într-un ritm rapid de către companiile tehnologice concurente. Unele dintre acestea au fost recent obligate să retragă sau să înăsprească restricțiile privind IA-urile după ce acestea au contribuit la prejudicii variind de la defăimarea caracterului până la sinucidere.

Acuzații nefondate despre un senator american

„Criteriile de referință stau la baza aproape tuturor afirmațiilor privind progresele în domeniul IA”, a spus Bean. „Dar fără definiții comune și măsurători fiabile, devine dificil să știm dacă modelele se îmbunătățesc cu adevărat sau doar par să o facă”.

Google a retras una dintre cele mai recente IA-uri ale sale, Gemma, după ce aceasta a inventat acuzații nefondate despre un senator american care ar fi avut o relație sexuală neconsensuală cu un polițist de stat, incluzând linkuri false către știri.

„Nu a existat niciodată o astfel de acuzație, nu există o astfel de persoană și nu există astfel de știri”, a declarat Marsha Blackburn, senatoare republicană din Tennessee, într-o scrisoare adresată lui Sundar Pichai, directorul executiv al Google.

„Nu este vorba de o halucinație inofensivă. Este un act de defăimare produs și distribuit de un model de IA deținut de Google. Un instrument accesibil publicului care inventează acuzații penale false despre un senator american în funcție reprezintă un eșec catastrofal al supravegherii și al responsabilității etice”.

„Halucinațiile sunt provocări în întreaga industrie”

Google a declarat că modelele sale Gemma au fost create pentru dezvoltatorii și cercetătorii de IA, nu pentru asistență factuală sau pentru consumatori. Le-a retras de pe platforma sa AI Studio după ce a descris „rapoarte ale unor persoane care nu sunt dezvoltatori și care încearcă să le utilizeze”.

„Halucinațiile – în care modelele inventează pur și simplu lucruri despre tot felul de subiecte – și lingușirea – în care modelele spun utilizatorilor ceea ce vor să audă – sunt provocări în întreaga industrie a AI, în special în cazul modelelor deschise mai mici, precum Gemma”, a declarat compania. „Rămânem dedicați minimizării halucinațiilor și îmbunătățirii continue a tuturor modelelor noastre”.

Concluzia a fost că există o „nevoie urgentă de standarde comune și bune practici”.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
De la „delulu” la „cringe”: Cum ne-au schimbat englezismele și jargonul rețelelor sociale felul în care vorbim
De la „delulu” la „cringe”: Cum ne-au schimbat englezismele și jargonul rețelelor sociale felul în care vorbim
De ce izbucnim uneori în plâns atunci când cineva ne întreabă „Ce faci?”
De ce izbucnim uneori în plâns atunci când cineva ne întreabă „Ce faci?”
Ce se întâmplă atunci când companiile negociază cu hackerii. Cazul atacului cibernetic care a afectat milioane de studenți
Ce se întâmplă atunci când companiile negociază cu hackerii. Cazul atacului cibernetic care a afectat milioane de studenți
Un singur tratament cu psilocibină ar putea ajuta în dependența de cocaină
Un singur tratament cu psilocibină ar putea ajuta în dependența de cocaină
Oamenii fac mai puțin sex decât în trecut. Ce spune istoria, de fapt?
Oamenii fac mai puțin sex decât în trecut. Ce spune istoria, de fapt?
Falsul secolului: Povestea Omului din Piltdown, „veriga lipsă” care a păcălit lumea științifică
Falsul secolului: Povestea Omului din Piltdown, „veriga lipsă” care a păcălit lumea științifică
Cum vrea NASA să învingă China în cursa spre Lună?
Cum vrea NASA să învingă China în cursa spre Lună?
81 de ani de la procesul „ziariştilor fascişti, vinovaţi de dezastrul ţării”. Cum îi şantaja pe politicieni Pamfil Şeicaru
81 de ani de la procesul „ziariştilor fascişti, vinovaţi de dezastrul ţării”. Cum îi şantaja pe politicieni Pamfil ...
Fețele femeilor sunt mai atractive decât cele ale bărbaților, arată un studiu
Fețele femeilor sunt mai atractive decât cele ale bărbaților, arată un studiu
Veste bună din Brazilia! Defrișările din pădurea amazoniană au ajuns la cel mai scăzut nivel din 2019 încoace
Veste bună din Brazilia! Defrișările din pădurea amazoniană au ajuns la cel mai scăzut nivel din 2019 încoace
ONU avertizează: 363 de milioane de oameni de pe Pământ sunt în pericol de foamete acută
ONU avertizează: 363 de milioane de oameni de pe Pământ sunt în pericol de foamete acută
Îți place să stai la masă cu alte persoane? Vești bune de la specialiști!
Îți place să stai la masă cu alte persoane? Vești bune de la specialiști!
Previziunea ambasadorului austro-ungar: România va intra în război împotriva Imperiului
Previziunea ambasadorului austro-ungar: România va intra în război împotriva Imperiului
Copiii nu uită cum i-ai făcut să se simtă. Lecțiile unui psiholog despre maturitatea emoțională a părinților
Copiii nu uită cum i-ai făcut să se simtă. Lecțiile unui psiholog despre maturitatea emoțională a părinților
S-ar putea ca toate animalele, plantele și ciupercile de pe Pământ să aibă un singur strămoș comun
S-ar putea ca toate animalele, plantele și ciupercile de pe Pământ să aibă un singur strămoș comun
A fost descoperit un nou melc de mare mic și colorat
A fost descoperit un nou melc de mare mic și colorat
Mumia uimitoare a unei maimuțe din Argentina dezvăluie un ritual bizar
Mumia uimitoare a unei maimuțe din Argentina dezvăluie un ritual bizar
Lucrurile invizibile fără de care viața oamenilor ar fi mult mai grea
Lucrurile invizibile fără de care viața oamenilor ar fi mult mai grea