Home » D:News » Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?
Sursa foto: Shutterstock
Publicat: 24.05.2025

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul de inteligență artificială era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa.

Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Un semnal de alarmă privind alinierea AI la valorile umane

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane.

Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Universul invizibil dezvăluie noi indicii despre materia întunecată
Universul invizibil dezvăluie noi indicii despre materia întunecată
Vieți marcate de lepră: conducători, poeți și un gest rar de devoțiune
Vieți marcate de lepră: conducători, poeți și un gest rar de devoțiune
De ce ni se pare că luna decembrie „vine mai devreme” în fiecare an?
De ce ni se pare că luna decembrie „vine mai devreme” în fiecare an?
Ligrul: întâlnirea rară dintre regele leu și tigru
Ligrul: întâlnirea rară dintre regele leu și tigru
Cine a fost Cleopatra dincolo de mitul seducției? O regină cultivată, o jucătoare politică redutabilă și o figură istorică mult mai complexă decât legenda
Cine a fost Cleopatra dincolo de mitul seducției? O regină cultivată, o jucătoare politică redutabilă și o figură ...
Funicularul, ingineria care face accesibile pantele imposibile
Funicularul, ingineria care face accesibile pantele imposibile
„Olympia” lui Édouard Manet: de la acuzații de imoralitate și plagiat la redefinirea nudului în pictura modernă
„Olympia” lui Édouard Manet: de la acuzații de imoralitate și plagiat la redefinirea nudului în pictura modernă
Ce este ADHD și ce înseamnă cu adevărat
Ce este ADHD și ce înseamnă cu adevărat
De ce unii specialiști recomandă cafeaua înainte de somn? Explicația biologică, pe înțelesul tuturor
De ce unii specialiști recomandă cafeaua înainte de somn? Explicația biologică, pe înțelesul tuturor
Cum a măsurat Eratostene circumferința Pământului cu un băț în anul 240 î.Hr.?
Cum a măsurat Eratostene circumferința Pământului cu un băț în anul 240 î.Hr.?
De ce lipsesc culori din Soare? Nici măcar oamenii de știință nu au răspunsul complet!
De ce lipsesc culori din Soare? Nici măcar oamenii de știință nu au răspunsul complet!
Cel mai nou și avansat portavion al Chinei a traversat Strâmtoarea Taiwanului
Cel mai nou și avansat portavion al Chinei a traversat Strâmtoarea Taiwanului
Cum a instituit Ceauşescu „starea de necesitate” ca urmare a „acţiunilor irendentise”
Cum a instituit Ceauşescu „starea de necesitate” ca urmare a „acţiunilor irendentise”
Cum au ajuns câteva monede americane să valoreze 17 milioane de dolari?
Cum au ajuns câteva monede americane să valoreze 17 milioane de dolari?
Încă doi sateliți europeni Galileo au fost lansați pe orbita Pământului
Încă doi sateliți europeni Galileo au fost lansați pe orbita Pământului
Tradiții și ritualuri pentru a sărbători solstițiul de iarnă
Tradiții și ritualuri pentru a sărbători solstițiul de iarnă
Bursele sociale pentru studenți vor primi o suplimentare de 60 de milioane de euro
Bursele sociale pentru studenți vor primi o suplimentare de 60 de milioane de euro
O descoperire despre modul în care dinozaurii își creșteau puii schimbă tot ce știam până acum
O descoperire despre modul în care dinozaurii își creșteau puii schimbă tot ce știam până acum