Home » D:News » Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?
Sursa foto: Shutterstock
Publicat: 24.05.2025

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul de inteligență artificială era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa.

Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Un semnal de alarmă privind alinierea AI la valorile umane

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane.

Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Ziua în care Alexandru Ioan Cuza a introdus învăţământul obligatoriu şi gratuit. Ce păţeau părinţii care nu se supuneau legii
Ziua în care Alexandru Ioan Cuza a introdus învăţământul obligatoriu şi gratuit. Ce păţeau părinţii care nu se ...
Trei reguli pe care părinții ar trebui să le aplice în privința telefoanelor pentru copii
Trei reguli pe care părinții ar trebui să le aplice în privința telefoanelor pentru copii
Românii vor avea facturi mai mari la gaze de la 1 aprilie 2026
Românii vor avea facturi mai mari la gaze de la 1 aprilie 2026
ESA intensifică cercetarea Pământului pe măsură ce viitorul agențiilor americane devine tot mai incert
ESA intensifică cercetarea Pământului pe măsură ce viitorul agențiilor americane devine tot mai incert
Un bazin roman monumental, ascuns timp de 2.000 de ani, a fost dezgropat lângă Roma
Un bazin roman monumental, ascuns timp de 2.000 de ani, a fost dezgropat lângă Roma
Un expert spune că modelele lingvistice mari nu vor fi niciodată cu adevărat inteligente
Un expert spune că modelele lingvistice mari nu vor fi niciodată cu adevărat inteligente
PRESS RELEASE: The concept of the DraculaLand project is being launched in Romania – a private investment of over EUR 1 billion, designed to become the largest entertainment, retail, and technology destination on the continent, one that will transform the country into a new global epicenter of entertainment
PRESS RELEASE: The concept of the DraculaLand project is being launched in Romania – a private investment of over EUR 1 ...
Economia suferă din cauza că oamenii nu cumpără mai des telefoane noi, susțin unii experți
Economia suferă din cauza că oamenii nu cumpără mai des telefoane noi, susțin unii experți
ADN-ul de lup se ascunde în majoritatea câinilor, au descoperit oamenii de știință
ADN-ul de lup se ascunde în majoritatea câinilor, au descoperit oamenii de știință
Prima „hartă biblică” încă influențează modul în care percepem granițele
Prima „hartă biblică” încă influențează modul în care percepem granițele
Eleanor de Aquitania, femeia care a condus Europa din umbra
Eleanor de Aquitania, femeia care a condus Europa din umbra
„Podcast cu Prioritate” #87 by ProMotor: samsari auto, mașini cu probleme și concluziile lui Dan Babu după sute de verificări
„Podcast cu Prioritate” #87 by ProMotor: samsari auto, mașini cu probleme și concluziile lui Dan Babu după sute de ...
Robert de Boron, autorul uitat care a reinventat legenda Sfântului Graal
Robert de Boron, autorul uitat care a reinventat legenda Sfântului Graal
De ce ni se pare că „simțim” durere atunci când vedem pe cineva rănit?
De ce ni se pare că „simțim” durere atunci când vedem pe cineva rănit?
Celulele umane îmbătrânite pot fi „reîncărcate”, au descoperit cercetătorii
Celulele umane îmbătrânite pot fi „reîncărcate”, au descoperit cercetătorii
COMUNICAT: În România se lansează conceptul proiectului DraculaLand – o investiție privată de peste 1 miliard de euro, concepută să devină cea mai mare destinație de entertainment, retail și tehnologie de pe continent care va transforma țara într-un nou epicentru global al divertismentului
COMUNICAT: În România se lansează conceptul proiectului DraculaLand – o investiție privată de peste 1 miliard de euro, ...
Test de cultură generală. Care este diferența dintre Coca-Cola și Pepsi?
Test de cultură generală. Care este diferența dintre Coca-Cola și Pepsi?
Pentru prima dată în istorie, 8 nave spațiale sunt andocate la Stația Spațială Internațională
Pentru prima dată în istorie, 8 nave spațiale sunt andocate la Stația Spațială Internațională