Home » D:News » Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?
Sursa foto: Shutterstock
Publicat: 24.05.2025

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul de inteligență artificială era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa.

Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Un semnal de alarmă privind alinierea AI la valorile umane

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane.

Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Teoria atașamentului: De ce modul în care am fost iubiți în copilărie ne decide relațiile din prezent?
Teoria atașamentului: De ce modul în care am fost iubiți în copilărie ne decide relațiile din prezent?
O nouă specie de broască arată ca un dovleac în miniatură
O nouă specie de broască arată ca un dovleac în miniatură
Han van Meegeren și operele lui Vermeer. Maestrul falsificator care i-a păcălit pe naziști
Han van Meegeren și operele lui Vermeer. Maestrul falsificator care i-a păcălit pe naziști
Istoria, o temă folosită frecvent de producătorii de sloturi online (P)
Istoria, o temă folosită frecvent de producătorii de sloturi online (P)
Obiceiuri financiare sănătoase: Cum învingem inflația?
Obiceiuri financiare sănătoase: Cum învingem inflația?
Dependența de iubire este tulburare reală sau etichetă înșelătoare?
Dependența de iubire este tulburare reală sau etichetă înșelătoare?
Cum îți pot afecta căștile sănătatea auzului și ce poți face pentru a te proteja
Cum îți pot afecta căștile sănătatea auzului și ce poți face pentru a te proteja
Reprogramare mintală: cum să îți transformi obiceiurile și gândurile
Reprogramare mintală: cum să îți transformi obiceiurile și gândurile
Test de cultură generală. Care animal nu uită niciodată?
Test de cultură generală. Care animal nu uită niciodată?
Cele mai periculoase locuri de pe Pământ: destinații extreme în care nu vrei să ajungi!
Cele mai periculoase locuri de pe Pământ: destinații extreme în care nu vrei să ajungi!
Câți dintre americani cred că Donald Trump știa despre presupusele crime ale lui Jeffrey Epstein
Câți dintre americani cred că Donald Trump știa despre presupusele crime ale lui Jeffrey Epstein
Două planete din Sistemul Solar nu sunt ceea ce par, susțin cercetătorii
Două planete din Sistemul Solar nu sunt ceea ce par, susțin cercetătorii
Unul dintre cei mai cruzi împăraţi din istorie. Orgiile lui au fost fără margini. Întreţinea relaţii incestuoase inclusiv cu mama lui
Unul dintre cei mai cruzi împăraţi din istorie. Orgiile lui au fost fără margini. Întreţinea relaţii incestuoase ...
Reacția Kremlinului după ce șeful NATO a avertizat că Rusia ar putea ataca statele membre
Reacția Kremlinului după ce șeful NATO a avertizat că Rusia ar putea ataca statele membre
Coșmarurile nu sunt chiar întâmplătoare. Ce ne spune știința?
Coșmarurile nu sunt chiar întâmplătoare. Ce ne spune știința?
Unde este cel mai înalt oraș locuit permanent din lume?
Unde este cel mai înalt oraș locuit permanent din lume?
Telescopul Spațial James Webb a confirmat cea mai veche și mai îndepărtată supernovă observată vreodată
Telescopul Spațial James Webb a confirmat cea mai veche și mai îndepărtată supernovă observată vreodată
De ce mahmureala este mai greu de suportat odată cu vârsta?
De ce mahmureala este mai greu de suportat odată cu vârsta?