Home » D:News » Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?
Sursa foto: Shutterstock
Publicat: 24.05.2025

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul de inteligență artificială era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa.

Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Un semnal de alarmă privind alinierea AI la valorile umane

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane.

Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Oamenii de știință au descoperit două gene care ar putea opri răspândirea cancerului
Oamenii de știință au descoperit două gene care ar putea opri răspândirea cancerului
Lepra, între istorie și știință: ce înseamnă cu adevărat această boală și cât de mare este riscul astăzi
Lepra, între istorie și știință: ce înseamnă cu adevărat această boală și cât de mare este riscul astăzi
O navă spațială NASA de pe orbita planetei Marte s-a deconectat în mod misterios
O navă spațială NASA de pe orbita planetei Marte s-a deconectat în mod misterios
Fibrele, noul ingredient-vedetă. „Este un nutrient de care oamenii chiar au nevoie”
Fibrele, noul ingredient-vedetă. „Este un nutrient de care oamenii chiar au nevoie”
Nichita Stănescu, geniul răsfăţat de Ceauşeşti care a consumat alcool până a murit. „A făcut şi el un pact cu diavolul”
Nichita Stănescu, geniul răsfăţat de Ceauşeşti care a consumat alcool până a murit. „A făcut şi el un pact cu diavolul”
Gigantul Netflix, păcălit cu milioane de dolari de un regizor cunoscut de la Hollywood
Gigantul Netflix, păcălit cu milioane de dolari de un regizor cunoscut de la Hollywood
Locurile din avion pe care pasagerii ar trebui să le evite pe cât posibil
Locurile din avion pe care pasagerii ar trebui să le evite pe cât posibil
Interesul SUA pentru Groenlanda, motiv de panică pentru serviciile secrete daneze
Interesul SUA pentru Groenlanda, motiv de panică pentru serviciile secrete daneze
Unde ajung bagajele pierdute în aeroport?
Unde ajung bagajele pierdute în aeroport?
Oamenii tocmai acum realizează că Pământul are o coadă, care se întinde pe milioane de kilometri
Oamenii tocmai acum realizează că Pământul are o coadă, care se întinde pe milioane de kilometri
Un simplu truc cu lumina dezvăluie căi cerebrale ascunse în detaliu microscopic
Un simplu truc cu lumina dezvăluie căi cerebrale ascunse în detaliu microscopic
Ce a descoperit o echipă de cercetători în structura termică de sub Groenlanda?
Ce a descoperit o echipă de cercetători în structura termică de sub Groenlanda?
A fost recuperată prima comoară de pe „Sfântul Graal al epavelor”
A fost recuperată prima comoară de pe „Sfântul Graal al epavelor”
Copilăria lângă un părinte narcisic: consecințe emoționale și drumul către vindecare
Copilăria lângă un părinte narcisic: consecințe emoționale și drumul către vindecare
Cuvintele care vindecă: cum să vorbești ca să fii auzit, respectat și înțeles
Cuvintele care vindecă: cum să vorbești ca să fii auzit, respectat și înțeles
Cum a devenit „narcisismul” unul dintre cele mai folosite cuvinte ale psihologiei moderne
Cum a devenit „narcisismul” unul dintre cele mai folosite cuvinte ale psihologiei moderne
Cum facem iubirea să reziste până la adânci bătrâneți?
Cum facem iubirea să reziste până la adânci bătrâneți?
Test de cultură generală. De ce câinilor le place să ascundă lucruri?
Test de cultură generală. De ce câinilor le place să ascundă lucruri?