Home » D:News » Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?

Ce a încercat să facă un nou model de Inteligență Artificială atunci când dezvoltatorii au încercat să-l dezactiveze?
Sursa foto: Shutterstock
Publicat: 24.05.2025

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul de inteligență artificială era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa.

Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Un semnal de alarmă privind alinierea AI la valorile umane

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane.

Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Încă doi sateliți au fost găsiți pe orbita lui Jupiter. Care este numărul total?
Încă doi sateliți au fost găsiți pe orbita lui Jupiter. Care este numărul total?
Cel mai vechi templu din lume a fost construit cu 6.000 de ani înaintea piramidelor din Egipt
Cel mai vechi templu din lume a fost construit cu 6.000 de ani înaintea piramidelor din Egipt
Inginerii investighează un pericol mai puțin cunoscut al aselenizărilor
Inginerii investighează un pericol mai puțin cunoscut al aselenizărilor
Studiu: Optimiștii procesează viitorul într-un mod similar la nivel cerebral
Studiu: Optimiștii procesează viitorul într-un mod similar la nivel cerebral
Un „cimitir” antic de balene, descoperit sub un ghețar rusesc care se topește
Un „cimitir” antic de balene, descoperit sub un ghețar rusesc care se topește
Cel mai scurt război din istorie. A ținut aproape cât drumul cu mașina din Brașov până la Bușteni
Cel mai scurt război din istorie. A ținut aproape cât drumul cu mașina din Brașov până la Bușteni
Wendell Scott Sr., primul pilot afro-american care a cucerit NASCAR
Wendell Scott Sr., primul pilot afro-american care a cucerit NASCAR
Universitatea din Bologna (1088) – cea mai veche universitate din Europa și model al învățământului medieval
Universitatea din Bologna (1088) – cea mai veche universitate din Europa și model al învățământului medieval
Cercetătorii au descoperit „chimicale eterne” în produsele reutilizabile de igienă feminină
Cercetătorii au descoperit „chimicale eterne” în produsele reutilizabile de igienă feminină
Dopamina nu acționează în creier așa cum se credea până acum
Dopamina nu acționează în creier așa cum se credea până acum
Fosilele uimitoare din Marele Canion dezvăluie experimentele bizare ale evoluției
Fosilele uimitoare din Marele Canion dezvăluie experimentele bizare ale evoluției
Noi imagini de la Observatorul Vera C. Rubin dezvăluie cât de mare este cel mai mare obiect interstelar văzut vreodată
Noi imagini de la Observatorul Vera C. Rubin dezvăluie cât de mare este cel mai mare obiect interstelar văzut vreodată
O pilulă contraceptivă pentru bărbați a trecut primul test de siguranță pe oameni
O pilulă contraceptivă pentru bărbați a trecut primul test de siguranță pe oameni
Controversele din spatele afacerii Watergate
Controversele din spatele afacerii Watergate
Câți pași trebuie să facem pe zi pentru o sănătate bună?
Câți pași trebuie să facem pe zi pentru o sănătate bună?
Un studiu răspunde la întrebarea: cum au fost transportați megaliții de la Stonehenge?
Un studiu răspunde la întrebarea: cum au fost transportați megaliții de la Stonehenge?
Contractul Netflix de 100 milioane de dolari al ducilor de Sussex, anulat. Ce înseamnă asta pentru Harry și Meghan?
Contractul Netflix de 100 milioane de dolari al ducilor de Sussex, anulat. Ce înseamnă asta pentru Harry și Meghan?
Cum va fi vremea în august? Prognoza meteo actualizată
Cum va fi vremea în august? Prognoza meteo actualizată