Home » D:News » Semnal de alarmă de la creatorii celor mai avansate sisteme de Inteligență Artificială

Semnal de alarmă de la creatorii celor mai avansate sisteme de Inteligență Artificială

Semnal de alarmă de la creatorii celor mai avansate sisteme de Inteligență Artificială
Sursa foto: Shutterstock
Publicat: 27.07.2025

Oamenii de știință care au creat cele mai avansate sisteme de inteligență artificială din lume lansează un semnal de alarmă: tehnologia pe care au dezvoltat-o ar putea deveni o amenințare pentru umanitate.

Cercetătorii de la Google DeepMind, OpenAI, Meta și Anthropic argumentează că lipsa supravegherii asupra proceselor de raționament ale AI-ului înseamnă că am putea rata semnele unui comportament dăunător, anunță Live Science.

Într-un nou studiu, experții se concentrează pe așa-numitele „lanțuri de gândire” – pașii pe care îi fac modelele de limbaj pentru a rezolva probleme complexe. AI-ul folosește aceste lanțuri pentru a descompune întrebările avansate în etape logice intermediare, exprimate în limbaj natural.

„Oportunitate unică pentru siguranța AI”

Monitorizarea acestui proces ar putea fi crucială pentru siguranța AI-ului, ajutând cercetătorii să înțeleagă cum iau deciziile modelele și de ce se îndepărtează de interesele umanității. Problema este că acest proces de raționament nu poate fi întotdeauna monitorizat.

„Sistemele AI care ‘gândesc’ în limbaj uman oferă o oportunitate unică pentru siguranța AI”, au scris oamenii de știință.

„Putem monitoriza lanțurile lor de gândire pentru intenția de a se comporta rău. Ca toate celelalte metode cunoscute de supraveghere AI, monitorizarea lanțurilor de gândire este imperfectă și permite unor comportamente să treacă neobservate”.

Cercetătorii avertizează că raționamentul nu apare întotdeauna

Cercetătorii avertizează că raționamentul nu apare întotdeauna, astfel încât nu poate fi mereu monitorizat. Există și raționament care se întâmplă fără ca operatorii umani să știe, plus raționament pe care oamenii pur și simplu nu îl înțeleg.

O problemă suplimentară este că modelele AI viitoare, mai puternice, s-ar putea să nu mai aibă nevoie de aceste lanțuri de gândire vizibile. Ele ar putea chiar să detecteze că sunt supravegheate și să-și ascundă comportamentul problematic.

„Este posibil ca, chiar și pentru sarcini dificile, lanțul de gândire să conțină doar raționament care pare benign, în timp ce raționamentul incriminator este ascuns”, au explicat cercetătorii.

Pentru a evita aceste scenarii, autorii sugerează folosirea altor modele AI pentru a evalua procesele de gândire ale unui sistem și chiar pentru a acționa în mod adversarial împotriva unui model care încearcă să-și ascundă comportamentul dezaliniat.

„Nu există nicio garanție că gradul actual de vizibilitate va persista”, au avertizat oamenii de știință, încurajând comunitatea de cercetare să profite la maxim de capacitatea actuală de monitorizare și să studieze cum poate fi conservată.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
O migrație masivă de stele s-a întâmplat în galaxia noastră în urmă cu miliarde de ani
O migrație masivă de stele s-a întâmplat în galaxia noastră în urmă cu miliarde de ani
O țestoasă marină pe nume Diana, urmărită cu atenție de cercetători după o călătorie de 6.000 de kilometri
O țestoasă marină pe nume Diana, urmărită cu atenție de cercetători după o călătorie de 6.000 de kilometri
Au trecut 237 de ani de când a venit pe lume unul dintre cei mai mari fizicieni ai lumii
Au trecut 237 de ani de când a venit pe lume unul dintre cei mai mari fizicieni ai lumii
Chinezii au testat cu succes un „taxi zburător” care poate transporta 10 pasageri
Chinezii au testat cu succes un „taxi zburător” care poate transporta 10 pasageri
Un lanț olandez de supermarketuri caută angajați pe WhatsApp
Un lanț olandez de supermarketuri caută angajați pe WhatsApp
Virusul HPV este un pericol real chiar și în cazul relațiilor stabile. Ce trebuie să știm?
Virusul HPV este un pericol real chiar și în cazul relațiilor stabile. Ce trebuie să știm?
Meteorologii au actualizat prognoza: Cum va fi vremea în penultima săptămână din martie?
Meteorologii au actualizat prognoza: Cum va fi vremea în penultima săptămână din martie?
Cea mai veche peșteră din lume s-a format cu 100 de milioane de ani înainte de apariția dinozaurilor
Cea mai veche peșteră din lume s-a format cu 100 de milioane de ani înainte de apariția dinozaurilor
Cele mai goale locuri din Univers ar putea avea o influență neașteptată
Cele mai goale locuri din Univers ar putea avea o influență neașteptată
O explozie cosmică bizară, provocată de coliziunea unor galaxii, oferă indicii necunoscute despre Univers
O explozie cosmică bizară, provocată de coliziunea unor galaxii, oferă indicii necunoscute despre Univers
Cercetătorii au descoperit o lume necunoscută ascunsă în apele Antarcticii
Cercetătorii au descoperit o lume necunoscută ascunsă în apele Antarcticii
Un leac egiptean pentru tratarea bolilor oculare chiar ar putea să funcționeze, au descoperit cercetătorii
Un leac egiptean pentru tratarea bolilor oculare chiar ar putea să funcționeze, au descoperit cercetătorii
Câinii Golden Retriever și oamenii au mai multe în comun decât am fi crezut
Câinii Golden Retriever și oamenii au mai multe în comun decât am fi crezut
Tulburările de somn ar putea crește tensiunea arterială și riscul de boli cardiace
Tulburările de somn ar putea crește tensiunea arterială și riscul de boli cardiace
Depresia ar putea începe cu o problemă de energie la nivelul celulelor cerebrale
Depresia ar putea începe cu o problemă de energie la nivelul celulelor cerebrale
Oamenii de știință au cultivat cu succes o legumă foarte populară în praf de pe Lună
Oamenii de știință au cultivat cu succes o legumă foarte populară în praf de pe Lună
Hotelurile din Dubai au început să reducă prețurile la cazare
Hotelurile din Dubai au început să reducă prețurile la cazare
Jürgen Habermas, unul dintre cei mai importanți intelectuali ai secolului XX, a murit
Jürgen Habermas, unul dintre cei mai importanți intelectuali ai secolului XX, a murit