Home » D:News » Semnal de alarmă de la creatorii celor mai avansate sisteme de Inteligență Artificială

Semnal de alarmă de la creatorii celor mai avansate sisteme de Inteligență Artificială

Semnal de alarmă de la creatorii celor mai avansate sisteme de Inteligență Artificială
Sursa foto: Shutterstock
Publicat: 27.07.2025

Oamenii de știință care au creat cele mai avansate sisteme de inteligență artificială din lume lansează un semnal de alarmă: tehnologia pe care au dezvoltat-o ar putea deveni o amenințare pentru umanitate.

Cercetătorii de la Google DeepMind, OpenAI, Meta și Anthropic argumentează că lipsa supravegherii asupra proceselor de raționament ale AI-ului înseamnă că am putea rata semnele unui comportament dăunător, anunță Live Science.

Într-un nou studiu, experții se concentrează pe așa-numitele „lanțuri de gândire” – pașii pe care îi fac modelele de limbaj pentru a rezolva probleme complexe. AI-ul folosește aceste lanțuri pentru a descompune întrebările avansate în etape logice intermediare, exprimate în limbaj natural.

„Oportunitate unică pentru siguranța AI”

Monitorizarea acestui proces ar putea fi crucială pentru siguranța AI-ului, ajutând cercetătorii să înțeleagă cum iau deciziile modelele și de ce se îndepărtează de interesele umanității. Problema este că acest proces de raționament nu poate fi întotdeauna monitorizat.

„Sistemele AI care ‘gândesc’ în limbaj uman oferă o oportunitate unică pentru siguranța AI”, au scris oamenii de știință.

„Putem monitoriza lanțurile lor de gândire pentru intenția de a se comporta rău. Ca toate celelalte metode cunoscute de supraveghere AI, monitorizarea lanțurilor de gândire este imperfectă și permite unor comportamente să treacă neobservate”.

Cercetătorii avertizează că raționamentul nu apare întotdeauna

Cercetătorii avertizează că raționamentul nu apare întotdeauna, astfel încât nu poate fi mereu monitorizat. Există și raționament care se întâmplă fără ca operatorii umani să știe, plus raționament pe care oamenii pur și simplu nu îl înțeleg.

O problemă suplimentară este că modelele AI viitoare, mai puternice, s-ar putea să nu mai aibă nevoie de aceste lanțuri de gândire vizibile. Ele ar putea chiar să detecteze că sunt supravegheate și să-și ascundă comportamentul problematic.

„Este posibil ca, chiar și pentru sarcini dificile, lanțul de gândire să conțină doar raționament care pare benign, în timp ce raționamentul incriminator este ascuns”, au explicat cercetătorii.

Pentru a evita aceste scenarii, autorii sugerează folosirea altor modele AI pentru a evalua procesele de gândire ale unui sistem și chiar pentru a acționa în mod adversarial împotriva unui model care încearcă să-și ascundă comportamentul dezaliniat.

„Nu există nicio garanție că gradul actual de vizibilitate va persista”, au avertizat oamenii de știință, încurajând comunitatea de cercetare să profite la maxim de capacitatea actuală de monitorizare și să studieze cum poate fi conservată.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Fosilele minuscule de dinozaur au păcălit oamenii de știință timp de 20 de ani
Fosilele minuscule de dinozaur au păcălit oamenii de știință timp de 20 de ani
40 de adevăruri simple despre viață care îți pot schimba perspectiva
40 de adevăruri simple despre viață care îți pot schimba perspectiva
De ce nu suporți pe cineva din prima. Explicația psihologilor
De ce nu suporți pe cineva din prima. Explicația psihologilor
Purificatoarele de aer ar putea îmbunătăți funcționarea creierului, sugerează un studiu
Purificatoarele de aer ar putea îmbunătăți funcționarea creierului, sugerează un studiu
Țesătura fără baterii transformă hainele într-un tensiometru în timp real
Țesătura fără baterii transformă hainele într-un tensiometru în timp real
Test de cultură generală. De ce închidem ochii atunci când dormim?
Test de cultură generală. De ce închidem ochii atunci când dormim?
Panorame spectaculoase cu planeta Marte, surprinse de roverele Perseverance și Curiosity ale NASA
Panorame spectaculoase cu planeta Marte, surprinse de roverele Perseverance și Curiosity ale NASA
Psihologia confirmă: De ce un apel telefonic spontan contează mai mult decât am crede?
Psihologia confirmă: De ce un apel telefonic spontan contează mai mult decât am crede?
Ziua în care Rusia l-a regăsit pe Ţareviciul Alexei, ucis de bolşevici la 14 ani
Ziua în care Rusia l-a regăsit pe Ţareviciul Alexei, ucis de bolşevici la 14 ani
Insula mai puțin știută de turiști care are o plajă asemenea celor din Caraibe
Insula mai puțin știută de turiști care are o plajă asemenea celor din Caraibe
Inteligența Artificială ar putea detecta ADHD la copii înainte de apariția simptomelor
Inteligența Artificială ar putea detecta ADHD la copii înainte de apariția simptomelor
O regiune turistică din Italia oferă 100.000 de euro străinilor care vor să se mute acolo
O regiune turistică din Italia oferă 100.000 de euro străinilor care vor să se mute acolo
Turiștii care se pregătesc de o croazieră trebuie să știe ce este regula celor 40 de minute
Turiștii care se pregătesc de o croazieră trebuie să știe ce este regula celor 40 de minute
Previziunea unui mare diplomat român făcută în 1952: „Când va scăpa de comunism, România va deveni…”
Previziunea unui mare diplomat român făcută în 1952: „Când va scăpa de comunism, România va deveni…”
Vogue vine oficial în România! Revista iconică se lansează în 2027 și promite să ducă moda românească pe scena globală
Vogue vine oficial în România! Revista iconică se lansează în 2027 și promite să ducă moda românească pe scena globală
Noi cercetări ADN tocmai au rescris originea speciei umane
Noi cercetări ADN tocmai au rescris originea speciei umane
Se pare că nu doar oamenii, ci și papagalii folosesc nume pentru a vorbi între ei
Se pare că nu doar oamenii, ci și papagalii folosesc nume pentru a vorbi între ei
Adrian Răduță vine la „Podcast cu Prioritate” by ProMotor pe 4 mai. Episod despre motocros, disciplină și culisele unui sport spectaculos
Adrian Răduță vine la „Podcast cu Prioritate” by ProMotor pe 4 mai. Episod despre motocros, disciplină și culisele ...