AI-ul supraestimează inteligența oamenilor. Cercetătorii de la HSE University (Rusia) au descoperit că modelele actuale de Inteligență Artificială, inclusiv ChatGPT și Claude, tind să supraestimeze nivelul de raționalitate al adversarilor umani, fie că este vorba despre studenți în primul an de facultate sau despre oameni de știință cu experiență, în jocuri de gândire strategică precum „concursul de frumusețe” keynesian.
Deși aceste modele încearcă să anticipeze comportamentul uman, ele ajung adesea să joace „prea inteligent” și să piardă, deoarece presupun un nivel de logică mai ridicat în rândul oamenilor decât există în realitate.
Studiul a fost publicat în Journal of Economic Behavior & Organization.
În anii 1930, economistul britanic John Maynard Keynes a introdus conceptul teoretic al unui concurs de frumusețe metaforic. Un exemplu clasic presupune ca cititorii unui ziar să aleagă cele șase chipuri pe care le consideră cele mai atrăgătoare dintr-un set de 100 de fotografii. Premiul îi revine celui ale cărui alegeri sunt cele mai apropiate de selecția medie a tuturor participanților, cu alte cuvinte, de opțiunea cea mai populară.
De regulă, oamenii aleg fețele pe care le consideră personal atractive. Însă, tocmai din acest motiv, pierd adesea, pentru că adevărata dificultate este să anticipezi ce vor considera majoritatea celorlalți participanți ca fiind frumos.
Un jucător rațional ar trebui, așadar, să-și bazeze alegerile pe percepțiile celorlalți. Astfel de experimente testează capacitatea de a gândi pe mai multe niveluri: cum gândesc ceilalți, cât de raționali sunt și cât de departe anticipează raționamentul altora, explică TechXplore.
Dmitry Dagaev, șeful Laboratorului de Studii Sportive de la HSE, împreună cu Sofia Paklina și Petr Parshakov, de la HSE-Perm, și Iuliia Alekseenko, de la Universitatea din Lausanne (Elveția), au analizat modul în care cinci dintre cele mai populare modele AI, incluzând ChatGPT-4o și Claude-Sonnet-4, se descurcă într-un astfel de experiment. Chatboții au fost puși să joace „Ghicește numărul”, una dintre cele mai cunoscute variante ale concursului keynesian.
Conform regulilor, toți participanții aleg simultan și independent un număr între 0 și 100. Câștigă cel al cărui număr este cel mai apropiat de jumătate (sau de două treimi, în funcție de variantă) din media tuturor alegerilor.
Pentru a evalua performanța modelelor lingvistice de mari dimensiuni (LLM), autorii au reprodus rezultatele a 16 experimente clasice de tip „Ghicește numărul”, realizate anterior cu participanți umani. În fiecare rundă, LLM-urile primeau regulile jocului și o descriere a adversarilor, de la studenți în primul an și participanți la conferințe academice, până la persoane cu gândire analitică sau intuitivă ori aflate sub influența unor emoții precum furia sau tristețea. Modelul trebuia apoi să aleagă un număr și să-și explice raționamentul.
AI-ul supraestimează inteligența oamenilor. Rezultatele arată că LLM-urile își ajustează alegerile în funcție de caracteristicile sociale, profesionale și de vârstă ale adversarilor, precum și de nivelul acestora de cunoaștere a „teoriei jocurilor”. De exemplu, în fața participanților la conferințe de teorie a jocurilor, modelele tindeau să aleagă valori apropiate de 0, în timp ce, în cazul studenților din primul an, selectau numere semnificativ mai mari.
Autorii au constatat că LLM-urile se pot adapta eficient la adversari cu niveluri diferite de sofisticare și demonstrează elemente de gândire strategică, însă nu reușesc să identifice o strategie dominantă într-un joc cu doi jucători. Concursul keynesian este adesea folosit pentru a explica fluctuațiile prețurilor pe piețele financiare, unde deciziile nu se bazează pe preferințe personale, ci pe așteptările legate de comportamentul celorlalți.
„Ne aflăm într-o etapă în care modelele AI încep să înlocuiască oamenii în numeroase operațiuni, crescând eficiența economică a proceselor de afaceri. Totuși, în sarcinile de luare a deciziilor, este adesea important ca LLM-urile să se comporte într-un mod similar oamenilor. Din acest motiv, tot mai multe contexte implică compararea comportamentului AI cu cel uman. Este de așteptat ca acest domeniu de cercetare să se dezvolte rapid în viitorul apropiat”, a subliniat Dagaev.
Când vor deveni tehnologiile cuantice parte din viața de zi cu zi?
De ce o pagină de pe Wikipedia a fost blocată pentru editare
Test de cultură generală. Ce este mai mare decât un terabyte?
Trucul simplu care reduce consumul de energie al centrelor de date cu 30%