Home » Știință » Inteligența Artificială de la Meta, fostul Facebook, poate recunoaște peste 4.000 de limbi

Inteligența Artificială de la Meta, fostul Facebook, poate recunoaște peste 4.000 de limbi

Inteligența Artificială de la Meta, fostul Facebook, poate recunoaște peste 4.000 de limbi
Sursa foto: Shutterstock
Publicat: 28.05.2023

Meta a creat un model de limbaj bazat pe Inteligența Artificială (AI) care, în mod surprinzător, nu este o clonă ChatGPT. Proiectul Massively Multilingual Speech (MMS) al companiei poate recunoaște peste 4.000 de limbi și poate comunica în peste 1.100 de limbi. La fel ca majoritatea celorlalte proiecte de Inteligență Artificială anunțate public, Meta a creat MMS pentru a contribui la păstrarea diversității lingvistice și pentru a încuraja cercetătorii să se bazeze pe fundația sa.

„Împărtășim în mod public modelele și codul nostru, astfel încât și alte persoane din comunitatea de cercetare să poată construi pe baza muncii noastre. Prin această muncă, sperăm să aducem o mică contribuție la conservarea diversității lingvistice incredibile din lume”, a scris compania, potrivit Engadget.

Modelele de recunoaștere a vorbirii și de transformare a textului în vorbire necesită, de obicei, o pregătire pe mii de ore de înregistrări audio cu etichete de transcriere însoțitoare. Etichetele sunt esențiale pentru învățarea automată, deoarece permit algoritmilor să clasifice corect și să „înțeleagă” datele. Dar pentru limbile care nu sunt utilizate pe scară largă în țările industrializate – multe fiind în pericol de dispariție în următoarele decenii – „aceste date pur și simplu nu există”, după cum a transmis Meta.

Meta a folosit o abordare neconvențională

Meta a folosit o abordare neconvențională pentru colectarea datelor audio: a apelat la înregistrări audio ale textelor religioase traduse.

„Ne-am orientat către texte religioase, cum ar fi Biblia, care au fost traduse în multe limbi diferite și ale căror traduceri au fost studiate pe scară largă pentru cercetarea traducerilor bazate pe text. Aceste traduceri au și înregistrări audio disponibile public ale unor persoane care citesc aceste texte în diferite limbi”, a declarat compania.

Prin încorporarea înregistrărilor neetichetate ale Bibliei și ale unor texte similare, cercetătorii Meta au crescut numărul de limbi disponibile ale modelului la peste 4.000.

„Deși conținutul înregistrărilor audio este religios, analiza noastră arată că acest lucru nu influențează modelul să producă un limbaj mai religios. Credem că acest lucru se datorează faptului că folosim o abordare de clasificare temporală conectică (CTC), care este mult mai constrânsă în comparație cu modelele mari de limbaj (LLM) sau modelele secvență-la-secvență pentru recunoașterea vorbirii”, a scris Meta.

Meta a avertizat că noile sale modele nu sunt perfecte

Combinarea surselor de date neconvenționale și a unui model de vorbire autosupravegheat a condus la rezultate impresionante.

„Rezultatele noastre arată că modelele Massively Multilingual Speech au performanțe bune în comparație cu modelele existente și acoperă de zece ori mai multe limbi”, a transmis Meta.

Totuși, Meta a avertizat că noile sale modele nu sunt perfecte.

„De exemplu, există un anumit risc ca modelul speech-to-text să transcrie greșit anumite cuvinte sau fraze. În funcție de rezultat, acest lucru ar putea duce la un limbaj ofensator și/sau inexact. Continuăm să credem că o colaborare în cadrul comunității de Inteligență Artificială este esențială pentru dezvoltarea responsabilă a tehnologiilor de AI”, a scris compania.

Vă mai recomandăm și: 

Omul din spatele ChatGPT vrea să scaneze ochii tuturor oamenilor de pe Pământ

Inteligența Artificială îi va prinde pe cei care aruncă gunoiul din mașină

Ar putea Inteligența Artificială să egaleze vreodată inteligența umană?

Chatbotul Bard de la Google a vorbit într-o limbă în care nu a fost antrenat

Claudia Cociug
Claudia Cociug
Claudia Cociug, absolventă a Facultății de Litere, specializarea Jurnalism și Științe ale Comunicării din cadrul Universității „Alexandru Ioan Cuza” din Iași, a făcut parte din echipa DESCOPERĂ.ro din noiembrie 2022 și până în iunie 2023. citește mai mult
Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Ce înseamnă „din vremuri imemoriale”? Semnificația este mult mai precisă decât ai crede!
Ce înseamnă „din vremuri imemoriale”? Semnificația este mult mai precisă decât ai crede!
Secretele lui Constantin Brâncuși, dezvăluite într-un nou episod al podcastului „Altceva cu Adrian Artene”
Secretele lui Constantin Brâncuși, dezvăluite într-un nou episod al podcastului „Altceva cu Adrian Artene”
Test de cultură generală. Ghimbirul este legumă sau fruct?
Test de cultură generală. Ghimbirul este legumă sau fruct?
Printr-un „noroc incredibil”, Telescopul Hubble a surprins o cometă în timp ce se dezintegra
Printr-un „noroc incredibil”, Telescopul Hubble a surprins o cometă în timp ce se dezintegra
De ce nu mai apare Vladimir Putin în public după izbucnirea războiului din Orientul Mijlociu
De ce nu mai apare Vladimir Putin în public după izbucnirea războiului din Orientul Mijlociu
Tot mai puțini americani au încredere în președintele Donald Trump. Ce arată un nou sondaj?
Tot mai puțini americani au încredere în președintele Donald Trump. Ce arată un nou sondaj?
Europa trece pe cărbune, ca urmare a creșterii prețurilor la gaze
Europa trece pe cărbune, ca urmare a creșterii prețurilor la gaze
În urmă cu 206 de ani s-a născut Alexandru Ioan Cuza. Conspiraţia din spatele abdicării sale
În urmă cu 206 de ani s-a născut Alexandru Ioan Cuza. Conspiraţia din spatele abdicării sale
Unul dintre cei mai mari exportatori de gaze naturale lichefiate din lume ar putea reduce livrările
Unul dintre cei mai mari exportatori de gaze naturale lichefiate din lume ar putea reduce livrările
O dietă populară și foarte simplă reduce enorm riscul de demență
O dietă populară și foarte simplă reduce enorm riscul de demență
Finlanda este cea mai fericită țară din lume pentru al nouălea an la rând. Ce altceva mai dezvăluie Raportul Mondial privind Fericirea?
Finlanda este cea mai fericită țară din lume pentru al nouălea an la rând. Ce altceva mai dezvăluie Raportul Mondial ...
Un expert recomandă: de ce este bine să evitați sudul insulei Tenerife?
Un expert recomandă: de ce este bine să evitați sudul insulei Tenerife?
Dovedit matematic: „regula celor 20 de ani” există cu adevărat!
Dovedit matematic: „regula celor 20 de ani” există cu adevărat!
Cercetătorii au descoperit că dinozaurii nu cloceau ouăle la fel ca păsările din zilele noastre
Cercetătorii au descoperit că dinozaurii nu cloceau ouăle la fel ca păsările din zilele noastre
Ceva ciudat se întâmplă în creierul oamenilor cu ADHD, a descoperit un studiu
Ceva ciudat se întâmplă în creierul oamenilor cu ADHD, a descoperit un studiu
Un crater masiv ar putea ascunde, de fapt, inima unei planete pierdute
Un crater masiv ar putea ascunde, de fapt, inima unei planete pierdute
Cactușii sunt „mașinării” de evoluție rapidă, arată un nou studiu
Cactușii sunt „mașinării” de evoluție rapidă, arată un nou studiu
Cea mai veche înregistrare a cântecului unei balene, găsită pe un disc pierdut din 1949
Cea mai veche înregistrare a cântecului unei balene, găsită pe un disc pierdut din 1949