Prima voce sintetizată care imită perfect glasul oamenilor

13 09. 2016, 09:13

Acum, Google încearcă să realizeze un program care imită vocea umană.

Echipa din spatele proiectului DeepMind a anunţat realizarea unui nou program de voce sintetizată alimentat de inteligenţa artificială.

Prin analizarea unor mostre de voce au fost realizate programe precum Google Voice Search, care este deja funcţional de mulţi ani. Sintetizarea unor astfel de voci este în general o provocare. Cea mai cunoscută metodă este ,,text în voce” (concatenative), prin aceasta programul combină fragmente din fraze înregistrate.

Cel mai mare dezavantaj al programului este că poate modifica fragmentele pentru a crea altele noi, rezultatul fiind vocea robotică, sacadată.  O altă metodă este prin transformarea textului în voce parametrică. Vorbitul este transferat printr-un vocoder, rezultatul final fiind mult mai artificial.

Noul program Google foloseşte o metodă diferită.

Decât să analizeze înregistrarea, acesta învaţă sunete, modul de funcţionare fiind similar cu sistemele neuronale profunde. Programul WaveNet poate genera propriile mostre audio.

Programul utilizează statistici pentru a prezice ce parte audio este necesară. 

În articolul de lansare a noului program sunt ataşate exemple ale diferitelor voci sintetizate în engleză şi mandarină.  De asemenea, sistemul poate sintetiza muzică deoarece poate analiza orice tip de sunet, nu doar vorbitul.

Aceste fapte indică potenţialul realizării unei voci computerizate cât mai realistice.

Sursa:  Science Alert

Vă recomandăm să citiţi şi următoarele articole:

Cum suna PRIMA VOCE înregistrată în istoria omenirii – AUDIO de colecţie
 
Explicaţia ştiinţifică pentru care oamenilor le place vocea lui Morgan Freeman
 
De ce ne auzim diferit propria voce
 
De ce nu recunoaştem propria voce înregistrată?