Home » D:News » Valoarea cuvintelor

Valoarea cuvintelor

Valoarea cuvintelor
Publicat: 25.08.2009
Pusa la punct de un grup de cercetatori de la Universitatea din Manchester, Marea Britanie, o metoda matematica identifica cuvintele cele mai semnificative dintr-un text.

Identificarea rapida a cuvintelor-cheie dintr-un text necunoscut reprezinta visul oricarui cercetator din domeniul lingvisticii si de-acum inainte, acest vis este realizabil gratie metodei matematice puse la punct de cercetatorii de la Universitatea din Manchester, care atribuie oricarui cuvant o “valoare informativa”, identificand astfel termenii cei mai relevanti dintr-un text citit pentru prima oara. Pentru a obtine aceasta valoare, oamenii de stiinta au masurat cat de uniform este distribuit fiecare cuvant (calculandu-i entropia conform teoriei informatiei, disciplina care studiaza elaborarea si distributia informatiei), atat intr-un text cu cuvintele aflate intr-o ordine fireasca, cat si cu ele toate amestecate. Inmultind diferenta intre cele doua valori ale entropiei fiecarui cuvant cu cu frecventa cuvantului respectiv, cercetatorii au obtinut unitatea de masura dorita: asa-numita “valoare informativa”.

Potrivit cercetatorilor englezi, ceea ce decreteaza valoarea unui termen este tocmai felul in care este distribuit intr-un text, si nu numarul absolut de repetari ale acestuia. Conjunctiile (si, asadar, deci, etc) sunt de exemplu utilizate frecvent, dar nu sunt semnificative (sunt in mod uniform distribuite atat intr-un text ordonat, cat si intr-unul dezordonat, prin urmare prezinta o valoare informativa scazuta). In schimb, tendinta de a grupa propozitiile in capitole si paragrafe confera cuvintelor semnificative o valoare foarte inalta, facandu-le recognoscibile.

Validitatea noii unitati de masura a fost confirmata de un text facut pe “Originea speciilor” a lui Charles Darwin, in care cuvintele cele mai valoroase au reiesit a fi: specie, varietate, hibrizi, forme, insule, selectie si gen. Desi sistemul pus la punct de cercetatori s-ar putea dovedi foarte util in decodificarea textelor cifrate sau scrise in limbi necunoscute, aplicatia principala a acestuia ar putea sa nu fie literatura, ci biologia, mai exact identificarea acelor gene care transporta informatii utile, considera Marcelor Montemuro, seful echipei de cercetare. “De altfel, atunci cand privim genomul ne pare cu adevarat ca ne aflam in fata unei limbi straine”, a precizat el. 

Sursa: Galileo

CITESTE SI:

 

 

 

 

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Cel mai bătrân strămoș al rechinilor înota în apele Australiei pe vremea dinozaurilor
Cel mai bătrân strămoș al rechinilor înota în apele Australiei pe vremea dinozaurilor
Legendele uitate care au modelat miturile arturiene: Iosif din Arimateea și primii Vânători ai Graalului
Legendele uitate care au modelat miturile arturiene: Iosif din Arimateea și primii Vânători ai Graalului
Cum îi sprijinim pe cei care au pierdut pe cineva drag ori sunt la final de viață? Ghid empatic, bazat pe psihologie
Cum îi sprijinim pe cei care au pierdut pe cineva drag ori sunt la final de viață? Ghid empatic, bazat pe psihologie
Gardieni, creatori și simboluri ale puterii: Dragonii nu au fost întotdeauna personaje negative
Gardieni, creatori și simboluri ale puterii: Dragonii nu au fost întotdeauna personaje negative
Ce se întâmplă cu creierul atunci când lucrezi în echipă?
Ce se întâmplă cu creierul atunci când lucrezi în echipă?
Locul în care trăiești influențează ce greutate ai, arată un nou studiu
Locul în care trăiești influențează ce greutate ai, arată un nou studiu
Test de cultură. Care fasole este toxică atunci când este mâncată crudă?
Test de cultură. Care fasole este toxică atunci când este mâncată crudă?
JWST a descoperit o galaxie spirală asemănătoare Căii Lactee undeva unde nu ar trebui să existe
JWST a descoperit o galaxie spirală asemănătoare Căii Lactee undeva unde nu ar trebui să existe
10 obiceiuri prin care putem încetini îmbătrânirea corpului nostru
10 obiceiuri prin care putem încetini îmbătrânirea corpului nostru
Ziua în care Alexandru Ioan Cuza a introdus învăţământul obligatoriu şi gratuit. Ce păţeau părinţii care nu se supuneau legii
Ziua în care Alexandru Ioan Cuza a introdus învăţământul obligatoriu şi gratuit. Ce păţeau părinţii care nu se ...
20 de lucruri uimitoare despre creierul uman
20 de lucruri uimitoare despre creierul uman
Marile companii de Inteligență Artificială sunt „mai puțin reglementate decât restaurantele”
Marile companii de Inteligență Artificială sunt „mai puțin reglementate decât restaurantele”
Trei reguli pe care părinții ar trebui să le aplice în privința telefoanelor pentru copii
Trei reguli pe care părinții ar trebui să le aplice în privința telefoanelor pentru copii
Românii vor avea facturi mai mari la gaze de la 1 aprilie 2026
Românii vor avea facturi mai mari la gaze de la 1 aprilie 2026
ESA intensifică cercetarea Pământului pe măsură ce viitorul agențiilor americane devine tot mai incert
ESA intensifică cercetarea Pământului pe măsură ce viitorul agențiilor americane devine tot mai incert
Un bazin roman monumental, ascuns timp de 2.000 de ani, a fost dezgropat lângă Roma
Un bazin roman monumental, ascuns timp de 2.000 de ani, a fost dezgropat lângă Roma
Un expert spune că modelele lingvistice mari nu vor fi niciodată cu adevărat inteligente
Un expert spune că modelele lingvistice mari nu vor fi niciodată cu adevărat inteligente
PRESS RELEASE: The concept of the DraculaLand project is being launched in Romania – a private investment of over EUR 1 billion, designed to become the largest entertainment, retail, and technology destination on the continent, one that will transform the country into a new global epicenter of entertainment
PRESS RELEASE: The concept of the DraculaLand project is being launched in Romania – a private investment of over EUR 1 ...