Home » D:News » Valoarea cuvintelor

Valoarea cuvintelor

Valoarea cuvintelor
Publicat: 25.08.2009
Pusa la punct de un grup de cercetatori de la Universitatea din Manchester, Marea Britanie, o metoda matematica identifica cuvintele cele mai semnificative dintr-un text.

Identificarea rapida a cuvintelor-cheie dintr-un text necunoscut reprezinta visul oricarui cercetator din domeniul lingvisticii si de-acum inainte, acest vis este realizabil gratie metodei matematice puse la punct de cercetatorii de la Universitatea din Manchester, care atribuie oricarui cuvant o “valoare informativa”, identificand astfel termenii cei mai relevanti dintr-un text citit pentru prima oara. Pentru a obtine aceasta valoare, oamenii de stiinta au masurat cat de uniform este distribuit fiecare cuvant (calculandu-i entropia conform teoriei informatiei, disciplina care studiaza elaborarea si distributia informatiei), atat intr-un text cu cuvintele aflate intr-o ordine fireasca, cat si cu ele toate amestecate. Inmultind diferenta intre cele doua valori ale entropiei fiecarui cuvant cu cu frecventa cuvantului respectiv, cercetatorii au obtinut unitatea de masura dorita: asa-numita “valoare informativa”.

Potrivit cercetatorilor englezi, ceea ce decreteaza valoarea unui termen este tocmai felul in care este distribuit intr-un text, si nu numarul absolut de repetari ale acestuia. Conjunctiile (si, asadar, deci, etc) sunt de exemplu utilizate frecvent, dar nu sunt semnificative (sunt in mod uniform distribuite atat intr-un text ordonat, cat si intr-unul dezordonat, prin urmare prezinta o valoare informativa scazuta). In schimb, tendinta de a grupa propozitiile in capitole si paragrafe confera cuvintelor semnificative o valoare foarte inalta, facandu-le recognoscibile.

Validitatea noii unitati de masura a fost confirmata de un text facut pe “Originea speciilor” a lui Charles Darwin, in care cuvintele cele mai valoroase au reiesit a fi: specie, varietate, hibrizi, forme, insule, selectie si gen. Desi sistemul pus la punct de cercetatori s-ar putea dovedi foarte util in decodificarea textelor cifrate sau scrise in limbi necunoscute, aplicatia principala a acestuia ar putea sa nu fie literatura, ci biologia, mai exact identificarea acelor gene care transporta informatii utile, considera Marcelor Montemuro, seful echipei de cercetare. “De altfel, atunci cand privim genomul ne pare cu adevarat ca ne aflam in fata unei limbi straine”, a precizat el. 

Sursa: Galileo

CITESTE SI:

 

 

 

 

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Un crater din Canada, numit și „Ochiul din Quebec”, arată extrem de ciudat
Un crater din Canada, numit și „Ochiul din Quebec”, arată extrem de ciudat
Un schelet fără cap, vechi de 9.500 de ani, este cel mai vechi adult incinerat din Africa
Un schelet fără cap, vechi de 9.500 de ani, este cel mai vechi adult incinerat din Africa
De ce bătrânii sunt mai predispuși să distribuie informații greșite online?
De ce bătrânii sunt mai predispuși să distribuie informații greșite online?
Un studiu a descoperit cel mai frumos mod prin care să-ți menții creierul tânăr
Un studiu a descoperit cel mai frumos mod prin care să-ți menții creierul tânăr
Lacul din Canada care este pe cât de colorat, pe atât de urât mirositor
Lacul din Canada care este pe cât de colorat, pe atât de urât mirositor
Arheologii au descoperit cel mai mare și mai vechi oraș preistoric găsit vreodată în Irlanda
Arheologii au descoperit cel mai mare și mai vechi oraș preistoric găsit vreodată în Irlanda
Predicțiile The New York Times pentru 2026. Cum va răspunde lumea la excesul tehnologic?
Predicțiile The New York Times pentru 2026. Cum va răspunde lumea la excesul tehnologic?
De ce nu ne putem mișca degetele de la picioare unul câte unul?
De ce nu ne putem mișca degetele de la picioare unul câte unul?
Test de cultură generală. Care este diferența dintre cafea și ceai?
Test de cultură generală. Care este diferența dintre cafea și ceai?
Top 4 momente în care Inteligența Artificială a scăpat de sub control, de la chatboți controversați la experimente politice
Top 4 momente în care Inteligența Artificială a scăpat de sub control, de la chatboți controversați la experimente ...
Premii record la Australian Open 2026. Ce au anunțat organizatorii?
Premii record la Australian Open 2026. Ce au anunțat organizatorii?
Reguli drastice pentru turiștii care vor să ajungă într-o destinație turistică foarte populară
Reguli drastice pentru turiștii care vor să ajungă într-o destinație turistică foarte populară
Hirohito, împăratul care a domnit 62 de ani. După ce a permis atrocităţile totalitare s-a supus generalului american Douglas MacArthur
Hirohito, împăratul care a domnit 62 de ani. După ce a permis atrocităţile totalitare s-a supus generalului american ...
Risc de contaminare cu lapte praf. Nestlé anunță o retragere globală!
Risc de contaminare cu lapte praf. Nestlé anunță o retragere globală!
Pas strategic major anunțat de Nvidia la CES 2026
Pas strategic major anunțat de Nvidia la CES 2026
Cea mai frumoasă călătorie cu trenul din lume costă doar 15 euro
Cea mai frumoasă călătorie cu trenul din lume costă doar 15 euro
Roboții Atlas de la Boston Dynamics vor fi folosiți în fabricile producătorului auto Hyundai
Roboții Atlas de la Boston Dynamics vor fi folosiți în fabricile producătorului auto Hyundai
O maimuță misterioasă de acum 7 milioane de ani ar putea fi cel mai vechi hominid biped
O maimuță misterioasă de acum 7 milioane de ani ar putea fi cel mai vechi hominid biped