Prima pagină D:News

Un software sofisticat poate prezice ştirile de mâine analizând prezentul şi trecutul

Redactia Descopera.ro | 02.05.2013 | ● Vizualizări: 148
Un software specializat care analizează un volum mare de date poate prezice evenimentele de mâine     + zoom
Galerie foto (1)

Cercetătorii au conceput un software care prezice când şi unde vor izbucni noi epidemii pe baza articolelor din ultimele decenii din New York Times şi pe baza altor date disponibile pe Internet. Cercetarea a fost realizată de specialişti de la Microsoft şi de la Institutul de Tehnologie Technion-Israel.

Sistemul ar putea ajuta organizaţiile nonguvernamentale şi alte instituţii să fie mai proactive în combaterea afecţiunilor şi a altor probleme, a explicat Eric Horvitz, cercetător la Microsoft Research. „Cred că acest sistem anticipează viitorul”, a explicat Horbitz. „În cele din urmă, acest tip de efort va avea o influenţă semnificativă asupra oamenilor”, spune expertul. 

Atunci când cercetătorii au testat sistemul folosind date istorice, rezultatele au fost extraordinare. De exemplu, pornind de la ştirile referitoare la seceta din Angola din 2006, sistemul a lansat un avertisment cu referire la posibilitatea unei epidemii de holeră, deoarece datele istorice arătau că epidemiile de holeră erau mai probabile în anii ce urmau perioadele secetoase. Un al doilea avertisment referitor la holera din Angola a fost lansat după ce în 2007 în ţara africană s-au înregistrat furtuni puternice. La o săptămână distanţă au apărut şi ştirile care au confirmat apariţia holerei. În alte teste în care software-ul prezicea apariţia bolilor, a violenţei şi a unui număr mare de decese, previziunile sistemului s-au dovedit a fi corecte în 70%-90% dintre cazuri.

Horvitz afirmă că rata de succes a sistemului este suficient de bună, ceea ce sugerează că o variantă mai rafinată a tehnologiei ar putea fi folosită în realitate pentru a ajuta, de exemplu, experţii din cadrul organizaţiilor care oferă ajutoare umanitare să planifice mai bine reacţiile la evenimente. „Intenţionăm să discutăm cu reprezentanţii acestor organizaţii”, spune Horvitz.

Sistemul a fost construit cu ajutorul a 22 de ani de arhive ale ziarului New York Times, din 1986 până în 2007, dar foloseşte şi date de pe Internet pentru a învăţa mai multe detalii despre întâmplările precursoare ale evenimentelor importante.

„O altă sursă utilă este DBpedia, care este o formă structurată a informaţiilor disponibile pe Wikipedia”, a spus Kira Radinsky, cercetător în cadrul Institutului Technion-Israel. „Putem înţelege poziţionare evenimentelor menţionate la ştiri, câţi bani câştigă bărbaţii de acolo şi chiar informaţii despre politică”, explică Radinsky. Alte surse includ WordNet, un site ce permite sistemelor software să înţeleagă sensul cuvintelor şi OpenCyc, o bază de date.

Toate aceste informaţii permit sistemului să înţeleagă contextul evenimentelor, acesta fiind de multe ori absent din ştirile publicate de presă. Acest context este necesar pentru a înţelege regulile ce explică de ce unele evenimente prezic apariţia altor evenimente. De exemplu, sistemul poate înţelege că conexiunile între evenimentele din oraşele din Rwanda şi cele din oraşele din Angola se datorează faptului că ambele ţări se află în Africa, au un PIB similar şi altor factori. Pe baza acestei metode, sistemul a concluzionat că factorii relevanţui pentru elaborarea unei predicţii despre epidemiile de holeră includ amplasarea oraşelor, proporţia teritoriului pe care se află întinderi de apă, densitatea populaţiei, PIB-ul şi dacă s-a înregistrat secetă în anul precedent.

Instrumentul conceput de Horvitz şi Radinsky nu este primul sistem automat care prezice evenimentele din viitor, dar cei doi cercetători afirmă că software-ul lor foloseşte mai multe surse de date (peste 90) decât oricare alt sistem, ceea ce permite utilizarea sa pentru mai multe tipuri de predicţii.

Printre celelalte companii din acest domeniu se numără Recorded Future, care are printre clienţii săi şi mai multe agenţii de informaţii din SUA.

Microsoft nu intenţionează să comercializeze în acest moment cercetările făcute de Horvitz şi Radinsky, dar proiectul va continua să se desfăşoare. Cercetătorii vor să includă mai multe surse de date în sistemul lor. „În ultimele decenii s-au schimbat multe lucruri pe Terra, dar natura umană şi numeroase aspecte ale mediului au rămas la fel. De aceea cred că sistemul poate detecta tipare chiar şi în datele foarte vechi, acestea oferind noi indicii despre viitor”, concluzionează Horvitz.

Sursa: Technology Review