Home » D:News » Tehnologia care dă mari bătăi de cap Inteligenței Artificiale

Tehnologia care dă mari bătăi de cap Inteligenței Artificiale

Tehnologia care dă mari bătăi de cap Inteligenței Artificiale
Foto: Shutterstock
Publicat: 13.03.2026

Formatul PDF este unul dintre cele mai răspândite tipuri de documente din lume, dar pentru sistemele de inteligență artificială rămâne surprinzător de dificil de analizat.

Specialiștii spun că limitările tehnice ale acestui format ar putea duce, pe termen lung, chiar la înlocuirea lui cu alternative mai ușor de citit de către mașini.

PDF-ul (Portable Document Format) a fost creat de compania Adobe în 1993 pentru a permite deschiderea documentelor pe orice computer fără a modifica aspectul acestora. De-a lungul anilor, formatul a devenit standard pentru documente oficiale, formulare administrative, lucrări academice sau documente de lucru, scrie Il Post.

Un PDF funcționează mai degrabă ca o „fotografie” a unui document

Problema este că PDF-urile au fost concepute în primul rând pentru a fi citite de oameni, nu de programe informatice. Deși modelele moderne de inteligență artificială pot analiza texte complexe, ele întâmpină dificultăți atunci când încearcă să interpreteze structura unui document PDF. De exemplu, atunci când textul este organizat în coloane, include grafice sau tabele. Din aceste motive, programele pot interpreta greșit ordinea informațiilor, ceea ce duce la rezultate confuze.

Din punct de vedere tehnic, un PDF funcționează mai degrabă ca o „fotografie” a unui document. Fișierul conține instrucțiuni pentru a reproduce exact aceeași pagină pe orice dispozitiv. Pentru a extrage textul, programele trebuie să folosească tehnologii de recunoaștere optică a caracterelor (OCR), care transformă imaginile în text digital. Aceste sisteme funcționează relativ bine în cazul documentelor simple. Ele întâmpină probleme majore atunci când fișierele conțin scanări, scris de mână sau structuri grafice complexe.

Limitările PDF-urilor reprezintă o problemă dublă

În schimb, alte formate precum HTML sunt mult mai ușor de analizat de către inteligența artificială. Explicația este că acestea includ etichete care indică structura documentului: titluri, subtitluri sau paragrafe.

Limitările PDF-urilor reprezintă o problemă dublă pentru companiile din domeniul inteligenței artificiale. Pe de o parte, utilizatorii se confruntă frecvent cu dificultăți atunci când încearcă să ofere documente PDF pentru analiză sau rezumare. Pe de altă parte, aceste limitări împiedică accesul la un volum uriaș de conținut de calitate care ar putea fi folosit pentru antrenarea modelelor AI. Estimările arată că între 80% și 90% dintre datele existente în companii sunt stocate în formate „nestructurate”. Iar aici sunt incluse PDF-uri, înregistrări audio sau video, care sunt dificil de analizat automat.

În contextul creșterii rapide a industriei AI, mai multe companii încearcă să găsească soluții pentru această problemă. Startup-ul israelian Factify a atras recent peste 70 de milioane de dolari pentru dezvoltarea unui nou tip de format de document. El a fost conceput pentru a păstra avantajele PDF-ului, dar care să poată fi analizat mai ușor de sistemele de inteligență artificială.

În paralel, compania europeană Mistral a lansat un sistem OCR bazat pe AI pentru a îmbunătăți citirea documentelor PDF. Momentan, rezultatele nu sunt încă semnificativ mai bune decât cele ale tehnologiilor existente.

Pentru moment, PDF-ul rămâne standardul dominant pentru documente digitale. Totuși, pe măsură ce inteligența artificială devine tot mai importantă în analizarea datelor, presiunea pentru dezvoltarea unor formate mai prietenoase cu mașinile este tot mai mare.

Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Ziua în care Rusia l-a regăsit pe Ţareviciul Alexei, ucis de bolşevici la 14 ani
Ziua în care Rusia l-a regăsit pe Ţareviciul Alexei, ucis de bolşevici la 14 ani
Inteligența Artificială ar putea detecta ADHD la copii înainte de apariția simptomelor
Inteligența Artificială ar putea detecta ADHD la copii înainte de apariția simptomelor
O regiune turistică din Italia oferă 100.000 de euro străinilor care vor să se mute acolo
O regiune turistică din Italia oferă 100.000 de euro străinilor care vor să se mute acolo
Turiștii care se pregătesc de o croazieră trebuie să știe ce este regula celor 40 de minute
Turiștii care se pregătesc de o croazieră trebuie să știe ce este regula celor 40 de minute
Previziunea unui mare diplomat român făcută în 1952: „Când va scăpa de comunism, România va deveni…”
Previziunea unui mare diplomat român făcută în 1952: „Când va scăpa de comunism, România va deveni…”
Vogue vine oficial în România! Revista iconică se lansează în 2027 și promite să ducă moda românească pe scena globală
Vogue vine oficial în România! Revista iconică se lansează în 2027 și promite să ducă moda românească pe scena globală
Noi cercetări ADN tocmai au rescris originea speciei umane
Noi cercetări ADN tocmai au rescris originea speciei umane
Se pare că nu doar oamenii, ci și papagalii folosesc nume pentru a vorbi între ei
Se pare că nu doar oamenii, ci și papagalii folosesc nume pentru a vorbi între ei
Adrian Răduță vine la „Podcast cu Prioritate” by ProMotor pe 4 mai. Episod despre motocros, disciplină și culisele unui sport spectaculos
Adrian Răduță vine la „Podcast cu Prioritate” by ProMotor pe 4 mai. Episod despre motocros, disciplină și culisele ...
Cum erau pregătite vânătorile la care participa Nicolae Ceaușescu
Cum erau pregătite vânătorile la care participa Nicolae Ceaușescu
TIME100: cine influențează lumea în 2026, de la Xi Jinping la o activistă de 96 de ani
TIME100: cine influențează lumea în 2026, de la Xi Jinping la o activistă de 96 de ani
Cercetătorii au descoperit că mișcarea abdominală elimină „gunoiul” din creier
Cercetătorii au descoperit că mișcarea abdominală elimină „gunoiul” din creier
Cafeaua poate îmbunătăți performanțele cognitive chiar și fără cofeină
Cafeaua poate îmbunătăți performanțele cognitive chiar și fără cofeină
Revoluția AI în birouri: Meseriile care dispar și noile competențe tehnologice necesare pentru a rămâne relevant pe piața muncii în 2026 (P)
Revoluția AI în birouri: Meseriile care dispar și noile competențe tehnologice necesare pentru a rămâne relevant pe ...
Este adevărat că apa de gură face rău inimii? Iată ce spun oamenii de știință!
Este adevărat că apa de gură face rău inimii? Iată ce spun oamenii de știință!
Test de cultură generală. De ce închidem ochii atunci când strănutăm?
Test de cultură generală. De ce închidem ochii atunci când strănutăm?
Oamenii de știință spun că au descoperit cum am putea ajunge la Alpha Centauri în doar 20 de ani
Oamenii de știință spun că au descoperit cum am putea ajunge la Alpha Centauri în doar 20 de ani
Mâinile nu mint? Noua obsesie din industria frumuseții mută atenția dincolo de pielea feței
Mâinile nu mint? Noua obsesie din industria frumuseții mută atenția dincolo de pielea feței