Iată modul revoltător prin care o companie își antrenează Inteligența Artificială! Anthropic a distrus milioane de cărți tipărite pentru a-și antrena modelul de Inteligență Artificială Claude, iar documente apărute recent sugerează că firma era pe deplin conștientă cât de prost ar fi arătat totul dacă informația ar fi devenit publică.
Modul revoltător prin care o companie își antrenează Inteligența Artificială. Inițiativa secretă, numită Project Panama, a ieșit la iveală vara trecută, în urma unui proces intentat de un grup de autori împotriva Anthropic. Compania a acceptat în cele din urmă să închidă cazul în august, printr-o înțelegere de 1,5 miliarde de dolari.
De atunci, au apărut noi detalii despre ce s-a întâmplat în culise, după ce un judecător federal a dispus desecretizarea mai multor documente din dosar, potrivit unui material publicat de Washington Post, citat de Futurism.
Documentele arată că liderii Anthropic considerau cărțile „esențiale” pentru antrenarea modelelor AI, unul dintre cofondatori afirmând că acestea ar învăța sistemele „cum să scrie bine”, în loc să imite „limbajul de slabă calitate de pe internet”.
O soluție a fost cumpărarea, scanarea și apoi distrugerea a milioane de cărți second-hand, o metodă care avea avantajul de a fi ieftină și, foarte probabil, legală. Practica se baza pe doctrina primei vânzări, un principiu juridic care le permite cumpărătorilor să facă ce doresc cu un produs achiziționat, fără intervenția deținătorului drepturilor de autor. (Acesta este și motivul pentru care există piața de produse media la mâna a doua.) În plus, conversia cărților din format fizic în format digital a fost considerată „transformatoare” de către un judecător, care a subliniat că Anthropic nu a creat copii fizice suplimentare și nu a redistribuit materialele. Acest lucru a fost suficient pentru a se încadra la utilizare corectă, permițându-i companiei să evite plata autorilor.
Din documentele procesului reiese că Anthropic a transformat literalmente distrugerea cărților într-un proces bine pus la punct. A folosit o „mașină de tăiere acționată hidraulic” pentru a „tăia ordonat” volumele cumpărate, după care paginile erau scanate cu „scanere de mare viteză și calitate, la nivel industrial”. Ulterior, o firmă de reciclare era chemată să ridice resturile.
Dacă totul pare etic discutabil, nu sunteți singurii care gândesc așa. Chiar Anthropic părea conștientă de imaginea negativă pe care ar fi putut-o genera această practică, devenind un simbol al modului în care tehnologia este percepută ca distrugând artele.
„Nu vrem să se știe că lucrăm la asta”, se arată într-un document intern de planificare din 2024, citat de Washington Post.
Înainte de a apela la cărți fizice, compania a folosit inițial cărți digitale. În 2021, cofondatorul Anthropic Ben Mann a descărcat milioane de volume de pe LibGen, o „bibliotecă din umbră” care oferă gratuit texte piratate. Un an mai târziu, Mann lăuda un site numit Pirate Library Mirror, care recunoștea deschis că „încalcă în mod deliberat” legea drepturilor de autor în majoritatea țărilor, comentând entuziast lansarea acestuia: „fix la timp!!!”. Anthropic a negat că ar fi folosit aceste cărți piratate pentru modelele sale comerciale, însă utilizarea lor a fost considerată ilegală, contribuind la acordul de 1,5 miliarde de dolari.
Anthropic nu a fost singura companie implicată în astfel de practici. Într-un alt proces intentat de autori, documentele au arătat că și Meta, compania lui Mark Zuckerberg, a obținut milioane de cărți din biblioteci piratate precum LibGen, fapt care a stârnit îngrijorări chiar în rândul angajaților.
„Descărcarea de torrente de pe un laptop corporativ nu pare în regulă”, a scris un inginer Meta în 2023, adăugând un emoji zâmbitor.
Un alt angajat, atent la imaginea publică, avertiza asupra reacțiilor negative care ar putea urma dacă informațiile ar deveni publice.
„Dacă apar materiale de presă care sugerează că am folosit un set de date despre care știm că este piratat, precum LibGen, acest lucru ne-ar putea submina poziția de negociere cu autoritățile de reglementare”, se arată într-o comunicare internă.
Logoterapia – 15 principii care te pot ajuta să găsești sens în situații limită din viață
De ce visăm atât de des că fugim, cădem sau că suntem urmăriți?
Este adevărat că pierdem cel mai mult din căldura corpului prin cap?