◂ UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ● ÎMPREUNĂ SCRIEM ISTORIA CLIPEI ● UZPR ▸

Uniunea Ziariștilor Profesioniști din România

The Union of Professional Journalists of Romania www.uzpr.ro07.05.2024

Site-urile de știri de top ale lumii se închid
în fața „păianjenilor” AI, care extrag date
pentru antrenarea marilor modele de limbaj

Companii precum OpenAI (care a creat ChatGPT) și Google (Gemini, numită anterior Bard) folosesc crawlere („păianjeni”) pentru a extrage datele de pe site-uri web pentru a-și antrena modele de limbaj mari (LLM). De asemenea, acestea pot fi folosite pentru a prelua informații de pe site-uri web în timp real, ca răspuns la solicitările utilizatorilor. Dar dacă site-urile web aleg să blocheze aceste crawlere (și nu se face niciun alt tip de aranjament cu companiile care dezvoltă AI), nimic din toate acestea nu este permis. Până la sfârșitul anului 2023, 48% dintre cele mai utilizate site-uri de știri din zece țări blocau crawlerele OpenAI, iar un sfert crawlerul AI al Google. 97% dintre site-urile care au decis să blocheze crawler-ul AI al Google le-au blocat și pe cele ale OpenAI. În general, organizațiile media din Nordul Global au blocat în nnumăr mai mare aceste „târâtoare” decât cele din Sudul Global.

 

Presa „veche”,  mai predispusă să blocheze acest sistem

Proporția site-urilor de știri care au blocat OpenAI variază în funcție de țară: 79% în SUA, 20% în Mexic și Polonia. Pentru Google, cifrele au variat de la 60% în Germania până la 7% în Polonia și Spania. În 2023, niciunul dintre site-urile web care au decis să blocheze aceste crawlere nu și-a modificat decizia. Odată instruită, această memorie uriașă poate produce rezultate și răspunde la întrebările oamenilor prin interfețe precum ChatGPT. Deși modelele nu trebuie să fie „conectate” la internet pentru a face acest lucru, odată instruite, acestea pot fi conectate la web, permițându-le să preia informații de pe site-uri web în timp real, care pot fi apoi folosite ca instrucțiuni. În acest fel, marile modele de limbaj pot fi folosite ca alternativă la alte tipuri de căutare, potrivit reutersinstitute.politics.ox.ac.uk.

Pe de altă parte, site-urile de știri cu o acoperire relativ mare au fost mai relaxate în abordarea față de crawlerele AI, iar presa „veche” (site-urile tipăriturilor în principal) s-a dovedit mai predispusă să blocheze acest sistem de extragere de date. Potrivit sursei, editorii de știri blochează într-o proporție mai mare crawlerele AI decât site-urile web populare.

 

Potențială atribuire de informații incorecte, neverificate

Crawlerele web (uneori denumite „păianjeni” sau „boți”) navighează automat pe web, colectând sistematic date, pe măsură ce circulă și pot fi folosite pentru o varietate de scopuri. Dintr-o varietate de motive, editorii de știri nu-și doresc utilizarea conținutului lor de către companiile AI. New York Times crede că ar trebui să existe compensație financiară pentru utilizarea conținutului propriu pentru a antrena modele AI. Iar dacă oamenii folosesc inteligența artificială pentru a obține cele mai recente știri de pe web, organismele media s-ar putea îngrijora că li se atribuie rezultate incorecte sau că utilizatorii nu vor fi conectați înapoi la editori, pentru ca aceștia să monetizeze corectitudinea informațiilor. De asemenea, numeroși editori de top doresc ca jurnalismul lor să apară atunci când oamenii folosesc inteligența artificială generativă în scopuri legate de știri. Pe de altă parte, câțiva – precum Axel Springer – au încheiat deja înțelegeri cu companii precum OpenAI, permițându-le să răspundă la întrebările utilizatorilor cu știri de pe site-urile lor. În paralel, editorii de știri din întreaga lume experimentează în prezent cu instrumente AI pentru a vedea dacă pot crea experiențe noi pentru utilizatori, pot îmbunătăți eficiența și pot reduce costurile. (redacția UZPR)

Foto: pixabay.com

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *