ChatGPT e simili stanno sottraendo contenuti: ora dovranno pagare


Finora intelligenze artificiali come ChatGPT, Gemini o Claude prelevavano gratuitamente contenuti dalla rete. Ora Cloudflare introduce una tariffa. Chi desidera informazioni, dovrà pagare.
Finora intelligenze artificiali come ChatGPT, Gemini o Claude prelevavano gratuitamente contenuti dalla rete. Ora Cloudflare introduce una tariffa. Chi desidera informazioni, dovrà pagare.
ZURIGO - Programmi di intelligenza artificiale come ChatGPT accedono a migliaia di siti web per raccogliere dati o generare risposte, ma quasi mai reindirizzano gli utenti su queste pagine. Secondo l’azienda Cloudflare, il crawler di OpenAI (l’azienda dietro ChatGPT) visita 1'700 pagine prima reindirizzare un singolo utente. Per un’altra azienda, Anthropic (Claude.ai), il rapporto è di 73'000 pagine per ogni reindirizzamento. Google, secondo Cloudflare, conta un clic ogni 18 accessi.
Pay per Crawl è un nuovo modello di pagamento su Internet.I gestori dei siti web possono stabilire che le aziende IA o i motori di ricerca paghino una tariffa per la scansione automatica (crawling) dei loro contenuti.In questo modo i proprietari dei siti mantengono maggiore controllo sull’uso dei loro contenuti, e possono anche guadagnarci.Il modello è particolarmente rilevante quando le grandi aziende vogliono utilizzare i contenuti per l'intelligenza artificiale o per servizi di ricerca.
In breve, il "pay per crawl" è come una quota di iscrizione per i crawler AI che vogliono raccogliere contenuti.
I gestori devono scegliere: consentire l’accesso, bloccare le IA o richiedere una tariffa. Cloudflare incassa il denaro e lo inoltra. Più di 50 grandi piattaforme – tra cui Time, Reddit, Buzzfeed – supportano già questo modello.
Cosa significa per gli utenti - Per ora gli utenti se ne accorgono poco, ma la situazione potrebbe presto cambiare. Chi utilizza ChatGPT, Google o altri strumenti IA, ne risentirà:
- Le risposte peggioreranno: Se le IA perdono l’accesso a contenuti importanti, la qualità delle risposte ne risente, soprattutto su temi attuali.
- Le IA privilegiano ciò che è disponibile, non ciò che è di qualità: Dominerà ciò che è liberamente accessibile: blog e forum spodesteranno i contenuti professionali.
- Le offerte gratuite diminuiranno: Se le aziende devono pagare di più, i costi ricadranno sugli utenti, con abbonamenti alle IA o versioni gratuite ridotte.
Cosa le IA sanno, e cosa mettono a disposizione, diventa quindi una questione economica.
Critiche dal consulente SEO - Il consulente SEO e Digital Marketing statunitense Bill Hartzer è critico: «Per il 99 per cento dei siti web questa è una trappola per il traffico, camuffata da fonte di guadagno». Solo i grandi siti possono permettersi determinati costi. I piccoli rischiano di essere ignorati dalle IA. Hartzer consiglia loro di lasciare l’accesso libero per restare visibili.
Ringier vuole restare visibile nelle ricerche IA - Il gruppo mediatico Ringier consente ad aziende come OpenAI l’accesso ai contenuti, ma solo previo consenso. «Ci asteniamo dal bloccare tecnicamente i crawler, ma solo con il consenso esplicito. Questo è previsto nei nostri termini e condizioni», comunica Ringier.
Per l’azienda è fondamentale essere presenti nel nuovo mondo delle ricerche basate su IA. «Vogliamo essere riconosciuti dagli algoritmi come rilevanti».L'azienda sta monitorando gli sviluppi a livello internazionale e adeguerà il proprio posizionamento di conseguenza.
TX Group punta alla protezione dei contenuti giornalistici - TX Group (di cui fa parte anche 20 minuti) accoglie con favore nuove soluzioni tecniche come il modello Cloudflare. «Visti i rapidi sviluppi del mercato IA, è positivo che stiano nascendo sempre più opzioni, sia tramite accordi diretti con i fornitori IA sia tramite strumenti come ‘Pay per Crawl’», comunica l’azienda.
La partecipazione è una scelta di ogni singola testata. «TX Group supporta 20 minuti e Tamedia nelle decisioni, ma la scelta di proteggere i contenuti spetta alle testate». L’azienda osserva attentamente il mercato e testa costantemente nuovi approcci per prevenire l’uso indesiderato delle IA.
Allenamento IA con contenuti web: una zona grigia - Secondo l’esperto svizzero di diritti d’autore Raphael Zingg, la raccolta massiva di contenuti web da parte delle IA richiede di regola un consenso: «Il data-scraping è una riproduzione rilevante ai fini del diritto d’autore». Se anche l’allenamento dei modelli IA rientri in questa casistica è oggetto di dibattito giuridico. Molti esperti svizzeri ritengono necessaria una licenza.
Barriere tecniche come ‘robots.txt’ non hanno valore legale: «E non sono una protezione efficace».
L’industria musicale vede poche possibilità - Anche la Cooperativa degli autori ed editori di musica SUISA valuta il modello Cloudflare in modo differenziato. Per i siti con contenuti letterari o giornalistici è una misura efficace. Per la musica invece serve a poco, perché i brani sono pubblicati decentralmente su molte piattaforme. Un singolo blocco serve a poco. SUISA chiede invece regole chiare, standard internazionali e, se necessario, iniziative politiche o azioni legali.
Possibili regolamentazioni - Poiché Cloudflare funge da intermediario dei pagamenti e controlla l’accesso, i critici temono una possibile concentrazione di potere. Secondo alcuni media, l’UE sta valutando se l’azienda debba essere regolamentata dal Digital Markets Act (DMA) come cosiddetto gatekeeper.
Un gatekeeper è un’azienda che svolge un ruolo particolarmente importante come intermediario su Internet. Garantisce che altre aziende o utenti abbiano accesso a certi servizi o piattaforme digitali, o che non lo abbiano. In questo modo i gatekeeper possono esercitare grande influenza sul mercato e sulle scelte degli utenti.
Resistenza da parte di OpenAI - OpenAI respinge il modello nella sua forma attuale. L’azienda è in linea di principio disposta a pagare per i contenuti, ma non vuole negoziare tramite Cloudflare. Preferisce accordi diretti con i fornitori di contenuti.