Il New York Times ha bloccato GPTBot, il web crawler di OpenAI, la società sviluppatrice di ChatGPT, impedendo di fatto all’azienda di utilizzare i contenuti della testata per addestrare i suoi modelli di intelligenza artificiale.
Questa mossa arriva dopo che il NYT ha aggiornato i suoi termini di servizio all’inizio del mese per vietare esplicitamente l’uso dei suoi contenuti per il training dell’AI. La nota testata sta anche valutando un’azione legale contro OpenAI per presunte violazioni del copyright, unendosi così ad altri editori e individui che hanno fatto causa all’azienda per scraping non autorizzato di contenuti protetti.
I temi trattati all’interno dell’articolo
Le implicazioni del divieto per OpenAI e per lo sviluppo dell’AI
Il divieto imposto dal NYT, verificabile direttamente visitando il file robots.txt della testata (nell’immagine), significa che OpenAI non potrà più accedere liberamente agli archivi digitali del giornale per ‘nutrire’ i suoi modelli linguistici, come ChatGPT, con dati di alta qualità. Si tratta di un duro colpo per OpenAI, dato che il training su vasti set di dati testuali – in questo caso particolarmente affidabili – è cruciale per migliorare le capacità delle AI generative e per contenere il rischio che queste producano risposte non veritiere.
Questo scontro evidenzia le complesse questioni legali ed etiche sollevate dalla rapida ascesa dell’intelligenza artificiale generativa. Mentre aziende come OpenAI cercano di creare intelligenze artificiali sempre più sofisticate, editori e creatori temono l’abuso delle proprie opere a scopo di lucro e senza ricevere alcun tipo di compenso. La battaglia tra il NYT e OpenAI potrebbe inaugurare una nuova fase nello sviluppo dell’AI, dove questioni di copyright, proprietà dei dati e benefici per la società dovranno essere attentamente bilanciate a ogni step, dalla fase di training a quella operativa.
Il NYT valuta una causa legale contro OpenAI
Gli avvocati del Times stanno valutando, inoltre, se citare in giudizio OpenAI per proteggere i diritti di proprietà intellettuale associati alla sua cronaca. Una delle principali preoccupazioni del Times è che ChatGPT stia, in un certo senso, diventando (gratuitamente) un concorrente diretto del giornale.
Un training che includa i contenuti in oggetto lo metterebbe infatti in condizione di rispondere alle domande degli utenti sulla base delle informazioni ‘apprese’ nella ‘lettura’ degli articoli originali, prodotti da un attento lavoro della redazione della nota testata americana.