Gli avvocati del New York Times e del Daily News affermano che OpenAI ha inavvertitamente cancellato dati cruciali relativi alla loro causa sul copyright contro la società per quanto riguarda l’uso non autorizzato dei loro contenuti, secondo un TechCrunch rapporto. L’incidente è avvenuto dopo che OpenAI ha accettato di fornire l’accesso ai suoi set di dati di formazione per aiutare i querelanti a verificare l’utilizzo dei loro materiali protetti da copyright.
La causa sostiene che OpenAI ha estratto articoli dal New York Times e dal Daily News senza ottenere il permesso per addestrare i suoi modelli. In risposta alla causa, OpenAI ha fornito due macchine virtuali agli avvocati degli editori per cercare nei dati di formazione i loro contenuti protetti da copyright. Dal 1° novembre, i team legali hanno dedicato più di 150 ore a questa ricerca. Tuttavia, il 14 novembre, gli ingegneri di OpenAI hanno erroneamente cancellato tutti i dati di ricerca archiviati su una delle macchine virtuali, come indicato in una dichiarazione depositata presso il tribunale distrettuale degli Stati Uniti per il distretto meridionale di New York.
I tentativi di OpenAI di recuperare i dati cancellati hanno avuto per lo più successo, ma la perdita della struttura delle cartelle e dei nomi dei file ha reso i dati recuperati inutilizzabili per monitorare dove gli articoli dei querelanti erano inclusi nella formazione dell’AI. La lettera depositata dall’avvocato dei ricorrenti sottolineava che essi dovevano ricostruire il loro lavoro, consumando ingenti risorse e tempo.
Nonostante la cancellazione dei dati, l’avvocato ha chiarito che non vi è alcuna indicazione che l’incidente fosse intenzionale. Hanno espresso preoccupazione per il fatto che OpenAI sia nella posizione ideale per effettuare ricerche nei propri set di dati, indicando l’obbligo di assistere nelle indagini su potenziali violazioni del copyright.
OpenAI ha appena reso macOS più intelligente con il supporto dell’app ChatGPT
OpenAI sostiene che l’utilizzo di dati disponibili al pubblico per addestrare i suoi modelli rientra nel “fair use”. L’azienda sostiene di non aver bisogno di concedere in licenza o di compensare questi contenuti, anche se trae profitto dai suoi prodotti di intelligenza artificiale. Ciononostante, OpenAI ha stipulato accordi di licenza con diversi editori, inclusi nomi di spicco come Associated Press e Financial Times. Sebbene i termini specifici di questi accordi rimangano sconosciuti, è stato riferito che Dotdash, uno dei partner, riceve almeno 16 milioni di dollari all’anno.
OpenAI deve ancora rilasciare una dichiarazione che affronti l’incidente o le sue implicazioni per il suo rapporto con i querelanti.
Credito immagine in primo piano: Jonathan Kemper/Unsplash