L’Internet Archive ha perso una significativa battaglia legale dopo che la Corte d’appello degli Stati Uniti ha confermato una sentenza dominante in Hachette contro Internet Archive, affermando che le sue pratiche di digitalizzazione e prestito di libri violavano la legge sul copyright. Il caso è nato dall’iniziativa National Emergency Library dell’Archivio durante la pandemia, che ha consentito il prestito digitale illimitato di libri, scatenando la reazione negativa di editori e autori. La corte ha respinto la difesa del fair use dell’Archivio, sebbene abbia riconosciuto il suo status di organizzazione non-profit. Questa sentenza rafforza il controllo di autori ed editori sulle loro opere. Ma mi ricorda immediatamente come gli strumenti di intelligenza artificiale addestrano e utilizzano i dati su Internet, inclusi libri e altro ancora. Se il lavoro svolto dall’organizzazione non-profit Internet Archive non costituisce un uso corretto, come utilizzano questi dati gli strumenti di intelligenza artificiale a pagamento?
Nonostante i numerosi Cause legali sul copyright dell’intelligenza artificialedati basati su testo da organi di informazione di solito non si traduce in sentenze severe contro gli strumenti di intelligenza artificiale, spesso concludendosi con partnership con attori principali.
Potresti pensare che sia diverso e sostenere che Internet Archive utilizza direttamente i libri, ma anche se gli strumenti di intelligenza artificiale si basano su tutti i dati in loro possesso per generare il tuo saggio, puoi comunque ottenere estratti specifici o risposte più dettagliate se utilizzi un prompt ben formulato.
Il caso Hachette contro Internet Archive evidenzia notevoli preoccupazioni su come i modelli di intelligenza artificiale acquisiscono dati di addestramento, soprattutto quando si tratta di materiali protetti da copyright come i libri. I sistemi di intelligenza artificiale spesso si basano su grandi set di dati, inclusi testi protetti da copyright, sollevando simili sfide legali per quanto riguarda l’uso non autorizzato. Se i tribunali limitano la digitalizzazione e l’uso di opere protette da copyright senza autorizzazione, le aziende di intelligenza artificiale potrebbero dover ottenere licenze per i testi utilizzati nell’addestramento, aggiungendo complessità e potenziali costi. Ciò potrebbe limitare l’accesso a set di dati diversificati e di alta qualità, influenzando in ultima analisi lo sviluppo e l’innovazione dell’intelligenza artificiale.
Inoltre, il caso sottolinea i limiti dell’ uso corretto difesa nel contesto dell’uso trasformativo, che è spesso centrale nella giustificazione dell’IA per l’uso di dati di testo su larga scala. Se i tribunali considerano in modo restrittivo cosa costituisce un uso corretto, gli sviluppatori di IA potrebbero dover affrontare maggiori restrizioni su come accedono e utilizzano libri protetti da copyright. Questa tensione tra la protezione dei diritti degli autori e il mantenimento del libero accesso alla conoscenza potrebbe avere conseguenze di vasta portata per il futuro delle pratiche di formazione dell’IA e l’uso etico dei dati.
Hai bisogno di approfondire il caso? Ecco tutto quello che devi sapere a riguardo.
Hachette contro Internet Archive spiegato
Hachette contro Internet Archive è un caso legale significativo che ruota attorno alla legge sul copyright e ai limiti della dottrina del “fair use” nel contesto delle biblioteche digitali. Il caso è iniziato nel 2020, quando diverse grandi case editrici (Hachette, HarperCollins, Penguin Random House e Wiley) hanno fatto causa a Internet Archive, un’organizzazione non-profit dedicata alla conservazione di copie digitali di siti web, libri e altri media.
Il caso si è concentrato sulla pratica dell’Archivio di scansionare libri e prestarli online.
La storia dietro la causa contro Internet Archive
IL Biblioteca aperta progetto, gestito dall’Internet Archive, è stato creato per consentire alle persone di prendere in prestito libri in formato digitale. Ecco come funzionava:
- L’Internet Archive ha acquistato copie fisiche dei libri.
- Hanno digitalizzato questi libri.
- Le persone potevano prendere in prestito una versione digitale, ma solo una persona alla volta poteva prendere in prestito un libro, proprio come si fa con un libro cartaceo in una normale biblioteca.
L’Internet Archive pensava che questo fosse legale perché permetteva a una sola persona di prendere in prestito un libro alla volta. Chiamavano questo sistema Prestito digitale controllato (CDL)L’idea era di far funzionare il prestito digitale proprio come il prestito fisico in biblioteca.
Quando la pandemia di COVID-19 ha colpito all’inizio del 2020, molte biblioteche hanno dovuto chiudere, rendendo difficile per le persone accedere ai libri. Per aiutare, Internet Archive ha lanciato Biblioteca nazionale di emergenza (NEL) a marzo 2020. Questo programma ha cambiato le cose:
- Il NEL ha consentito a più persone di prendere in prestito la stessa copia digitale di un libro contemporaneamente. Ciò ha rimosso la regola di una persona alla volta.
- L’obiettivo era quello di consentire a più persone di accedere ai libri durante la pandemia, in particolare a studenti e ricercatori bloccati a casa.
Sebbene il NEL dovesse essere temporaneo, ha fatto arrabbiare autori ed editori. Hanno sostenuto che permettere a molte persone di prendere in prestito la stessa copia digitale senza permesso era come rubare il loro lavoro.
La rivolta degli editori
Nel giugno 2020, i grandi editori hanno fatto causa all’Internet Archive. Hanno affermato:
- L’Internet Archive non aveva l’autorizzazione a scansionare i propri libri né a prestarli in formato digitale.
- Così facendo, l’Internet Archive violava il proprio copyright, che gli conferisce il diritto esclusivo di controllare il modo in cui i propri libri vengono copiati e condivisi.
- L’approccio della NEL, che consentiva a molte persone di prendere in prestito copie digitali contemporaneamente, era particolarmente dannoso per la loro attività e costituiva sostanzialmente pirateria.
Gli editori hanno sostenuto che le azioni di Internet Archive hanno danneggiato il mercato dei loro libri. Hanno detto che le persone stavano ottenendo versioni digitali gratuite invece di acquistare ebook o di prenderli in prestito da biblioteche autorizzate.
La difesa di Internet Archive
L’Internet Archive si è difeso sostenendo che il suo lavoro era protetto da uso corretto. Il fair use consente un uso limitato di materiale protetto da copyright senza autorizzazione per scopi quali istruzione, ricerca e commento. L’Archivio ha fatto questi punti:
- Stavano fornendo un trasformativo servizio offrendo ai lettori l’accesso ai libri cartacei in un nuovo formato digitale.
- Non ne ricavavano alcun profitto, in quanto sono un’organizzazione senza scopo di lucro la cui missione è preservare la conoscenza e renderla accessibile.
- La NEL è stata una risposta temporanea alla pandemia e ha cercato di aiutare le persone che non hanno potuto accedere ai libri durante la crisi.
Hanno anche sottolineato il loro Prestito digitale controllato sistema come un modo per rispettare le leggi sul copyright. Con la CDL, solo una persona alla volta poteva prendere in prestito un libro, proprio come in una biblioteca fisica.
Le decisioni della corte
Sentenza del tribunale distrettuale (marzo 2023)
Nel marzo 2023, una corte federale si è schierata dalla parte degli editori. Il giudice John G. Koeltl ha stabilito che le azioni di Internet Archive non erano protette dal fair use. Ha affermato:
- Il prestito digitale dell’Internet Archive non era trasformativo perché non aggiungevano nulla di nuovo ai libri. Li copiavano semplicemente in formato digitale, il che non era sufficiente per qualificarsi per un uso corretto.
- La corte ha anche scoperto che il prestito dell’Archivio ha danneggiato il mercato sia delle versioni stampate che di quelle digitali dei libri. Offrendo copie digitali gratuite, l’Internet Archive è stato visto come un concorrente delle vendite di ebook degli editori.
- La corte concluso che l’Archivio aveva creato opere derivateil che significa che hanno realizzato nuove versioni dei libri (copie digitali) senza autorizzazione.
Sentenza della Corte d’appello (agosto 2023)
L’Internet Archive ha fatto ricorso contro la decisione presso una corte superiore, la Corte d’appello degli Stati Uniti per il secondo circuito, sperando di ribaltare la sentenza. Tuttavia, la corte d’appello ha anche emesso una sentenza a favore degli editori, ma ha fatto un’importante precisazione:
- La corte ha riconosciuto che l’Internet Archive è un senza scopo di lucro organizzazione e non commerciale. Questa distinzione era importante perché l’uso commerciale può spesso indebolire una difesa di uso corretto, ma in questo caso, la corte ha riconosciuto che l’Archivio non era motivato dal profitto.
- Nonostante ciò, il tribunale ha comunque convenuto che le azioni dell’Archivio non erano protette dal fair use, nonostante si tratti di un’organizzazione senza scopo di lucro.
In conclusione
Il caso Hachette contro Internet Archive ha dimostrato che persino organizzazioni non profit come Internet Archive non possono digitalizzare e prestare liberamente libri senza violare le leggi sul copyright. Questa sentenza potrebbe anche influenzare il modo in cui le aziende di intelligenza artificiale utilizzano materiali protetti da copyright per addestrare i propri sistemi. Se le organizzazioni non profit affrontano tali restrizioni, gli strumenti di intelligenza artificiale potrebbero dover ottenere licenze per i dati che utilizzano. Anche se hanno già ha iniziato a fare alcuni affarimi chiedo, che dire del prime voci?
Credito immagine in evidenza: Eray Eliacık/Bing