A fine giugno, un tribunale federale della California ha emanato una sentenza secondo cui Anthropic (nota ai più per il sistema Claude) non avrebbe violato il diritto d’autore quando ha utilizzato libri acquistati lecitamente per addestrare il proprio modello di AI.
Secondo il giudice, l’uso fatto da Anthropic sarebbe da considerarsi legittimo perché profondamente trasformativo. Con ciò si intende non finalizzato alla riproduzione o distribuzione delle opere, ma alla costruzione di un sistema che apprende dai testi per generare risposte autonome e nuove. Un modello, sempre secondo il tribunale californiano, che non replica l’opera originaria, ma la cambia radicalmente per creare qualcosa di diverso e nuovo.
Il concetto di “fair use”
Per comprendere a fondo la portata della decisione americana, è indispensabile soffermarsi su un concetto giuridico centrale: il fair use. Si tratta di una clausola propria del diritto statunitense, che consente – in alcune circostanze – l’uso di opere protette da copyright senza necessità di ottenere una licenza o il consenso dell’autore.
Attenzione, però, il fair use non è un lasciapassare. È, a tutti gli effetti, una difesa giuridica. Può essere invocato solo a posteriori come argomento di difesa in un procedimento per violazione del diritto d’autore. Questo comporta che sarà poi un giudice a valutare, caso per caso, se tale principio possa essere applicato o meno. Gli elementi che entrano in gioco sono la finalità dell’uso dell’opera originale (istruzione, ricerca, attività non profit), la tipologia di opera coinvolta (puramente informativa o totalmente creativa), la quantità dell’opera originaria utilizzata, e , infine, l’effetto economico dell’uso contestato (ossia, se e come può danneggiare l’opera originaria sul mercato). Si precisa che, diversamente, nei sistemi di civil law (come quello italiano) non troviamo questo principio. Le eccezioni al diritto d’autore sono tassative e codificate.
Torniamo alla decisione californiana
La decisione ha riconosciuto che, se un’opera è stata acquistata lecitamente in formato cartaceo, è lecito digitalizzarla e utilizzarne il contenuto per scopi di addestramento interno, anche se ciò comporta la distruzione del supporto fisico. Il fulcro è l’acquisto lecito e l’uso non competitivo rispetto all’opera originale. In questo contesto, l’addestramento dell’AI viene equiparato a un uso che non sottrae valore commerciale all’opera né ne replica lo scopo, rientrando così nella dottrina del fair use prevista dalla normativa statunitense sul copyright.
Procediamo dunque secondo i 4 punti di valutazione individuati:
Scopo e carattere dell’uso: il tribunale ha trovato che l’utilizzo dei libri da parte di Anthropic non mirava a copiarli, ma a in realtà a “trasformarli” per addestrare un sistema in grado di generare testi nuovi, non a replicare quelli esistenti. Digitalizzare copie acquistate è stato ritenuto legittimo, perché serviva solo a renderle consultabili in formato digitale. Al contrario, usare opere pirata per costruire una biblioteca è stato giudicato chiaramente illecito.
Natura dell’opera: il giudice ha riconosciuto che i libri usati da Anthropic sono opere creative, ricche di espressione e originalità. Proprio per questo, il loro utilizzo è meno giustificabile rispetto a contenuti più neutri o informativi. Su questo punto, il fair use risulta dunque penalizzato.
Quantità e rilevanza del materiale utilizzato: sul punto, in estrema sintesi, il tribunale ha ritenuto legittimo usare grandi quantità di testo per addestrare un modello AI, perché necessario dal punto di vista tecnico e non finalizzato a rendere pubblici o replicare integralmente i contenuti originali. L’impiego del materiale è stato quindi considerato proporzionato.
Effetti sull’opera e sul suo mercato: il tribunale ha rilevato che l’addestramento di Claude non ha inciso negativamente sul mercato delle opere usate. Nessuna prova di calo nelle vendite né di prodotti che le rimpiazzassero. Il copyright, ha precisato il giudice, serve a tutelare la creatività, non a bloccare eventuali concorrenti futuri.
La distinzione, evidenziata dal tribunale californiano in questo caso, è netta. Se un’opera è stata acquistata lecitamente, può essere utilizzata in modo trasformativo per l’addestramento di un sistema di AI. Se al contrario proviene da fonti illecite, ogni uso resta una violazione, anche quando lo scopo finale è l’addestramento.
Conclusioni
Dal punto di vista tecnologico, la decisione della corte californiana offre un primo riferimento giuridico utile per le aziende che operano negli Stati Uniti. Non si tratta di un via libera indiscriminato, ma di una conferma che, in quel contesto normativo, l’uso di opere acquistate per addestrare modelli linguistici può rientrare nel perimetro del fair use, se avviene nel rispetto di criteri specifici. Questo potrebbe incentivare lo sviluppo di dataset strutturati da fonti legittime, con un’attenzione crescente alla documentazione d’uso e alla provenienza dei materiali.
La sentenza americana segna un punto di partenza nel dibattito globale ma non un punto d’arrivo. Si tratta di un precedente interessante che resta difficilmente replicabile in maniera automatica.
La creazione di archivi digitali che non presentano elementi trasformativi, o la semplice riproduzione digitale di opere protette, specialmente in assenza di licenza, comporta rischi giuridici concreti. Trasformare un testo cartaceo in formato digitale, infatti, può costituire un atto di riproduzione rilevante ai fini del diritto d’autore, rientrando nei diritti esclusivi di sfruttamento economico riconosciuti all’autore o al titolare dei diritti.
La legittimità di questo tipo di utilizzo non può quindi essere generalizzata, ma va valutata caso per caso. Tuttavia, alla luce di questa decisione, la giurisprudenza statunitense – almeno in California – sembra muoversi verso una maggiore apertura quando la digitalizzazione serve come passaggio tecnico per addestrare un’intelligenza artificiale, e non per sostituire l’opera originale. Si delinea così una linea interpretativa che cerca di bilanciare la tutela delle opere creative con le esigenze di innovazione tecnologica.
Articolo in collaborazione con AW LEGAL
AW LEGAL è lo Studio legale focalizzato sulla Properietà Intellettuale, Privacy e Legal Tech.