ENG
Le licenze Creative Commons (CC) sono progettate per facilitare la condivisione della conoscenza e della creatività, consentendo ai titolari dei diritti d’autore di specificare i permessi che concedono agli utilizzatori, al fine di autorizzare un uso diffuso delle opere. Le caratteristiche[1] principali delle licenze CC sono, in breve: 1) irrevocabilità: una volta che un’opera è concessa in licenza Creative Commons, quest’ultima non può essere revocata, assicurando così che il materiale protetto rimanga disponibile in perpetuo per lo specifico utilizzo concesso; 2) attribuzione: gli utenti devono fornire corrette informazioni sul regime dei diritti sull’opera ed il link alla licenza, nonché indicare se sono state apportate delle modifiche. Questa richiesta di trasparenza è anche a supporto di un uso etico dei contenuti creativi nella fase di addestramento dei sistemi di intelligenza artificiale generativa; 3) divieto di apposizione di misure tecnologiche di protezione: le licenze Creative Commons vietano l’applicazione di tali misure che limiterebbero le libertà concesse dalla licenza stessa nella promozione dell’accesso aperto; 4) rispetto delle eccezioni e limitazioni al diritto d’autore (così come della dottrina del fair use e fair dealing, nei paesi di common law): le licenze CC stabiliscono che, in presenza di tali fattispecie, i diritti degli utenti non sono pregiudicati da queste ultime. Ciò significa che in presenza di eccezioni o limitazioni, di fair use o fair dealing, le licenze CC non sono applicabili; 5) modifiche: come già accennato, a partire dalla versione 4.0, è stato introdotto l’obbligo per l’utilizzatore di indicare se il materiale concesso in licenza è stato modificato, così come l’indicazione di modifiche precedenti.
Negli ultimi anni, si è registrata un’attenzione particolare sull’evoluzione repentina dell’intelligenza artificiale (IA), intesa quale settore dell’informatica che sviluppa sistemi e algoritmi in grado di eseguire compiti che normalmente richiederebbero intelligenza umana.
L’IA generativa è una sottoclasse dell’IA che si concentra sulla creazione di nuovi contenuti, come immagini, testo, video o suoni, a partire dai Foundation Models e dai Large Language Models (LLM), grandi modelli statistici addestrati su enormi quantità di dati utilizzando tecniche di deep learning[2]. Le opere dell’ingegno protette dal diritto d’autore sono oggetto di utilizzazione ai fini dell’apprendimento di tali sistemi di IA generativa e, in tale contesto, si è aperta una riflessione in merito al rapporto sussistente tra tali forme di utilizzo e i contenuti protetti che vengono condivisi con licenze CC.
Il ruolo delle licenze aperte nello sviluppo dell’Intelligenza Artificiale generativa
Nel campo dell’IA, in particolare di quella generativa, l’utilizzo di contenuti protetti dal diritto d’autore rilasciati con licenza CC gioca un ruolo fondamentale. Questo articolo esplora l’interazione tra l’IA generativa e le licenze Creative Commons, evidenziando i principi della condivisione della conoscenza e affrontando le principali considerazioni legali[3] in materia. I modelli di IA generativa, come quelli utilizzati per la creazione di testi, immagini e altri media, si basano in larga misura su vasti set di dati. Questi dataset spesso includono opere protette dal diritto d’autore, anche rilasciate con licenze CC, e contenuti non proteggibili in quanto in pubblico dominio. Le licenze Creative Commons sono particolarmente significative perché consentono l’uso di opere dell’ingegno per una varietà di scopi, nei quali rientra l’addestramento dell’IA, senza la necessità di autorizzazioni specifiche individuali, e a condizione che siano rispettati i termini delle licenze stesse.
Considerazioni legali sull’addestramento dell’Intelligenza Artificiale
Uno dei problemi principali nell’utilizzo di materiali rilasciati con licenza Creative Commons per l’addestramento dell’Intelligenza Artificiale è capire se tale utilizzo rientri o meno in uno dei diritti esclusivi riservati ai titolari dei diritti ai sensi della legislazione sul diritto d’autore[4]. L’interpretazione di tali diritti esclusivi, infatti, può variare, in particolare tra le giurisdizioni di civil law e i sistemi di common law. È bene segnalare, altresì, che nel contesto dei sistemi di IA generativa, ciascuno di essi ha una propria funzionalità che, al fine della suddetta indagine, richiede una valutazione caso caso per stabilire se e quali diritti esclusivi siano stati esercitati nell’attività di addestramento.
Eccezioni per l’estrazione di testo e di dati (TDM) dell’UE
La legislazione europea sul diritto d’autore, ove l’eccezione per l’estrazione di testi e di dati (text and data mining, TDM) è definita esplicitamente, fornisce un quadro giuridico chiaro per l’utilizzo di opere protette dal diritto d’autore nella fase di addestramento dell’IA. La direttiva dell’Unione europea sul diritto d’autore nel mercato unico digitale, 2019/790/EU (Dir. CDSM), agli articoli 3 e 4, specificamente prevede le eccezioni per TDM. In particolare, l’articolo 3 consente l’attività di TDM per scopi di ricerca scientifica da parte di beneficiari qualificati (istituti di tutela del patrimonio culturale e organismi di ricerca) che abbiano accesso legittimo[5] alle opere. L’articolo 4, invece, consente a chiunque abbia accesso legittimo alle predette opere, l’attività di TDM, effettuata per qualsiasi scopo, a condizione che il titolare dei diritti non abbia espressamente riservato tale uso[6].
L’obbligo di rispettare i termini e le condizioni della licenza CC per lo svolgimento di attività di TDM dipende dall’eventualità che la tipologia di attività di estrazione coinvolga l’esercizio di uno dei diritti di utilizzazione economica del diritto d’autore o diritto sui generis applicabile alle banche dati. In caso contrario, non è necessario affidarsi alle condizioni contrattuali della licenza. Tuttavia, poiché esistono metodi diversi per condurre l’estrazione di testi e dati, è possibile che alcune tipologie di tale attività coinvolgano l’esercizio di alcuni dei diritti esclusivi concessi dalla licenza.
In tale contesto, ci si è chiesti se le clausole Non opere derivate (ND) e Non uso commerciale (NC) delle licenze CC possano essere interpretate quale esercizio della riserva, disciplinata dall’articolo 4, paragrafo 3, e dal considerando 18 della direttiva CDSM (e da qualsiasi legislazione nazionale di attuazione).
La risposta non può che essere negativa, considerato innanzitutto che il rationale delle licenze CC è quello dell’incentivo alla circolazione dei contenuti e non della limitazione. Nel contesto degli Stati membri europei, l’uso di un’opera concessa in licenza CC per scopi di TDM per fini commerciali rientra nell’eccezione stabilita dall’articolo 4 della Direttiva CDSM e, pertanto, come si è già anticipato, di fronte all’applicazione di un’eccezione, la licenza CC non ha alcun effetto. Le licenze CC, difatti, non riducono, limitano o restringono i diritti previsti dalle eccezioni e limitazioni al diritto d’autore[7]. Pertanto, le condizioni contrattuali di una licenza CC non possono costituire una riserva dei diritti nell’ambito del regime di un’eccezione al diritto d’autore. Di conseguenza, nessun elemento interno delle licenze CC può essere logicamente o sistematicamente interpretato come una riserva di diritti nell’ambito dell’articolo 4. Questo porta al corollario che qualsiasi “riserva esplicita” dell’uso dell’opera ai sensi dell’articolo 4, paragrafo 3, della Dir. CDSM debba essere formalmente esercitata al di fuori del sistema della licenza CC adottata. Tale riserva renderebbe l’eccezione inefficace e, pertanto, si applicherebbero nuovamente i termini della licenza CC. In tal senso, un’opera rilasciata con licenza CC BY NC (Attribuzione – Non commerciale), in presenza dell’esercizio della riserva di opt-out, ai sensi dell’articolo 4, par. 3, della Dir. CDSM, espressa esplicitamente e in modo separato rispetto al contenuto della licenza stessa, può ancora essere oggetto di estrazione per scopi non commerciali (ma non per scopi commerciali), perché l’unica funzione della predetta riserva è circoscritta all’ambito di applicazione del suddetto articolo della direttiva e non può contraddire gli obblighi più ampi di una licenza CC, in questo caso la clausola “NC”. Un’argomentazione simile può essere fatta per la clausola ND (Non opere derivate) e SA (Condividi allo stesso modo) quando il risultato dell’estrazione è materiale adattato[8].
Paesi di Common Law, Fair use per TDM e CC Preferences Signals
Nelle giurisdizioni di common law, in particolare negli Stati Uniti, al posto dell’istituto delle eccezioni e limitazioni al diritto d’autore si applica la dottrina del fair use, un sistema di diritto più flessibile ma, a priori, non prevedibile. La dottrina del fair use valuta la liceità dell’uso in base alla disamina di quattro fattori: 1) lo scopo e il carattere dell’uso, compreso il fatto che sia a scopo commerciale o meno; 2) la natura dell’opera protetta dal diritto d’autore; 3) la quantità e la sostanzialità della parte di opera utilizzata e 4) l’effetto dell’uso sul mercato potenziale dell’opera originale. Questo approccio, secondo una valutazione caso per caso, potrebbe rappresentare una causa di incertezza giuridica per gli sviluppatori di IA, rallentando lo sviluppo del mercato di riferimento.
Creative Commons sta approfondendo una nuova modalità per consentire ai titolari dei diritti di manifestare le proprie preferenze in merito agli utilizzi delle opere protette nell’addestramento di sistemi di IA generativa. Come detto, tali preferenze non possono essere applicate attraverso le condizioni delle licenze CC, per consentire ai creatori di esprimere una gamma di proprie intenzioni ed incoraggiare una migliore condivisione dei loro contenuti, nel rispetto dei valori e dei principi del movimento Open Access.
I c.d. “Preferences signals” (ossia “segnali di preferenza”) per l’IA rappresentano una modalità per i creatori di indicare le proprie scelte in merito all’utilizzo delle opere per l’addestramento dei modelli di IA[9]. L’introduzione di segnali di preferenza potrebbe essere vista come un modo per sostenere e promuovere la condivisione di materiali che altrimenti non verrebbero condivisi, individuando nuove modalità per conciliare le attuali tensioni[10].
A differenza della riserva di opt-out, prevista nell’eccezione di TDM per usi commerciali, i segnali di preferenza non avrebbero un effetto legale e, quindi, non sarebbero giuridicamente coercibili. Nel contesto della legge sul diritto d’autore europeo, nel caso di esercizio dell’opzione di opt-out e, quindi, nella piena validità delle licenze CC, venendo meno l’eccezione, le clausole contrattuali della licenza torneranno ad esplicare la loro efficacia, come ad es. la clausola NC o ND. In tal senso, quindi, probabilmente i prefences signals avranno più significato e un vasto campo d’azione in relazione alle condizioni contrattuali delle licenze più aperte (CC BY e CC BY SA). In conclusione, le licenze Creative Commons svolgono un ruolo cruciale nel consentire l’uso di opere creative per l’addestramento di modelli generativi di IA, promuovendo la condivisione della conoscenza e dell’innovazione. Mentre i quadri giuridici dei Paesi membri dell’Unione Europea forniscono linee guida applicative attraverso le eccezioni di TDM, i Paesi di common law si affidano alla dottrina del fair use, flessibile ma incerta. Con il progredire della tecnologia dell’IA, il dialogo continuo e la chiarezza giuridica saranno essenziali per bilanciare i diritti dei creatori con i benefici della condivisione aperta della conoscenza. Creative Commons ha ritenuto di poter bilanciare i diritti dei creatori con lo sviluppo dei sistemi di IA, sviluppando i predetti Preferences Signals, sui quali sta concentrando i propri sforzi di studio e interpretazione e sui quali ci si aspetta fornirà maggiori dettagli nel prossimo periodo.
[1] Funzionamento delle licenze CC e, in particolare, della clausola NC. Una panoramica approfondita tra l’Italia e la Germania”, D. De Angelis, V. De Vecchi Lajolo, su Diritto Industriale, n. 4/16.
[2] K. Tyagi, Copyright, text & data mining and the innovation dimension of generative AI, in Journal of Intellectual Property Law & Practice, Volume 19, Issue 7, July 2024, Pages 557–570, https://doi.org/10.1093/jiplp/jpae028.
[3] Understanding CC licenses and generative AI, K. Walsh, https://creativecommons.org/2023/08/18/understanding-cc-licenses-and-generative-ai/
[4] R. Ducato, A. Strowel, Ensuring Text and Data Mining: Remaining Issues With the EU Copyright Exceptions and Possible Ways Out, CRIDES Working Paper Series no. 1/2021; forthcoming in 43 European Intellectual Property Review, 2021/5, p. 322-337.
[5] Nell’implementazione italiana dell’art. 3 della Dir. CDSM, nell’articolo 70-ter LdA, tale requisito legale è stato recepito con la locuzione “lecito accesso”, che diverge dal significato di legittimo accesso.
[6] D. De Angelis, Le eccezioni per scopo di ricerca: il mondo guarda all’UE, in Crisi e resilienza del diritto d’autore. Il recepimento italiano della direttiva 2019/790, Giappichelli, pagg. 21- 38.
[7] Art. 2, a, 2 del legal code delle licenze CC.
[8] K. Szkalej, M. Senftleben, Generative AI and Creative Commons Licenses: The Application of Share Alike Obligations to Trained Models, Curated Datasets and AI Output, https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4872366
[9] A. Tumadóttir, Question for consideration for AI & the Commons, qui: https://creativecommons.org/2024/07/24/preferencesignals/
[10] P. Keller, A. Tarkowski, The Paradox of Open, in https://paradox.openfuture.eu/
Dicembre 2024