Technology & IP Law Pubblicato il 5 marzo 2026 di Alberto Agostini

L'ecosistema dei dati giuridici italiani: fonti, banche dati e regimi di accesso per l'intelligenza artificiale.

Profili giuridici, prassi istituzionali e prospettive di apertura del dato giudiziario.

Abstract

Il presente contributo si propone di ricostruire, in modo organico, l'ecosistema dei dati giuridici italiani normativi e giurisprudenziali, nella prospettiva della loro utilizzabilità per la costruzione di dataset e sistemi di ricerca automatica fondati sull'intelligenza artificiale.

L'indagine, condotta con metodo empirico-normativo, ha trovato un proprio specifico ancoraggio in un'interlocuzione formale con il Direttore del Centro Elettronico di Documentazione della Corte di Cassazione, le cui risposte scritte costituiscono, a quanto consta, la prima manifestazione pubblica e formalizzata della posizione dell'Istituzione su tali profili.

Dall'analisi emerge un sistema strutturalmente asimmetrico. Alla maturità ormai raggiunta dal patrimonio normativo, integralmente disponibile in formato aperto e con licenze idonee al riutilizzo commerciale, fa riscontro la sostanziale chiusura della giurisprudenza di legittimità, presidiata da un articolato sistema di riserve (note legali, diritti sui generis sulla banca dati, opt-out al Text and Data Mining, cautele privacy) che precludono qualsiasi ipotesi di estrazione massiva per finalità di addestramento algoritmico.

Il lavoro ricostruisce in chiave critica le ragioni giuridiche di tale chiusura, ne misura le implicazioni per il mercato del legal tech italiano e formula, in chiusura, alcune indicazioni operative per gli operatori del settore, nonché alcuni spunti ricostruttivi in vista di una possibile evoluzione del quadro istituzionale.

1. Premessa e coordinate della ricerca

L'applicazione delle tecnologie dell'informazione al dominio giuridico non costituisce, nell'esperienza italiana, un fenomeno recente. La fondazione, nel 1969, del Centro Elettronico di Documentazione (CED) presso la Corte di Cassazione colloca anzi l'ordinamento italiano tra i precursori della materia a livello comparato [1].

Ciò nonostante, la diffusione, nell'ultimo quinquennio, dei modelli linguistici di grandi dimensioni e dei sistemi di intelligenza artificiale generativa ha impresso alla materia una torsione di portata strutturale. Il baricentro dell'indagine si è progressivamente spostato dalla ricerca documentale assistita, modello sul quale si è formata l'informatica giuridica del Novecento, all'ingestione massiva dei dati per finalità di addestramento algoritmico.

Non si tratta più, in altri termini, di interrogare archivi elettronici alla ricerca di un precedente o di una norma, ma di alimentare sistemi capaci di rielaborare in autonomia il dato giuridico, sino al limite, non meramente teorico, della redazione assistita di atti, della predizione di esiti contenziosi e della ricostruzione semantica di interi orientamenti.

Tale mutamento di paradigma impone di interrogarsi, con un grado di sistematicità sino ad oggi sostanzialmente trascurato, su un quesito apparentemente elementare: qual è, allo stato dell'arte, la consistenza, l'accessibilità e l'utilizzabilità legale del patrimonio informativo giuridico italiano ai fini della costruzione di sistemi di intelligenza artificiale?

La domanda, soltanto in apparenza circoscritta, coinvolge una pluralità di piani, la cui sovrapposizione delinea un ecosistema assai più frammentato e contraddittorio di quanto la retorica dell'apertura dei dati pubblici lasci supporre [2]. Lo scenario che emerge dalla ricognizione è segnato da un paradosso strutturale, sul quale il presente lavoro intende soffermarsi con particolare attenzione.

L'ordinamento italiano si caratterizza, da un lato, per una tradizione ormai consolidata di apertura del dato normativo (la legislazione è interamente disponibile in formato aperto e con licenze idonee al riutilizzo commerciale) e, dall'altro, per una persistente chiusura del dato giurisprudenziale, specialmente con riguardo alla giurisdizione ordinaria di legittimità. Il paradosso giunge al proprio apice ove si consideri che la fonte giurisprudenziale nomofilattica dell'ordinamento, la Suprema Corte, è al contempo la fonte meno accessibile per finalità di riutilizzo sistematico e di sfruttamento economico.

Tale constatazione, come si vedrà nel paragrafo 5, è stata oggetto di un'interlocuzione formale tra lo scrivente e il CED, le cui risposte hanno cristallizzato la posizione dell'Istituzione in termini inequivocabili [3].

Il contributo si articola, dopo la presente premessa, in cinque ulteriori paragrafi. Il paragrafo 2 e il paragrafo 3 mappano, rispettivamente, le fonti normative e quelle giurisprudenziali italiane, esaminate con riguardo ai portali di pubblicazione, ai formati disponibili e allo status giuridico del riutilizzo. Il paragrafo 4 ricostruisce in chiave sistematica il quadro normativo applicabile all'accesso e all'estrazione del dato giuridico, dalla disciplina del riutilizzo dell'informazione del settore pubblico al Text and Data Mining, dalla tutela del diritto d'autore alla protezione dei dati personali. Il paragrafo 5, nucleo critico del contributo, analizza in profondità il caso della Corte di Cassazione e del portale SentenzeWeb, alla luce della posizione ufficiale assunta dal CED. Il paragrafo 6, infine, formula osservazioni conclusive e raccomandazioni operative.

2. L'ecosistema delle fonti normative

L'ordinamento italiano è caratterizzato da una stratificazione normativa di notevole complessità. Dal punto di vista della disponibilità del dato per finalità di addestramento algoritmico, tale stratificazione rappresenta, paradossalmente, un punto di forza. L'intero apparato della legislazione vigente è oggi acquisibile in formato aperto e con licenze che ne consentono il riutilizzo commerciale, secondo un modello che, come si vedrà a breve, non trova analoga maturità sul versante giurisprudenziale.

Il portale di riferimento assoluto, in materia, è Normattiva [4]. Il sistema aggrega tutti gli atti normativi statali numerati pubblicati in Gazzetta Ufficiale dal 1861 ad oggi in versione cosiddetta «multivigente» [5]. Sotto il profilo giuridico, Normattiva ha ufficializzato, con decorrenza dal 1° gennaio 2026, il rilascio dei propri dati con licenza Creative Commons Attribuzione 4.0 Internazionale (CC-BY 4.0), garantendo la disponibilità di API dedicate e di bulk download in formato XML strutturato anche per finalità commerciali [6]. Il fondamento normativo di tale apertura risale all'art. 52 del D.Lgs. 82/2005 (Codice dell'Amministrazione Digitale, o CAD), che pone il principio per cui i dati pubblicati dalle pubbliche amministrazioni si intendono rilasciati come «dati di tipo aperto» salvo diversa licenza. La legislazione italiana, nel suo complesso, è dunque open data a tutti gli effetti, e la sua ingestione automatizzata non incontra barriere giuridiche di sorta, salvo l'obbligo di citazione della fonte.

Quanto alla legislazione regionale, Normattiva dispone di un motore di ricerca federato che consente di interrogare in un unico punto di accesso le banche dati di tutte le assemblee legislative regionali. Ciascuna Regione, peraltro, mantiene il proprio portale legislativo e il proprio Bollettino Ufficiale, sicché la mappatura del dato regionale richiede una ricognizione capillare dei venti ordinamenti regionali e delle due Province autonome. La ricognizione condotta nell'ambito del presente lavoro ha confermato l'apertura sostanzialmente generalizzata del dato normativo regionale [7]. La quasi totalità delle Regioni adotta licenze Italian Open Data License (IODL 2.0) ovvero CC-BY 4.0, rendendo i propri atti pienamente riutilizzabili. Per completezza, vanno altresì menzionati i portali open data delle Camere parlamentari, che mettono a disposizione, in formato strutturato, i materiali del processo legislativo utili alla ricostruzione del contesto interpretativo [8].

Il dato normativo italiano presenta, in sintesi, un livello di apertura che può definirsi strutturalmente maturo. L'intero corpus è disponibile in formato aperto, con licenze idonee al riutilizzo commerciale e con infrastrutture tecniche adeguate all'ingestione automatizzata. Non si tratta, evidentemente, di un risultato casuale: esso riflette una scelta istituzionale consapevole, che ha trovato espressione nell'art. 52 del CAD, nell'art. 1, comma 2, del D.Lgs. 36/2006 (riutilizzo dell'informazione del settore pubblico) e, da ultimo, nelle direttive europee in materia di open data (Dir. UE 2019/1024). Una scelta che, come si vedrà, non si è riprodotta con la medesima coerenza nel dominio giurisprudenziale.

3. L'ecosistema delle fonti giurisprudenziali

Se il versante normativo presenta un assetto sostanzialmente compiuto, il versante giurisprudenziale rivela un panorama profondamente disomogeneo, nel quale convivono esperienze avanzate di apertura e sacche di chiusura pressoché totale. La comprensione di tale disomogeneità richiede una premessa di ordine sistematico: l'ordinamento italiano è caratterizzato da una pluralità di plessi giurisdizionali, ciascuno dei quali gestisce i propri flussi informativi secondo logiche, strumenti e gradi di apertura distinti. In questo quadro, l'assenza di una politica unitaria di apertura del dato giudiziario rappresenta, di per sé, uno dei tratti più caratteristici, e problematici, dell'esperienza italiana.

Sul piano delle singole giurisdizioni, la Corte Costituzionale rappresenta un esempio virtuoso, e sotto certi profili pionieristico. Il portale istituzionale rende disponibili tutte le pronunce (sentenze e ordinanze) dal 1956 ad oggi, corredate dalle massime ufficiali e dalle note a sentenza elaborate dal servizio studi della Corte. Soprattutto, l'Istituzione si è dotata di un portale open data dedicato (dati.cortecostituzionale.it), che rilascia l'intero corpus in formato strutturato e con licenza Creative Commons Attribuzione - Condividi allo stesso modo 3.0 (CC-BY-SA 3.0), consentendone il riutilizzo anche per finalità commerciali e di addestramento [9]. L'operazione si fonda, sotto il profilo giuridico, su una premessa che la stessa Corte ha implicitamente recepito. Ai sensi dell'art. 5 della l. 633/1941 (Legge sul diritto d'Autore), i testi degli atti ufficiali dello Stato non sono coperti da privativa autoriale, sicché le sentenze costituzionali si collocano per loro natura nel pubblico dominio. La scelta della Consulta, in altri termini, è il riconoscimento coerente di uno status che la legge già attribuisce ai propri provvedimenti.

La giustizia amministrativa costituisce, per opposta direzione, il modello più avanzato di apertura del dato giurisdizionale nell'ordinamento italiano. In attuazione delle direttive del PNRR, il Consiglio di Stato ha attivato il portale Open GA (openga.giustizia-amministrativa.it), che rilascia dataset strutturati e già pseudonimizzati dei provvedimenti del Consiglio di Stato, dei Tribunali Amministrativi Regionali e del Consiglio di Giustizia Amministrativa per la Regione Siciliana, suddivisi per anno e per sede giudiziaria, con licenza CC-BY 4.0 [10]. Si tratta, ad avviso dello scrivente, del solo portale giudiziario italiano ad aver adottato un modello progettato dall'origine per il riutilizzo automatizzato, e merita senz'altro di essere assunto come parametro di riferimento nelle prospettive di riforma del sistema. La scelta della Giustizia amministrativa di muoversi in tale direzione non è, peraltro, casuale. Essa riflette una sensibilità istituzionale per la trasparenza e per l'apertura dei propri prodotti decisori che non trova, allo stato, equivalenti negli altri plessi giurisdizionali.

La giurisdizione ordinaria di merito (Tribunali e Corti d'Appello) dispone, dal dicembre 2023, della Banca Dati di Merito (bdp.giustizia.it), che raccoglie i provvedimenti civili pubblicati dal 1° gennaio 2016 provenienti dal sistema SICID. Il portale è accessibile previa autenticazione SPID, ma è progettato per la sola consultazione individuale e non consente, dunque, operazioni di scarico massivo. L'unica via per l'ingestione su larga scala è rappresentata dalla Convenzione tra il Ministero della Giustizia e l'Associazione Italiana Editori (AIE), rinnovata il 30 gennaio 2025, che prevede la fornitura dei provvedimenti civili, in formato grezzo e non anonimizzato, tramite canali SFTP e API dedicate, a fronte di un corrispettivo annuo di trentamila euro per editore [11]. Tale importo, sotto il profilo giuridico, non configura una vendita di dati, bensì un rimborso dei costi marginali sostenuti dall'Amministrazione per la messa a disposizione del servizio, ai sensi dell'art. 7 del D.Lgs. 36/2006. L'adesione comporta, peraltro, obblighi stringenti di pseudonimizzazione secondo le Linee Guida del Garante del 2010 e di localizzazione dei dati in territorio dell'Unione Europea, che gravano integralmente sull'editore aderente. La Convenzione AIE rappresenta un unicum nel panorama italiano: non esiste, per le altre giurisdizioni, un meccanismo analogo che consenta l'accesso massivo regolamentato ai provvedimenti.

La giustizia tributaria dispone, dal canto suo, di una banca dati che raccoglie le sentenze native digitali emesse dal 2021 in avanti (bancadatigiurisprudenza.giustiziatributaria.gov.it). La licenza adottata, tuttavia, Creative Commons Attribuzione - Non Commerciale (CC-BY-NC), esclude in radice l'uso commerciale, riducendo significativamente l'utilizzabilità del corpus per finalità di addestramento di sistemi destinati al mercato [12]. La Corte dei Conti e il Tribunale Superiore delle Acque Pubbliche, infine, vincolano per regolamento l'uso dei propri dati a finalità di ricerca e documentazione, escludendo qualsiasi forma di sfruttamento economico [13].

Alla base della parabola discendente appena tracciata si trova, come anticipato, la Corte Suprema di Cassazione. L'organo che l'ordinamento investe della funzione di garantire l'uniforme interpretazione della legge, e i cui orientamenti assumono valore paradigmatico per l'intero sistema, ha optato, all'opposto, per un modello di chiusura pressoché integrale. Le note legali del sito istituzionale (cortedicassazione.it) vietano espressamente, in termini inequivocabili, qualsiasi uso commerciale o di sfruttamento economico dei dati pubblicati [14]. Il portale SentenzeWeb, motore di ricerca che consente la navigazione tra le sentenze emesse dalla Corte degli ultimi sei anni, è concepito esclusivamente per la consultazione individuale umana. Nessuna API, nessun bulk download, nessuna licenza di riutilizzo. ItalgiureWeb, a sua volta, costituisce il sistema di informatica giuridica ufficiale curato dal CED ai sensi del D.P.R. 3 luglio 2004, n. 195: aggrega un patrimonio informativo straordinario (giurisprudenza civile e penale, massime, normativa, dottrina, sentenze del Consiglio di Stato e dei TAR, della Corte dei Conti, della CEDU, delle Commissioni Tributarie), ma opera in regime di accesso riservato, su abbonamento istituzionale e individuale [15]. Le implicazioni giuridiche e operative di tale assetto saranno oggetto di specifica analisi al paragrafo 5, che alla questione dedica una trattazione autonoma.

Il quadro che emerge è quello di un sistema nel quale l'apertura del dato giurisprudenziale procede in modo asimmetrico, per iniziativa delle singole giurisdizioni, in assenza di un disegno unitario e di un obbligo generalizzato di rilascio in formato aperto. La Corte Costituzionale ha aperto il proprio corpus con lungimiranza istituzionale; la Giustizia amministrativa ha realizzato, con Open GA, il modello tecnicamente più maturo; il merito civile è acquisibile attraverso un canale oneroso ma regolamentato; le altre giurisdizioni adottano regimi variamente restrittivi; la Cassazione resta, infine, interamente preclusa al riutilizzo. Il risultato, sotto il profilo dell'ecosistema complessivo, è un sistema nel quale la componente giurisprudenziale più preziosa, vale a dire quella che orienta l'interpretazione vivente del diritto, è anche la meno disponibile per la costruzione di sistemi di intelligenza artificiale.

4. Il quadro giuridico dell'accesso e del riutilizzo del dato giuridico

La ricostruzione condotta nei paragrafi precedenti restituisce un quadro istituzionalmente frammentato, nel quale ciascuna giurisdizione e ciascuna amministrazione adotta proprie soluzioni in materia di apertura e riutilizzabilità dei dati. Sul piano normativo, peraltro, esiste un sistema di principi e regole, di matrice nazionale ed europea, che governa, in linea generale, l'accesso al dato pubblico e il suo riutilizzo per finalità anche commerciali. La comprensione di tale sistema costituisce passaggio obbligato per la valutazione di liceità delle operazioni di estrazione massiva e di addestramento algoritmico.

Il pilastro fondante del regime di apertura è rappresentato dal D.Lgs. 24 gennaio 2006, n. 36, come novellato dal D.Lgs. 8 novembre 2021, n. 200, in recepimento della Direttiva (UE) 2019/1024 in materia di open data, il quale stabilisce l'obbligo per le pubbliche amministrazioni di rendere i propri documenti riutilizzabili anche per fini commerciali. Il principio non opera, peraltro, in via incondizionata. L'art. 1, comma 2, del decreto chiarisce che la decisione di consentire il riutilizzo spetta all'amministrazione titolare del dato, mentre l'art. 3, lett. h-quater, consente di negarlo qualora l'accesso risulti pregiudizievole per la tutela della riservatezza [16]. Si tratta, in altri termini, di una apertura vincolata, che si esprime attraverso licenze e condizioni uniformi adottate secondo le Linee Guida AgID. In assenza di una licenza espressa o di un canale dedicato, non si può presumere alcun titolo abilitativo al riuso commerciale [17].

Sul piano del diritto d'autore vale, per converso, un principio di apertura ex lege. L'art. 5 della l. 633/1941 esclude infatti la protezione autoriale per «i testi degli atti ufficiali dello Stato e delle amministrazioni pubbliche, sia italiane che straniere». La norma, di consolidata applicazione, comporta che il testo di una sentenza o di un atto normativo si collochi per sua natura nel pubblico dominio, e non sia dunque coperto da privativa. Tale apertura, tuttavia, non si estende, e qui sta uno dei punti più delicati dell'intera materia, alla organizzazione del materiale in banca dati. L'art. 102-bis L. 633/1941, recependo la Direttiva 96/9/CE, riconosce infatti al «costitutore» di una banca dati un diritto sui generis autonomo rispetto al diritto d'autore: il titolare ha il diritto esclusivo di vietare l'estrazione e il reimpiego della totalità o di una parte sostanziale del contenuto, nonché l'estrazione e il reimpiego ripetuti e sistematici di parti non sostanziali, ove tali condotte arrechino pregiudizio agli investimenti del costitutore. Il successivo art. 102-ter ne disciplina i limiti e le eccezioni.

Il combinato disposto delle due previsioni, art. 5 e art. 102-bis L. 633/1941, produce un effetto giuridico di particolare rilievo: il singolo provvedimento giurisdizionale, in quanto atto ufficiale, è di pubblico dominio; la sua collocazione in una banca dati strutturata ed alimentata mediante investimenti dedicati, per converso, attribuisce al costitutore della banca un diritto autonomo di interdire l'estrazione massiva. È esattamente in questo dualismo che si gioca, sotto il profilo giuridico, la questione della utilizzabilità dei portali SentenzeWeb e ItalgiureWeb per finalità di addestramento di sistemi di intelligenza artificiale.

Su tale impianto si è innestata, da ultimo, la disciplina del Text and Data Mining (TDM), introdotta nell'ordinamento italiano dal D.Lgs. 8 novembre 2021, n. 177, in recepimento della Direttiva (UE) 2019/790 (c.d. Direttiva Copyright). Sono state inserite, all'interno della L. 633/1941, due distinte eccezioni. L'art. 70-ter autorizza il TDM per finalità di ricerca scientifica, ma riserva tale eccezione esclusivamente alle università, agli enti di ricerca non-profit e agli istituti di tutela del patrimonio culturale. L'eccezione è inderogabile e non copre gli usi commerciali in senso lato. L'art. 70-quater, di portata più ampia, ammette per converso il TDM per qualsiasi finalità, anche commerciale, ma solo a condizione che i titolari dei diritti non abbiano espressamente riservato tali diritti («opt-out»), tipicamente attraverso clausole leggibili da macchina (file robots.txt) ovvero attraverso clausole contrattuali o note legali esplicite.

La Legge 23 settembre 2025, n. 132 (cosiddetta Legge IA italiana), all'art. 25, ha confermato l'impianto delle eccezioni TDM, ribadendo che l'estrazione di testo e dati per addestrare modelli di intelligenza artificiale è consentita a condizione che si abbia un «accesso legittimo» alla fonte e che il titolare non abbia espresso opt-out. Il legislatore italiano si è in tal modo allineato all'impianto europeo, ma ha al contempo rafforzato il ruolo dell'opt-out come strumento di tutela del titolare del dato.

Un ultimo profilo, di rilievo crescente, è quello della tutela dei dati personali. Gli artt. 51 e 52 del D.Lgs. 196/2003 (Codice Privacy) disciplinano specificamente la diffusione on-line dei provvedimenti giurisdizionali e l'anonimizzazione dei dati identificativi, su istanza dell'interessato o d'ufficio, con obblighi specifici per chi diffonde o ridiffonde i provvedimenti. La materia ha conosciuto, da ultimo, un'evoluzione di particolare rilievo con il Provvedimento del Garante per la Protezione dei Dati Personali n. 329 del 20.5.2024, il quale ha ritenuto che la raccolta indiscriminata di dati pubblici on-line per finalità di addestramento di modelli di IA non possa fondarsi sul mero «legittimo interesse» (art. 6, par. 1, lett. f, GDPR), in assenza di adeguate misure di mitigazione, e ha imposto ai gestori dei siti l'adozione di misure tecniche «anti-scraping». Si tratta di una presa di posizione che, sebbene non specificamente rivolta al settore giudiziario, incide profondamente sulla legittimità delle operazioni di estrazione massiva di provvedimenti, anche ove tali provvedimenti siano astrattamente di pubblico dominio.

La sintesi del quadro giuridico così ricostruito può essere espressa nei seguenti termini. Il riutilizzo del dato giuridico per finalità di addestramento algoritmico è lecito, sul piano del diritto d'autore, soltanto qualora ricorrano congiuntamente: (i) l'accesso legittimo alla fonte, ricavabile da una licenza espressa, da una convenzione istituzionale ovvero, in mancanza, dalla condizione di pubblico dominio ex art. 5 L. 633/1941; (ii) l'assenza di un opt-out espresso da parte del titolare; (iii) il rispetto dei limiti del diritto sui generis sulla banca dati, che esclude l'estrazione massiva non autorizzata; (iv) l'osservanza degli obblighi di pseudonimizzazione e di safeguarding imposti dalla disciplina sulla protezione dei dati personali. La compresenza di tutti questi presupposti, non scontata, come si vedrà, costituisce condizione di liceità, sotto il profilo civile, dell'operazione di addestramento.

5. Il caso del portale SentenzeWeb e la posizione ufficiale del CED della Corte di Cassazione

Il quadro sin qui ricostruito trova nel caso della Corte di Cassazione il proprio banco di prova più rilevante, e, per certi versi, più paradigmatico. La Corte rappresenta, come si è osservato, l'organo di vertice della giurisdizione ordinaria, le cui decisioni costituiscono il principale riferimento ermeneutico operativo per l'intero ordinamento. È dunque agevole comprendere come l'indisponibilità di tale corpus per finalità di addestramento algoritmico costituisca, per chi intenda costruire un sistema di intelligenza artificiale orientato al mercato giuridico italiano, un ostacolo di portata strategica.

Per acquisire una posizione formale dell'Istituzione su tale problema, lo scrivente ha trasmesso, in data 24 febbraio 2026, due distinte istanze a mezzo PEC indirizzate al Protocollo Generale della Corte, al Centro Elettronico di Documentazione e all'Ufficio Relazioni con il Pubblico. La prima istanza, protocollata con n. 24/02/2026.0002234.E, ha articolato cinque quesiti specifici relativi: (i) alla qualificazione del riuso dei contenuti pubblicati sul portale SentenzeWeb; (ii) alla tutela della banca dati ai sensi degli artt. 102-bis e 102-ter L. 633/1941; (iii) all'ammissibilità del Text and Data Mining alla luce della Direttiva 2019/790/UE; (iv) ai profili di protezione dei dati personali; (v) all'eventuale esistenza di canali strutturati di accesso (API, esportazioni, convenzioni). La seconda istanza, protocollata con n. 24/02/2026.0002236.E, ha integrato la prima richiedendo, in particolare, se esistesse una procedura amministrativa, autorizzatoria o convenzionale che consentisse, in modo conforme e legittimo, l'ottenimento e il riutilizzo dei provvedimenti della Corte per finalità professionali ed economiche, ivi inclusa la loro integrazione all'interno di sistemi di intelligenza artificiale e di analisi automatizzata dei testi.

Le risposte sono pervenute, formalmente sottoscritte dal Direttore del CED, Dott. Alessio Scarcella, in data 25 febbraio 2026 [18]. Si tratta di documenti di assoluta rilevanza istituzionale. Per quanto consta, costituiscono la prima manifestazione pubblica e formalizzata della posizione della Corte sui temi indicati. Per la loro centralità nell'economia del presente contributo, è opportuno analizzarne i contenuti per punti, secondo l'ordine e l'articolazione adottati dal Direttore stesso.

Il regime giuridico del sito istituzionale

Il primo profilo affrontato dal Direttore concerne il regime giuridico del sito istituzionale. Le note legali della Corte, si rileva, stabiliscono espressamente che «il sito web e i dati ivi contenuti possono essere utilizzati solo per uso personale (informazione, ricerca, studio)» e che «qualsiasi utilizzo a fini commerciali o di sfruttamento economico [...] è espressamente vietato». Tale condizione, viene precisato, si estende anche ai materiali raggiungibili attraverso il portale SentenzeWeb. Quanto al testo dei provvedimenti, il Direttore richiama l'art. 5 della L. 633/1941, il quale esclude, come visto, la protezione autoriale per i testi degli atti ufficiali, per concludere che il singolo provvedimento, considerato isolatamente, non è di per sé coperto da diritto d'autore. La precisazione è importante, ma non risolutiva: come il Direttore stesso si premura di evidenziare, dal pubblico dominio del singolo testo non discende affatto la libertà di estrazione massiva dal portale che lo veicola.

La tutela della banca dati

Il punto qualificante della risposta è il seguente. La banca dati SentenzeWeb, testualmente, «costituisce, per selezione ed organizzazione del materiale e per gli investimenti dedicati, una banca dati ai sensi degli artt. 102-bis e 102-ter L. 633/1941». Il costitutore, vale a dire, nel caso, l'Amministrazione della Giustizia per il tramite del CED, ha dunque il diritto di vietare l'estrazione e il reimpiego della totalità o di parte sostanziale del contenuto, nonché l'estrazione e il reimpiego ripetuti e sistematici di parti non sostanziali ove tali condotte pregiudichino gli interessi del costitutore. Da ciò discende, conclude il Direttore in termini espressi, che «attività quali crawling, scraping, indicizzazione interna, acquisizioni massive e/o periodiche per costruire dataset o per integrare archivi proprietari non sono consentite senza autorizzazione».

La presa di posizione è, sotto il profilo giuridico, di limpida coerenza con il quadro normativo ricostruito al paragrafo 4. La Corte distingue, come deve, tra il testo del provvedimento, pubblico dominio ex art. 5 L. 633/1941, e la banca dati che lo organizza, la quale gode di tutela autonoma e non è disponibile per estrazione automatizzata.

Il Text and Data Mining e l'opt-out

Sul terzo profilo, il Direttore svolge un'analisi articolata. L'art. 70-ter L. 633/1941, eccezione TDM per ricerca scientifica, è inapplicabile alla fattispecie del riuso commerciale, atteso che la norma riserva tale eccezione esclusivamente a soggetti qualificati (università, enti di ricerca non-profit, istituti di tutela del patrimonio culturale) e per finalità di ricerca scientifica in senso proprio. La norma non copre, viene espressamente rilevato, gli usi professionali e/o commerciali in senso lato.

L'art. 70-quater L. 633/1941 (eccezione TDM generale) sarebbe astrattamente applicabile, dal momento che il riuso commerciale rientra nel suo ambito; tuttavia, il Direttore osserva che «le Note legali esprimono una chiara riserva contro gli usi commerciali e lo sfruttamento economico, con conseguente inapplicabilità dell'eccezione di TDM generale ai contenuti della banca dati SentenzeWeb». La conclusione è giuridicamente ineccepibile. L'art. 70-quater subordina l'eccezione all'assenza di un opt-out «espresso e appropriato»; le note legali della Corte costituiscono, in tutta evidenza, un opt-out di tale natura, con conseguente preclusione dell'eccezione.

Le cautele in materia di dati personali

Il quarto profilo richiama gli artt. 51 e 52 del Codice Privacy, i quali, come si è osservato al paragrafo 4, disciplinano la diffusione on-line dei provvedimenti giurisdizionali e l'anonimizzazione dei dati identificativi, con obblighi specifici per chi diffonde o ridiffonde i provvedimenti. Il Direttore precisa che «la banca dati SentenzeWeb opera nel rispetto di tali cautele normative», e ne deduce che «qualsiasi riuso che non rispetti tali cautele è illecito». La precisazione assume rilievo per chi intenda, anche una volta ottenuto un titolo idoneo al riuso, sviluppare a propria volta servizi di diffusione: l'obbligo di anonimizzazione, lungi dall'essere assolto a monte, si rinnova in capo a ciascun successivo diffusore.

L'apertura del dato pubblico e l'assenza di licenze

Il quinto profilo affronta il versante del D.Lgs. 36/2006 e dell'apertura del dato pubblico. Il Direttore osserva che il decreto «disciplina l'apertura dei dati e il riutilizzo dell'informazione del settore pubblico alle condizioni e nei limiti ivi previsti, tra cui: rispetto dei diritti di proprietà intellettuale, tutela dei dati personali e delle eccezioni previste dall'art. 3; inoltre, l'apertura/riuso avviene tramite licenze e condizioni uniformi, secondo le Linee guida AgID». La conseguenza è netta: «in mancanza di una licenza o di un canale espressamente dedicato, non si può presumere alcun titolo abilitativo al riuso commerciale».

La conclusione che il Direttore trae da tale combinato disposto merita riproduzione integrale, per la sua densità sistematica: «anche prescindendo dal tema del diritto d'autore sul testo della sentenza (art. 5 L. 633/1941), il combinato disposto di Note legali del sito, diritto sui generis sulla banca dati, opt-out TDM, privacy (artt. 51-52) e assenza di licenze Open Data applicabili al portale SentenzeWeb comporta l'impossibilità del riuso dei contenuti per finalità diverse dall'uso personale/di studio, e preclude lo sfruttamento economico (incluse estrazioni massive, indicizzazione interna, creazione di dataset e integrazioni in servizi professionali/AI)». La frase rappresenta, è bene segnalarlo, la sintesi più compiuta che si conosca della posizione dell'Istituzione su tali profili, e merita di essere assunta come parametro di riferimento per qualsiasi successiva valutazione.

Il rilascio di copie da parte dell'URP

Il sesto profilo affronta il tema, di rilievo operativo non secondario, del rilascio copie da parte dell'Ufficio Relazioni con il Pubblico ai sensi del D.P.R. 30 maggio 2002, n. 115. Il Direttore chiarisce che l'URP rilascia copie semplici (per uso studio) e copie autentiche/legali (per finalità processuali), anche in formato telematico con firma digitale, previo pagamento dei diritti di copia. Tuttavia, qui sta il punto qualificante, «si tratta di un servizio di rilascio copie per fini processuali o di studio, non di un titolo a riutilizzare commercialmente i contenuti o a costituire banche dati proprietarie». La disponibilità di una copia, in altri termini, non legittima lo sfruttamento economico dei contenuti.

Il punto è di rilievo perché elimina, dalla mappa delle vie astrattamente percorribili, anche l'ipotesi, ricorrente nella prassi, di «aggirare» il regime del portale attraverso l'acquisizione massiva di copie tramite URP. La risposta è chiara. Tale acquisizione non costituisce titolo idoneo al riuso commerciale, e qualsiasi diffusione ulteriore o rielaborazione resta soggetta «a) alle cautele privacy (artt. 51-52); b) al divieto di estrazione/reimpiego della banca dati (artt. 102-bis/ter); c) ai termini d'uso del sito istituzionale (divieto di sfruttamento economico)».

L'inesistenza di una procedura per il riuso commerciale

Il punto più dirimente e, per il legal tech italiano, più gravido di conseguenze, è contenuto nella seconda risposta del Direttore. Alla domanda specifica se esista una procedura per ottenere il riuso commerciale dei provvedimenti della Corte e se sia possibile presentare istanza per la stipula di una convenzione ad hoc, la risposta è negativa in termini espliciti: «la Corte non ha aperto il riuso commerciale dei contenuti di SentenzeWeb tramite licenze o canali tecnici e, anzi, lo esclude nelle Note legali. Non esiste, dunque, alcuna procedura per "autorizzare" l'uso richiesto e, per la stessa ragione, non vi è un ufficio competente a ricevere o valutare istanze in tal senso».

La portata istituzionale di tale affermazione non può essere sottovalutata. L'operatore legal tech che intenda costruire un sistema di intelligenza artificiale alimentato da decisioni della Corte di Cassazione si trova, allo stato, dinanzi non già ad un percorso oneroso o complesso, ma all'inesistenza materiale di un percorso. Non esiste, in altri termini, una procedura, neppure teorica, per ottenere il consenso dell'Istituzione al riuso. La conseguenza pratica è radicale. Per quanto un operatore sia disposto ad accettare condizioni anche stringenti (corrispettivi, obblighi di pseudonimizzazione, vincoli di trasparenza, audit periodici) non vi è, allo stato, alcuna autorità presso la quale formalizzare una proposta in tal senso.

Il Direttore aggiunge che eventuali sviluppi futuri, quali progetti di dataset anonimizzati per ricerca scientifica o pubblicazione di API sotto specifica licenza, saranno resi noti esclusivamente attraverso le pagine istituzionali della Corte. Si tratta di una formulazione che, mentre lascia aperto il varco ad una possibile evoluzione del quadro, conferma con chiarezza l'attuale chiusura dell'Istituzione su tali profili.

Coerenza giuridica e tensioni sistematiche

La posizione della Corte, così ricostruita, presenta una indiscutibile coerenza giuridica. Il Direttore non ha fatto altro, in sostanza, che applicare puntualmente il quadro normativo vigente: l'art. 102-bis L. 633/1941 protegge la banca dati; le note legali esprimono un opt-out che esclude l'operatività dell'art. 70-quater; il D.Lgs. 36/2006 rinvia alle licenze, che nel caso non sono state adottate; il Codice Privacy impone cautele specifiche. Sotto il profilo strettamente formale, la posizione è inattaccabile.

Sotto un diverso angolo prospettico, però, la chiusura della Corte solleva interrogativi sistematici di notevole spessore. Si possono enucleare, in questa sede, almeno tre profili di tensione.

In primo luogo, la chiusura della Cassazione configura, in fatto, un trattamento sostanzialmente diversificato del dato giurisprudenziale all'interno dell'ordinamento italiano. La Corte Costituzionale apre il proprio corpus al riuso commerciale; la Giustizia amministrativa idem; il merito civile è acquisibile attraverso la Convenzione AIE; soltanto la Cassazione resta interamente preclusa. Tale asimmetria non riposa su una distinta natura giuridica dei provvedimenti, i provvedimenti della Cassazione sono, al pari di quelli costituzionali, atti ufficiali dello Stato ex art. 5 L. 633/1941, ma su una scelta organizzativa interna alla singola amministrazione titolare del dato. Si tratta di una scelta legittima sotto il profilo formale, ma di difficile giustificazione sotto il profilo della razionalità sistemica.

In secondo luogo, la chiusura presenta profili di tensione con i principi di trasparenza e di pubblicità degli atti giurisdizionali, costituzionalmente protetti. Le sentenze della Cassazione, in quanto strumento di nomofilachia, hanno una funzione che eccede l'interesse delle parti del singolo giudizio: orientano l'interpretazione della legge per l'intero ordinamento. La loro accessibilità diffusa, in formato strutturato e riutilizzabile, non è dunque una concessione al mercato, bensì una condizione strumentale alla effettività della funzione nomofilattica stessa. Una Corte la cui giurisprudenza non possa essere sistematicamente analizzata, indicizzata, classificata, è una Corte la cui funzione di guida interpretativa risulta, per ciò stesso, parzialmente compromessa.

In terzo luogo, l'attuale assetto produce un effetto di mercato tutt'altro che neutrale. Gli operatori legal tech italiani, che intendano costruire sistemi di intelligenza artificiale alimentati da giurisprudenza di legittimità, sono di fatto costretti a procurarsi tale corpus attraverso la mediazione degli editori giuridici tradizionali (Giuffrè, Wolters Kluwer, Il Foro Italiano), i quali, in forza dei propri rapporti consolidati con il CED e di proprie indipendenti operazioni di massimazione e curatela, dispongono di basi documentali ampie e strutturate. Il risultato è un assetto di mercato nel quale l'accesso alla materia prima è, di fatto, se non di diritto, riservato ad un ristretto novero di operatori storici, mentre i nuovi entranti devono negoziare licenze a valle anziché potersi rivolgere a monte all'Amministrazione titolare. La questione presenta, ad opinione di chi scrive, sebbene non costituisca oggetto specifico del presente lavoro, profili di rilievo sotto il profilo della disciplina antitrust e della essential facilities doctrine, che meriterebbero approfondimento autonomo.

Non sfugge, sotto altro angolo prospettico, che il mercato del legal tech italiano presenta, a quanto consta da una ricognizione condotta sui prodotti commercialmente disponibili, un numero non marginale di operatori che propongono soluzioni di intelligenza artificiale dichiaratamente alimentate dalla giurisprudenza della Cassazione, in assenza di qualsiasi indicazione pubblica circa la natura del titolo abilitativo all'acquisizione del corpus. Le descrizioni delle fonti, nei materiali commerciali, restano generiche («banche dati ufficiali», «giurisprudenza completa», «archivi aggiornati») e non consentono di ricondurre l'origine dei dati né a licenze editoriali strutturate, né ad un titolo istituzionale (che, come si è visto, non esiste), né ad alcun canale convenzionale o autorizzativo. L'osservazione, formulata in via di mera ipotesi e in difetto di evidenze pubbliche conclusive, è che una porzione non irrilevante di tali operatori abbia costruito i propri archivi di legittimità attraverso modalità estranee al perimetro di legittimità ricostruito al paragrafo precedente, e segnatamente attraverso operazioni di estrazione automatizzata dai portali istituzionali della Corte, in primis SentenzeWeb, in violazione tanto del divieto di estrazione massiva fissato dalle note legali, quanto della tutela sui generis della banca dati di cui agli artt. 102-bis e 102-ter L. 633/1941, quanto, infine, dell'opt-out espresso che le medesime note configurano ai sensi dell'art. 70-quater della medesima legge.

Si tratta, ove confermata, di una prassi che espone gli operatori coinvolti a un rischio giuridico consistente, sia sotto il profilo civilistico, per il risarcimento dei danni da estrazione abusiva di banca dati, sia sotto il profilo regolatorio, in considerazione delle sanzioni previste dal GDPR, e che, sul piano sistematico, rivela quanto la chiusura istituzionale del dato di legittimità produca, paradossalmente, l'effetto opposto a quello dichiarato. E cioè, anziché tutelare la banca dati, finisce per generare un'area grigia di prassi non controllabili nella quale il presidio della legittimità viene rimesso, di fatto, alla diligenza dei singoli operatori.

Tale stato di cose non costituisce, ad avviso di chi scrive, un equilibrio sostenibile nel medio periodo. La pressione delle politiche europee in materia di open data giudiziari, l'affermarsi di standard tecnici comuni quali ECLI ed ELI, lo sviluppo del cosiddetto European Judicial Data Space e la maturazione del mercato del legal tech, anche per effetto delle iniziative di soggetti pubblici come Cassa Forense, renderanno presumibilmente, entro un orizzonte temporale ragionevole, non più rinviabile una presa di posizione istituzionale della Corte sul tema dell'apertura, sia pure regolata e condizionata, del proprio corpus.

6. Considerazioni conclusive

La ricostruzione condotta nel presente contributo restituisce un ecosistema dei dati giuridici italiani strutturalmente asimmetrico: maturo sul versante normativo, profondamente disomogeneo su quello giurisprudenziale, in larga parte chiuso al riutilizzo per finalità di addestramento algoritmico nei suoi snodi più rilevanti e, su tutti, la giurisdizione di legittimità.

Sotto il profilo operativo, il panorama che si offre all'operatore legal tech è il seguente. La normativa è integralmente disponibile in formato aperto, con licenze idonee al riutilizzo commerciale, attraverso Normattiva, la Gazzetta Ufficiale, i portali parlamentari e i singoli portali regionali; la Corte Costituzionale rilascia il proprio corpus come open data; la Giustizia amministrativa offre, attraverso Open GA, il modello più maturo di apertura del dato giurisdizionale; il merito civile è acquisibile, in forma onerosa e regolamentata, attraverso la Convenzione AIE; le altre giurisdizioni adottano regimi variamente restrittivi. La Cassazione, viceversa, è allo stato interamente preclusa al riuso commerciale, in assenza di qualsiasi procedura per ottenerlo.

La conclusione è che un'operazione di legal AI rivolta al mercato italiano deve essere progettata, sotto il profilo della compliance delle fonti, secondo una logica di stratificazione: ingestione massiva e gratuita da Normattiva, dai portali regionali, da Open GA e dal portale open data della Corte Costituzionale; adesione alla Convenzione AIE per l'acquisizione del merito civile, con implementazione di una pipeline di pseudonimizzazione conforme alle Linee Guida del Garante; rinuncia all'ingestione diretta del corpus della Cassazione e ricorso, in via subordinata, alla mediazione degli editori giuridici tradizionali, attraverso licenze business-to-business formalmente strutturate. La compliance, in altri termini, non è una variabile da gestire a posteriori, ma il presupposto stesso di una architettura sostenibile.

Sul piano sistematico, peraltro, l'attuale assetto non costituisce, ad avviso di chi scrive, un equilibrio destinato a permanere a lungo. La progressiva pressione delle politiche europee, l'affermarsi di standard tecnici condivisi, la maturazione del mercato e, non da ultimo, la crescente percezione, anche presso le Istituzioni, della funzione strumentale dell'apertura del dato giurisdizionale rispetto all'effettività della stessa funzione nomofilattica, costituiscono fattori convergenti che renderanno presumibilmente, in un orizzonte non remoto, non più rinviabile una rimeditazione delle scelte attualmente adottate dalla Corte di Cassazione.

In tale prospettiva, alcune indicazioni operative meriterebbero di essere prese in considerazione de iure condendo. In primo luogo, la previsione di una procedura formale per il riconoscimento di licenze al riuso commerciale dei provvedimenti della Cassazione, modulata sul modello della Convenzione AIE (corrispettivo annuo, obbligo di pseudonimizzazione, localizzazione UE, audit periodici) costituirebbe un primo, decisivo passo verso il superamento dell'attuale impasse. In secondo luogo, l'adozione di un portale open data dedicato della Cassazione, anche solo per il subset delle decisioni più recenti (ad esempio, l'ultimo quinquennio) e nei limiti delle cautele privacy, consentirebbe di disaccoppiare il regime del singolo provvedimento da quello della banca dati e di valorizzare, in chiave nomofilattica, la diffusione organizzata della giurisprudenza. In terzo luogo, una iniziativa congiunta del Ministero della Giustizia, della Cassazione e di AgID per la definizione di uno standard nazionale di pseudonimizzazione, anche in coerenza con gli sviluppi dello European Judicial Data Space, consentirebbe di presidiare, in modo unitario, le esigenze di tutela della privacy dei terzi citati nei provvedimenti.

In definitiva, il diritto italiano si trova oggi a fronteggiare una sfida che è ad un tempo tecnologica, istituzionale e culturale. La costruzione di sistemi di intelligenza artificiale al servizio del giurista non potrà fondarsi che su un patrimonio di dati ampio, strutturato, legittimamente acquisito e, al contempo, rispettoso degli equilibri tra apertura, tutela della privacy e protezione degli investimenti. È una sfida che chiama in causa, ad un tempo, il legislatore, le Istituzioni titolari dei dati, gli editori e gli operatori del mercato. Una sfida che richiede, più ancora delle innovazioni tecnologiche, una rinnovata capacità di lettura sistematica del rapporto tra diritto, tecnologia e funzione pubblica.

Note

[1] Per un inquadramento storico-istituzionale dell'informatica giuridica italiana, sia consentito rinviare ai contributi fondativi di V. Frosini, Cibernetica, diritto e società, Torino, 1968, e di M.G. Losano, Giuscibernetica. Macchine e modelli cibernetici nel diritto, Torino, 1969. Sull'esperienza specifica del CED, fondato per iniziativa di R. Borruso, si veda, dello stesso autore, Computer e diritto, Milano, 1988, vol. I.

[2] Si intersecano, in particolare: il piano istituzionale, attinente all'organizzazione delle fonti di produzione e cognizione del diritto e ai soggetti deputati alla loro pubblicazione; il piano tecnologico, relativo ai formati, agli standard e alle infrastrutture di distribuzione; il piano normativo, concernente il regime giuridico che governa l'accesso, il riutilizzo e l'estrazione sistematica delle informazioni del settore pubblico; il piano di mercato, infine, relativo alle strategie con cui editori, startup e centri di ricerca acquisiscono e trasformano il dato giuridico grezzo in prodotti a valore aggiunto.

[3] Le risposte del Direttore del CED, Dott. Alessio Scarcella, sono datate 25 febbraio 2026 e fanno seguito a due distinte istanze trasmesse a mezzo PEC dallo scrivente in data 24 febbraio 2026 (Prot. 24/02/2026.0002234.E e Prot. 24/02/2026.0002236.E). La documentazione è conservata agli atti dello Studio Agostini & Kasapoğlu.

[4] Portale realizzato e gestito dall'Istituto Poligrafico e Zecca dello Stato.

[5] Funzionalità che consente di ricostruire la norma applicabile ad una qualunque data storica, gestendo correttamente novelle, abrogazioni e sostituzioni nel tempo. Si tratta, sotto il profilo tecnico, di un patrimonio prezioso ai fini dell'addestramento di sistemi che debbano operare su questioni giuridiche risalenti.

[6] Si veda la sezione «Note Legali» del portale Normattiva (normattiva.it/staticPage/legal), nella quale si attesta che «la riproduzione dei testi forniti nel formato elettronico è consentita purché venga menzionata la fonte». Con decorrenza dal 1° gennaio 2026, il portale ha ufficializzato il rilascio dei dati con licenza CC-BY 4.0.

[7] Alcune Regioni si distinguono per la qualità delle proprie piattaforme: Demetra in Emilia-Romagna, Arianna in Piemonte, Lexview in Friuli-Venezia Giulia, SardegnaLegislazione e Lexbrowser della Provincia autonoma di Bolzano offrono testi consolidati in multivigenza, funzionalità di ricerca avanzata, API e dataset strutturati. Si tratta di un patrimonio informativo che, sebbene non goda della visibilità di Normattiva, riveste rilievo strategico per la copertura dei settori a competenza regionale. Per completezza, occorre rilevare che Normattiva non contiene i provvedimenti non numerati, e che per gli atti regolamentari e amministrativi di interesse generale (D.P.R., decreti ministeriali, circolari, comunicati) la fonte primaria resta l'archivio della Gazzetta Ufficiale della Repubblica Italiana, anch'esso curato dall'IPZS.

[8] I dati della Camera dei Deputati sono accessibili in formato RDF, CSV e JSON tramite endpoint SPARQL (dati.camera.it/sparql); quelli del Senato in formato Akoma Ntoso, con repository GitHub dedicato (github.com/senato/openparlamento). Le licenze adottate sono, rispettivamente, CC-BY 4.0 e CC-BY 3.0.

[9] Il portale open data della Corte Costituzionale (dati.cortecostituzionale.it) rende disponibili circa ventimila provvedimenti emessi dal 1956 ad oggi, in formato strutturato e machine-readable, con licenza CC-BY-SA 3.0. Si tratta dell'unica esperienza di vera apertura del dato giurisdizionale di vertice nell'ordinamento italiano.

[10] Il portale Open GA (openga.giustizia-amministrativa.it) rilascia dataset suddivisi per anno e per sede giudiziaria, già pseudonimizzati a monte e dotati di metadati procedurali strutturati. Le «Informazioni» attestano espressamente: «I contenuti di Open GA Open Data sono liberamente distribuibili e riutilizzabili, a patto che sia sempre citata la fonte».

[11] La Convenzione tra il Ministero della Giustizia e l'Associazione Italiana Editori, rinnovata in data 30 gennaio 2025, prevede la fornitura, tramite SFTP o API dedicate, dei provvedimenti civili emessi da Tribunali e Corti d'Appello a partire dal 1° gennaio 2016, in formato grezzo e non anonimizzato. L'art. 6.1 e l'art. 6.3 della Convenzione impongono, in capo all'editore aderente, la pseudonimizzazione dei dati personali secondo le Linee Guida del Garante per la Protezione dei Dati Personali del 2010; l'art. 7.3 prescrive la localizzazione dei dati in territorio dell'Unione Europea.

[12] Banca Dati della Giurisprudenza Tributaria (bancadatigiurisprudenza.giustiziatributaria.gov.it). I provvedimenti sono consultabili tramite motore di ricerca avanzato; il corpus è limitato alle sentenze native digitali emesse dal 2021 ad oggi. La licenza CC-BY-NC esclude l'uso commerciale, salvo autorizzazione espressa del Dipartimento per la Giustizia Tributaria.

[13] Le Note Legali della Corte dei Conti vincolano l'uso del proprio corpus a «esclusive finalità di ricerca e documentazione giuridica» (corteconti.it). Le Note Legali del Tribunale Superiore delle Acque Pubbliche autorizzano la riproduzione esclusivamente per finalità non commerciali.

[14] Le Note Legali del sito istituzionale (cortedicassazione.it) stabiliscono testualmente: «L'utente non può utilizzare o far utilizzare a fini commerciali a terzi il sito web e i dati ivi contenuti. Qualsiasi utilizzo per intento o utilità commerciale o di sfruttamento economico è espressamente vietato». La clausola, unitamente alla riserva dei diritti ivi espressa, integra un opt-out ai sensi dell'art. 70-quater L. 633/1941.

[15] Il D.P.R. 3 luglio 2004, n. 195 disciplina l'attività del CED. Sul piano operativo, ItalgiureWeb aggrega: giurisprudenza civile e penale della Cassazione (massime e sentenze integrali); sentenze del Consiglio di Stato e dei TAR; massime della Corte Costituzionale; giurisprudenza della Corte dei Conti; sentenze ed abstract della Corte Europea dei Diritti dell'Uomo; sentenze del Tribunale Superiore delle Acque Pubbliche; provvedimenti delle Commissioni Tributarie; oltre a normativa, dottrina e schemi classificatori. L'accesso è riservato agli abbonati, con specifiche convenzioni anche per gli iscritti alla Cassa Forense.

[16] La previsione si giustifica nella prospettiva di evitare che l'apertura indiscriminata del dato pubblico determini un sacrificio sproporzionato della riservatezza dei terzi. La medesima logica fonda, sotto altro profilo, le cautele privacy applicabili ai provvedimenti giurisdizionali (artt. 51-52 D.Lgs. 196/2003).

[17] Questo principio di portata generale assume, come si è visto, decisivo rilievo proprio nell'analisi del caso della Corte di Cassazione.

[18] Le risposte, formalmente sottoscritte dal Direttore del CED Dott. Alessio Scarcella, sono datate 25 febbraio 2026. La documentazione integrale è conservata agli atti dello Studio Agostini & Kasapoğlu.

Avv. Alberto Agostini e Avv. Irmak Kasapoğlu. Bologna, 10 maggio 2026. Contributo dello Studio Agostini & Kasapoğlu.

#IntelligenzaArtificiale #LegalTech #OpenData #DatiGiuridici #CorteDiCassazione #DirittoDelleNuoveTecnologie #TextAndDataMining #SentenzeWeb #GDPR #StudioAgostiniKasapoglu

Condividi su

← Torna agli Approfondimenti