Nel dibattito sull'infrastruttura AI, la "sovranità dei dati" viene spesso trattata come un adempimento burocratico — qualcosa di cui si preoccupa il team legale mentre gli ingegneri vanno avanti a costruire. È un inquadramento sbagliato, e pericolosamente tale.

La sovranità dei dati è un asset strategico. Le organizzazioni che la raggiungono hanno un vantaggio competitivo. Quelle che non ce la fanno si espongono a rischi che non sono pienamente visibili finché qualcosa non va storto.

Cosa significa davvero sovranità dei dati

Una vera sovranità dei dati significa che la tua organizzazione ha il controllo effettivo su:

Dove vengono archiviati i tuoi dati — fisicamente, in quale giurisdizione
Chi può accedervi — compresi i cloud provider, i loro governi e i subprocessor
Cosa ci succede — training, telemetria, caching, logging da parte di terze parti
Quali leggi li governano — quale foro ha giurisdizione sulle controversie

L'ultimo punto è spesso sottovalutato. Quando usi un cloud provider con sede negli Stati Uniti, i tuoi dati sono potenzialmente soggetti al CLOUD Act statunitense, che consente alle forze dell'ordine americane di obbligare i provider a produrre dati archiviati ovunque nel mondo — inclusi i data center nell'UE.

Il problema del CLOUD Act americano

Il Data Privacy Framework UE-USA (il successore del Privacy Shield) offre alcune protezioni, ma funziona sul presupposto che le decisioni di adeguatezza sopravvivano ai cambiamenti politici. Il Privacy Shield è stato annullato due volte (Schrems I e Schrems II). La longevità del framework dipende da una volontà politica duratura a Washington — che non è garantita.

Per le organizzazioni che trattano dati sensibili — cartelle cliniche, documenti legali, informazioni finanziarie, proprietà intellettuale — scommettere sulla stabilità degli accordi politici transatlantici non è una strategia di gestione del rischio.

L'AI peggiora le cose

La questione della sovranità diventa sensibilmente più complessa con l'intelligenza artificiale, per due ragioni.

Data leakage nel training. Molte API cloud AI usano le query dei clienti per migliorare i propri modelli. Anche quando i provider offrono opt-out, i termini contrattuali contengono spesso delle eccezioni. Informazioni riservate su clienti, ricerche non pubblicate, segreti industriali — tutto questo può finire nelle pipeline di addestramento dei modelli se non controlli lo stack di inferenza.

Esposizione dei dati in fase di inferenza. Anche se i tuoi dati non finiscono nel training, ogni chiamata API li invia su server stranieri. Per uno studio legale che lavora su documenti M&A, un ospedale che elabora note cliniche o una banca che valuta domande di credito, questo è un problema fondamentale di governance dei dati.

Le alternative europee ci sono

Per molto tempo, l'argomento pratico contro la sovranità dei dati era la performance: l'AI europea o self-hosted semplicemente non era abbastanza buona. Quell'argomento non regge più.

I modelli open-source di gruppi di ricerca europei e distribuiti a livello globale — Mistral, Qwen, Phi e altri — oggi eguagliano o superano i modelli chiusi americani su molti benchmark. E sono licenziati Apache 2.0, il che significa che le organizzazioni possono eseguirli, modificarli e costruirci sopra senza dipendenza da vendor.

Anche l'infrastruttura per eseguire questi modelli in modo efficiente è maturata. EULLM Engine offre continuous batching con un miglioramento del throughput del 2–2,5× rispetto all'elaborazione sequenziale, accelerazione GPU su NVIDIA, AMD e Apple Silicon, e quantized KV cache che abilita context più ampi su GPU da 16 GB. Il gap di performance si è chiuso.

Come appare la sovranità nella pratica

Un deployment AI sovrano per un'istituzione finanziaria europea potrebbe essere strutturato così:

Inferenza su server on-premise a Francoforte o su cloud provider con sede nell'UE (Hetzner, OVH, Scaleway)
Il modello è fine-tuned su dati proprietari che non escono mai dal perimetro dell'istituzione
I log di audit vengono conservati internamente per la conformità all'AI Act
L'API è compatibile con OpenAI, così le integrazioni esistenti funzionano senza modifiche
Zero flussi di dati verso infrastrutture statunitensi o cinesi

Non è un'ipotesi. È quello che EULLM è costruito per abilitare, oggi.

EULLM Engine è pronto per la produzione. Inizia su GitHub.