Due anni fa, l'argomento a favore della sovranità AI europea si scontrava spesso con un muro pratico: i modelli open-source non erano abbastanza buoni. Il gap tra GPT-4 e le migliori alternative open-source era reale, e nei casi d'uso in produzione, pesava.

Quell'argomento è ora obsoleto. L'ecosistema AI open-source nel 2026 è genuinamente competitivo con i modelli proprietari closed — e su alcune dimensioni li ha superati.

Il panorama dei modelli

Mistral rimane il punto di riferimento dell'AI europea. La società parigina ha costantemente spinto la frontiera dei modelli open-weight. Mistral Large 2, uscito a fine 2024, ha dimostrato che un lab europeo può competere con i migliori modelli americani sui benchmark standard, e farlo con un modello disponibile sotto una licenza che ne consente l'uso commerciale.

Qwen, del gruppo di ricerca di Alibaba, merita una menzione anche se non è europeo: è licenziato Apache 2.0 ed è diventato uno standard di fatto per i deployment europei multilingua, grazie alle sue ottime performance in lingue non inglesi, tra cui francese, tedesco, italiano, spagnolo e polacco.

I modelli Phi di Microsoft Research incarnano una filosofia diversa: modelli molto piccoli che rendono ben al di sopra della loro categoria grazie a una cura meticolosa dei dati di addestramento. La linea Phi-4 dimostra che un modello da 14B parametri può superare molti modelli da 70B nei task di ragionamento — un aspetto importante per le organizzazioni che devono fare girare AI su hardware con risorse limitate.

Llama è assente dai modelli supportati da EULLM, e deliberatamente. La licenza Llama di Meta include requisiti di branding che confliggono con il deployment white-label. Per le organizzazioni che costruiscono prodotti AI sovrani sotto il proprio brand, i termini di Llama creano rischio legale. I modelli Apache 2.0 evitano questo problema alla radice.

La maturità dell'infrastruttura

I progressi sui modelli sono stati accompagnati da una maturità dell'infrastruttura. Tre anni fa, mettere in piedi un server di inferenza LLM in produzione era un compito da specialisti. Oggi:

llama.cpp abilita inferenza CPU e GPU efficiente per i modelli GGUF quantizzati su hardware commodity
Ollama ha portato un layer API developer-friendly, anche se le sue pratiche di telemetria hanno sollevato qualche interrogativo per gli utenti enterprise
EULLM Engine costruisce su queste fondamenta aggiungendo continuous batching, piena accelerazione GPU su NVIDIA CUDA, AMD ROCm, Vulkan e Apple Metal, e telemetria zero al di fuori dell'UE

Anche sul fronte hardware le cose sono migliorate. Le GPU NVIDIA H100 sono sempre più disponibili presso i cloud provider con sede nell'UE. Per i deployment più piccoli, l'hardware consumer può far girare modelli da 7B–14B senza problemi, e la quantizzazione moderna rende fattibili modelli da 30B+ su hardware che due anni fa avrebbe faticato.

L'ecosistema di compliance

Ciò che sta emergendo attorno a queste capacità tecniche è altrettanto rilevante: un ecosistema di compliance costruito appositamente per il contesto regolatorio dell'UE.

I requisiti dell'EU AI Act per i sistemi AI ad alto rischio — valutazioni di conformità, documentazione tecnica, audit logging, meccanismi di supervisione umana — stanno cominciando a trovare risposta in strumenti open-source. Il logging di audit integrato in EULLM è un pezzo. Le schede di conformità AI Act sui modelli di Hub sono un altro.

Questa infrastruttura di compliance è un differenziatore genuino per le soluzioni europee. I cloud provider americani e cinesi offrono modelli potenti, ma non forniscono gli audit trail, le garanzie di residenza dei dati o la documentazione regolamentare che i procurement enterprise europei richiedono sempre di più.

Cosa manca ancora

Una valutazione onesta impone di riconoscere i gap.

Tooling end-to-end. I componenti ci sono — inferenza, fine-tuning, model registry, documentazione di compliance — ma non formano ancora una piattaforma integrata e fluida. EULLM sta lavorando in questa direzione; Forge e Hub sono ancora in fase di maturazione.

Ricerca frontier europea. Nonostante il successo di Mistral, l'Europa non ha ancora un lab che addestra modelli alla frontiera in modo sistematico (100B+ parametri). Potrebbe importare meno man mano che l'efficienza dell'inferenza migliora, ma è un gap.

Ecosistema di supporto enterprise. L'infrastruttura self-hosted richiede qualcuno che la gestisca. L'ecosistema di aziende europee che offrono supporto, deployment gestito e consulenza intorno all'AI open-source sta crescendo, ma è ancora sottile rispetto a quanto disponibile per l'AI cloud.

La direzione di marcia

La traiettoria è chiara. I modelli open-source migliorano più velocemente di quelli proprietari, in parte perché talenti e compute sono più distribuiti. Gli strumenti infrastrutturali stanno maturando. Il contesto regolatorio sta creando domanda per alternative sovrane.

Per le organizzazioni europee che prendono decisioni di infrastruttura AI oggi, la domanda non è se l'AI open-source sovrana possa funzionare per il loro caso d'uso. La domanda è quale percorso di implementazione abbia senso per i loro specifici requisiti di compliance, i vincoli hardware e le esigenze di specializzazione settoriale.

È a quella domanda che EULLM è costruito per rispondere.

EULLM è una piattaforma open-source per il deployment AI sovrano in Europa. Esplora su GitHub.