Legal IT — primo verticale · dataset quasi completo · Q3 2026

Specialisti da 7B che superano
i generalisti da 70B

nel tuo settore regolamentato, sulla tua infrastruttura EU.

EuLLM distilla e verticalizza modelli open-weight in specialisti 7B compatti per i settori legale, medico e tecnico — ospitati nell'UE, schede di conformità AI Act incluse.

Inizia su GitHub Scopri la Forge

Per team legali, responsabili compliance, strutture sanitarie e organizzazioni tecniche che non possono mandare dati verso i cloud americani.

70B → 7B: Compressione del modello
~50×: Costo inferenza vs frontier
Visione+Audio: Multimodale, tutto in locale
AI Act: Schede conformità integrate
EIC 2026: Candidato EIC Accelerator

Forge

La fucina di modelli verticali

Prendi un modello frontier da 70B e distillalo in uno specialista da 7B o 4B nel tuo settore — più preciso dell'originale nel tuo ambito. Meno compute, più precisione, piena sovranità EU.

Structural pruning — rimozione della capacità irrilevante senza riaddestrare da zero
Knowledge distillation — trasferimento della competenza specialistica in un modello più piccolo
Quantization — massimizza il throughput sull'hardware che hai già
Identity fine-tuning — identità su misura, brand voice e istruzioni
Export GGUF — gira immediatamente su Engine, senza tooling aggiuntivo

Leggi la documentazione →Ti serve un modello verticale su misura? Scrivici →

Scegli il modello base

Qualsiasi modello frontier Apache 2.0 (70B, 32B…)

Definisci il tuo settore

Legale, medico, finanziario, tecnico…

Avvia la pipeline Forge

Prune → Distill → Quantize → Fine-tune

Esporta e deploya

Output GGUF, gira subito su Engine

Hub

Registro modelli con sede nell'UE

Modelli verticali pre-specializzati per i settori regolamentati europei, ospitati interamente nell'UE. Ogni modello include una scheda di conformità AI Act.

Primo verticale — dataset prontoQ3 2026

Legal IT

Analisi contratti, assessment GDPR, conformità al diritto UE — giurisdizione italiana

✓Addestrato su giurisprudenza italiana selezionata, codice civile e corpus normativo UE
✓7B parametri — scheda conformità AI Act ad alto rischio inclusa
✓Distillato da un modello frontier open-weight da 70B

Medical

Documentazione clinica, codifica ICD, supporto al triage

In arrivo nel 2026

Finance

Valutazione del rischio, automazione KYC, reportistica MiFID II

In arrivo nel 2026

Cerchi un verticale che non abbiamo ancora?

Costruiamo modelli specializzati su misura per il tuo settore regolamentato.

Scrivici →

Tutti i modelli Hub usano esclusivamente pesi con licenza Apache 2.0 — sovranità white-label per le aziende europee. Vedi la roadmap completa →

Engine

Il runtime che fa girare tutto veloce

Un server di inferenza production-ready scritto in Rust — sostituto drop-in di Ollama con API compatibile OpenAI. Engine alimenta ogni modello verticale EULLM a 259 tok/s con telemetria zero al di fuori dell'UE. API sulla porta standard di Ollama (11434), chat UI integrata sulla 11435 — nessuna collisione.

Multimodale (visione + audio) — OCR immagini, descrizione scene, trascrizione audio, tutto in locale su GPU consumer
Continuous batching — 259 tok/s con 16 richieste concorrenti
Accelerazione GPU: NVIDIA CUDA (testato), AMD ROCm, Vulkan, Apple Metal
Quantized KV cache — Q4_0/Q5/Q8 per ~2-4× di context sulla stessa GPU
Web browsing trasparente (--web) — model-agnostic, funziona con qualsiasi GGUF
Dual-listener — API su :11434 (standard Ollama), chat UI su :11435 (~29 KB nel binario, zero CDN)
Audit logging integrato per conformità EU AI Act
Binari standalone: Linux x64 + Windows x64 testati · macOS e ARM64 sperimentali

Leggi la documentazione →

terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

Blog

Articoli recenti

Vedi tutti →

13 giugno 2026 · 6 min read

Gli USA hanno già la sovranità sull'AI. L'Europa la sta ancora discutendo.

Il 12 giugno 2026 il governo statunitense ha ordinato ad Anthropic di tagliare l'accesso ai suoi modelli AI più avanzati per ogni non-americano sul pianeta. Senza preavviso. Senza appello. Senza eccezioni. Se cercavate un campanello d'allarme su cosa significhi davvero la sovranità digitale nella pratica, eccolo.

Leggi →

1 aprile 2026 · 5 min read

AI open-source in Europa: lo stato delle cose nel 2026

L'AI open-source europea è maturata più in fretta di quanto quasi chiunque avesse previsto. Da Mistral a Qwen a un ecosistema crescente di strumenti di infrastruttura, lo stack AI sovrano è reale — ed è competitivo.

Leggi →

15 marzo 2026 · 3 min read

EU AI Act: cosa significa per la tua organizzazione

L'EU AI Act è il primo regolamento organico sull'intelligenza artificiale al mondo. Ecco quello che le aziende europee devono sapere — e perché gestire la propria infrastruttura LLM sta diventando un requisito di conformità.

Leggi →

L'AI sovrana inizia qui

I tuoi dati restano in Europa. I tuoi modelli portano il tuo brand. Nessuna dipendenza da API, nessun vendor lock-in.

Metti una stella su GitHub Leggi il blog

Specialisti da 7B che superanoi generalisti da 70B

La fucina di modelli verticali

Registro modelli con sede nell'UE

Legal IT

Il runtime che fa girare tutto veloce

Articoli recenti

Gli USA hanno già la sovranità sull'AI. L'Europa la sta ancora discutendo.

AI open-source in Europa: lo stato delle cose nel 2026

EU AI Act: cosa significa per la tua organizzazione

L'AI sovrana inizia qui

Specialisti da 7B che superano
i generalisti da 70B