
Specialisti da 7B che superano
i generalisti da 70B
nel tuo settore regolamentato, sulla tua infrastruttura EU.
EuLLM distilla e verticalizza modelli open-weight in specialisti 7B compatti per i settori legale, medico e tecnico — ospitati nell'UE, schede di conformità AI Act incluse.
Per team legali, responsabili compliance, strutture sanitarie e organizzazioni tecniche che non possono mandare dati verso i cloud americani.
- 70B → 7B
- Compressione del modello
- ~50×
- Costo inferenza vs frontier
- 259 tok/s
- Throughput inferenza
- AI Act
- Schede conformità integrate
- EIC 2026
- Candidato EIC Accelerator
La fucina di modelli verticali
Prendi un modello frontier da 70B e distillalo in uno specialista da 7B o 4B nel tuo settore — più preciso dell'originale nel tuo ambito. Meno compute, più precisione, piena sovranità EU.
- Structural pruning — rimozione della capacità irrilevante senza riaddestrare da zero
- Knowledge distillation — trasferimento della competenza specialistica in un modello più piccolo
- Quantization — massimizza il throughput sull'hardware che hai già
- Identity fine-tuning — identità su misura, brand voice e istruzioni
- Export GGUF — gira immediatamente su Engine, senza tooling aggiuntivo
Scegli il modello base
Qualsiasi modello frontier Apache 2.0 (70B, 32B…)
Definisci il tuo settore
Legale, medico, finanziario, tecnico…
Avvia la pipeline Forge
Prune → Distill → Quantize → Fine-tune
Esporta e deploya
Output GGUF, gira subito su Engine
Registro modelli con sede nell'UE
Modelli verticali pre-specializzati per i settori regolamentati europei, ospitati interamente nell'UE. Ogni modello include una scheda di conformità AI Act.
Legal IT
Analisi contratti, assessment GDPR, conformità al diritto UE — giurisdizione italiana
- ✓Addestrato su giurisprudenza italiana selezionata, codice civile e corpus normativo UE
- ✓7B parametri — scheda conformità AI Act ad alto rischio inclusa
- ✓Distillato da un modello frontier open-weight da 70B
Documentazione clinica, codifica ICD, supporto al triage
Valutazione del rischio, automazione KYC, reportistica MiFID II
Cerchi un verticale che non abbiamo ancora?
Costruiamo modelli specializzati su misura per il tuo settore regolamentato.
Tutti i modelli Hub usano esclusivamente pesi con licenza Apache 2.0 — sovranità white-label per le aziende europee. Vedi la roadmap completa →
Il runtime che fa girare tutto veloce
Un server di inferenza production-ready scritto in Rust — sostituto drop-in di Ollama con API compatibile OpenAI. Engine alimenta ogni modello verticale EULLM a 259 tok/s con telemetria zero al di fuori dell'UE.
- Continuous batching — 259 tok/s con 16 richieste concorrenti
- Accelerazione GPU: NVIDIA CUDA, AMD ROCm, Vulkan, Apple Metal
- TurboQuant KV cache compression — context 131K su GPU da 16 GB
- Audit logging integrato per conformità EU AI Act
- Web browsing trasparente senza overhead di function-calling
- Binari precompilati per Linux e macOS (x64 e ARM64)
# Download Engine (Linux x64)
curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm
chmod +x eullm
# Run a model
./eullm run ./model.gguf --batch-size 16
# OpenAI-compatible API on :11434
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'
Articoli recenti
1 aprile 2026 · 5 min read
AI open-source in Europa: lo stato delle cose nel 2026
L'AI open-source europea è maturata più in fretta di quanto quasi chiunque avesse previsto. Da Mistral a Qwen a un ecosistema crescente di strumenti di infrastruttura, lo stack AI sovrano è reale — ed è competitivo.
Leggi →
15 marzo 2026 · 3 min read
EU AI Act: cosa significa per la tua organizzazione
L'EU AI Act è il primo regolamento organico sull'intelligenza artificiale al mondo. Ecco quello che le aziende europee devono sapere — e perché gestire la propria infrastruttura LLM sta diventando un requisito di conformità.
Leggi →
28 febbraio 2026 · 4 min read
Sovranità dei dati europea: perché conta più che mai
Le organizzazioni europee si stanno rendendo conto, tardi ma in modo sempre più nitido, dei rischi legati alla dipendenza da infrastrutture cloud statunitensi e cinesi per i carichi di lavoro AI critici. Cosa significa davvero sovranità dei dati — e perché le poste in gioco sono più alte di quanto molti pensino.
Leggi →
L'AI sovrana inizia qui
I tuoi dati restano in Europa. I tuoi modelli portano il tuo brand. Nessuna dipendenza da API, nessun vendor lock-in.