EULLM
Legal IT — primo verticale · dataset quasi completo · Q3 2026

Specialisti da 7B che superano
i generalisti da 70B

nel tuo settore regolamentato, sulla tua infrastruttura EU.

EuLLM distilla e verticalizza modelli open-weight in specialisti 7B compatti per i settori legale, medico e tecnico — ospitati nell'UE, schede di conformità AI Act incluse.

Per team legali, responsabili compliance, strutture sanitarie e organizzazioni tecniche che non possono mandare dati verso i cloud americani.

70B → 7B
Compressione del modello
~50×
Costo inferenza vs frontier
259 tok/s
Throughput inferenza
AI Act
Schede conformità integrate
EIC 2026
Candidato EIC Accelerator
Forge

La fucina di modelli verticali

Prendi un modello frontier da 70B e distillalo in uno specialista da 7B o 4B nel tuo settore — più preciso dell'originale nel tuo ambito. Meno compute, più precisione, piena sovranità EU.

  • Structural pruning — rimozione della capacità irrilevante senza riaddestrare da zero
  • Knowledge distillation — trasferimento della competenza specialistica in un modello più piccolo
  • Quantization — massimizza il throughput sull'hardware che hai già
  • Identity fine-tuning — identità su misura, brand voice e istruzioni
  • Export GGUF — gira immediatamente su Engine, senza tooling aggiuntivo
1

Scegli il modello base

Qualsiasi modello frontier Apache 2.0 (70B, 32B…)

2

Definisci il tuo settore

Legale, medico, finanziario, tecnico…

3

Avvia la pipeline Forge

Prune → Distill → Quantize → Fine-tune

4

Esporta e deploya

Output GGUF, gira subito su Engine

Hub

Registro modelli con sede nell'UE

Modelli verticali pre-specializzati per i settori regolamentati europei, ospitati interamente nell'UE. Ogni modello include una scheda di conformità AI Act.

Primo verticale — dataset prontoQ3 2026

Legal IT

Analisi contratti, assessment GDPR, conformità al diritto UE — giurisdizione italiana

  • Addestrato su giurisprudenza italiana selezionata, codice civile e corpus normativo UE
  • 7B parametri — scheda conformità AI Act ad alto rischio inclusa
  • Distillato da un modello frontier open-weight da 70B
Medical

Documentazione clinica, codifica ICD, supporto al triage

In arrivo nel 2026
Finance

Valutazione del rischio, automazione KYC, reportistica MiFID II

In arrivo nel 2026

Cerchi un verticale che non abbiamo ancora?

Costruiamo modelli specializzati su misura per il tuo settore regolamentato.

Scrivici →

Tutti i modelli Hub usano esclusivamente pesi con licenza Apache 2.0 — sovranità white-label per le aziende europee. Vedi la roadmap completa →

Engine

Il runtime che fa girare tutto veloce

Un server di inferenza production-ready scritto in Rust — sostituto drop-in di Ollama con API compatibile OpenAI. Engine alimenta ogni modello verticale EULLM a 259 tok/s con telemetria zero al di fuori dell'UE.

  • Continuous batching — 259 tok/s con 16 richieste concorrenti
  • Accelerazione GPU: NVIDIA CUDA, AMD ROCm, Vulkan, Apple Metal
  • TurboQuant KV cache compression — context 131K su GPU da 16 GB
  • Audit logging integrato per conformità EU AI Act
  • Web browsing trasparente senza overhead di function-calling
  • Binari precompilati per Linux e macOS (x64 e ARM64)
terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

L'AI sovrana inizia qui

I tuoi dati restano in Europa. I tuoi modelli portano il tuo brand. Nessuna dipendenza da API, nessun vendor lock-in.