EULLM
Legal IT — eerste verticaal · dataset bijna compleet · Q3 2026

7B-specialisten die beter presteren dan
70B-generalisten

in uw gereguleerde sector, op uw EU-infrastructuur.

EuLLM destilleert en verticaliseert open-weight modellen tot compacte 7B-specialisten voor juridische, medische en technische domeinen — gehost in de EU, inclusief AI Act-compliancekaarten.

Gebouwd voor juridische teams, compliance-officers, medische instellingen and technische organisaties die geen data naar Amerikaanse clouds mogen sturen.

70B → 7B
Modelcompressie
~50×
Lagere inferentiekosten vs. frontier
Vision+Audio
Multimodaal, volledig lokaal
AI Act
Compliancekaarten ingebouwd
EIC 2026
Accelerator-aanvrager
Forge

De verticale modelgieterij

Neem een frontier-model van 70B en destilleer het tot een compacte domeinspecialist van 7B of 4B die het origineel overtreft in uw doeldomein. Minder rekenkracht, meer precisie, volledige EU-soevereiniteit.

  • Structureel snoeien — verwijder irrelevante capaciteit zonder opnieuw vanaf nul te trainen
  • Kennisdestillatie — breng domeinexpertise over naar een kleiner model
  • Kwantisering — maximaliseer doorvoer op bestaande hardware
  • Identiteitsfijnafstemming — aangepaste persona, merkstem en instructies
  • GGUF-export — draait direct op Engine, geen extra tooling nodig
1

Selecteer basismodel

Elk Apache 2.0 frontier-model (70B, 32B…)

2

Definieer uw sector

Juridisch, medisch, financieel, technisch…

3

Voer Forge-pipeline uit

Snoei → Destilleer → Kwantiseer → Fijnafstem

4

Exporteer en implementeer

GGUF-uitvoer, draait direct op Engine

Hub

EU-gebaseerd modelregister

Vooraf gespecialiseerde verticale modellen voor gereguleerde Europese sectoren, volledig gehost binnen de EU. Elk model wordt geleverd met een AI Act-compliancekaart.

Eerste verticaal — dataset gereedQ3 2026

Legal IT

Contractanalyse, GDPR-beoordeling, EU-regelgevingscompliance — Italiaans rechtsgebied

  • Getraind op samengestelde Italiaanse jurisprudentie, burgerlijk wetboek en EU-regelgevingscorpus
  • 7B parameters — AI Act hoog-risico compliancekaart inbegrepen
  • Gedestilleerd uit een 70B frontier open-weight model
Medisch

Klinische documentatie, ICD-codering, ondersteuning patiënttriage

Later in 2026 beschikbaar
Finance

Risicobeoordeling, KYC-automatisering, MiFID II-compliancerapportage

Later in 2026 beschikbaar

Heeft u een verticaal dat we nog niet hebben?

Wij bouwen aangepaste specialistische modellen voor uw gereguleerde sector.

Neem contact op →

Alle Hub-modellen gebruiken uitsluitend Apache 2.0 -gelicentieerde gewichten — white-label soevereiniteit voor Europese bedrijven. Bekijk volledige roadmap →

Engine

De runtime die alles snel maakt

Een productieklare inferentieserver gebouwd in Rust — drop-in vervanging voor Ollama met een OpenAI-compatibele API. Engine drijft elk EULLM-verticaal model aan op 259 tok/s zonder enige niet-EU-telemetrie. API op de standaard Ollama-poort (11434), ingebouwde chat-UI op 11435 — geen conflicten.

  • Multimodaal (vision + audio) — afbeeldings-OCR, scènebeschrijving, audiotranscriptie, volledig lokaal op consumenten-GPU's
  • Continue batching — 259 tok/s met 16 gelijktijdige verzoeken
  • GPU-versnelling: NVIDIA CUDA (getest), AMD ROCm, Vulkan, Apple Metal
  • Gekwantiseerde KV-cache — Q4_0/Q5/Q8 voor ~2-4× meer context op dezelfde GPU
  • Transparant webbrowsen (--web) — modelagnostisch, werkt met elke GGUF
  • Dubbele listener — API op :11434 (Ollama-standaard), chat-UI op :11435 (~29 KB in binair bestand, geen CDN)
  • Ingebouwde auditlogging voor EU AI Act-compliance
  • Standalone binaries: Linux x64 + Windows x64 getest · macOS & ARM64 experimenteel
terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

Soevereine AI begint hier

Uw data blijft in Europa. Uw modellen dragen uw merk. Geen API-afhankelijkheden, geen vendor lock-in.