EULLM
Legal IT — erstes Vertikale · Datensatz fast vollständig · Q3 2026

7B-Spezialisten, die übertreffen
70B-Generalisten

in Ihrem regulierten Sektor, auf Ihrer EU-Infrastruktur.

EuLLM destilliert und vertikalisiert Open-Weight-Modelle zu kompakten 7B-Spezialisten für die Bereiche Recht, Medizin und Technik — in der EU gehostet, AI Act-Konformitätskarten inklusive.

Entwickelt für Rechtsteams, Compliance-Beauftragte, medizinische Einrichtungen und technische Organisationen die keine Daten in US-Clouds senden können.

70B → 7B
Modellkomprimierung
~50×
Inferenzkosten vs. Frontier
Vision+Audio
Multimodal, vollständig lokal
AI Act
Konformitätskarten integriert
EIC 2026
EIC Accelerator-Bewerber
Forge

Die vertikale Modellschmiede

Nehmen Sie ein 70B-Frontier-Modell und destillieren Sie es zu einem schlanken 7B- oder 4B-Domänenspezialisten, der das Original in Ihrem Zielbereich übertrifft. Weniger Rechenaufwand, mehr Präzision, volle EU-Souveränität.

  • Structural pruning — irrelevante Kapazität entfernen, ohne von Grund auf neu zu trainieren
  • Knowledge distillation — Domänenexpertise in ein kleineres Modell übertragen
  • Quantization — Throughput auf bestehender Hardware maximieren
  • Identity fine-tuning — individuelle Persona, Brand Voice und Anweisungen
  • GGUF-Export — läuft sofort auf Engine, kein zusätzliches Tooling erforderlich
1

Basismodell auswählen

Beliebiges Apache 2.0-Frontier-Modell (70B, 32B…)

2

Ihren Sektor definieren

Recht, Medizin, Finanzen, Technik…

3

Forge-Pipeline starten

Prune → Distill → Quantize → Fine-tune

4

Exportieren & bereitstellen

GGUF-Ausgabe, läuft sofort auf Engine

Hub

Europäisches Modellregister

Vorspezializierte vertikale Modelle für regulierte europäische Branchen, vollständig innerhalb der EU gehostet. Jedes Modell wird mit einer AI Act-Konformitätskarte geliefert.

Erstes Vertikale — Datensatz bereitQ3 2026

Legal IT

Vertragsanalyse, GDPR-Bewertung, EU-Regulierungskonformität — italienische Rechtsordnung

  • Trainiert auf kuratierter italienischer Rechtsprechung, Zivilgesetzbuch und EU-Regulierungskorpus
  • 7B Parameter — AI Act-Konformitätskarte für Hochrisiko-KI inklusive
  • Destilliert aus einem 70B-Frontier-Open-Weight-Modell
Medizin

Klinische Dokumentation, ICD-Kodierung, Unterstützung bei der Patiententriagle

Ab 2026 verfügbar
Finanzen

Risikobewertung, KYC-Automatisierung, MiFID II-Konformitätsberichterstattung

Ab 2026 verfügbar

Benötigen Sie ein Vertikale, das wir noch nicht haben?

Wir entwickeln maßgeschneiderte Spezialmodelle für Ihren regulierten Sektor.

Kontaktieren Sie uns →

Alle Hub-Modelle verwenden ausschließlich Gewichte unter Apache 2.0 Lizenz — White-Label-Souveränität für europäische Unternehmen. Vollständige Roadmap ansehen →

Engine

Die Laufzeitumgebung, die alles beschleunigt

Ein produktionsreifer Inferenz-Server in Rust — direkter Ollama-Ersatz mit OpenAI-kompatibler API. Engine betreibt jedes vertikale EULLM-Modell mit 259 Tok/s ohne jegliche Telemetrie außerhalb der EU. API auf dem Ollama-Standardport (11434), integrierte Chat-Oberfläche auf 11435 — keine Konflikte.

  • Multimodal (Vision + Audio) — Bild-OCR, Szenenbeschreibung, Audiotranskription, vollständig lokal auf Consumer-GPUs
  • Continuous batching — 259 Tok/s bei 16 gleichzeitigen Anfragen
  • GPU-Beschleunigung: NVIDIA CUDA (getestet), AMD ROCm, Vulkan, Apple Metal
  • Quantized KV cache — Q4_0/Q5/Q8 für ~2-4× Kontext auf derselben GPU
  • Transparentes Web-Browsing (--web) — model-agnostic, funktioniert mit jedem GGUF
  • Dual-Listener — API auf :11434 (Ollama-Standard), Chat-Oberfläche auf :11435 (~29 KB im Binärformat, kein CDN)
  • Integriertes Audit-Logging für EU AI Act-Konformität
  • Standalone-Binärdateien: Linux x64 + Windows x64 getestet · macOS & ARM64 experimentell
terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

Souveräne KI beginnt hier

Ihre Daten bleiben in Europa. Ihre Modelle tragen Ihre Marke. Keine API-Abhängigkeiten, kein Vendor Lock-in.