Legal IT — erstes Vertikale · Datensatz fast vollständig · Q3 2026

7B-Spezialisten, die übertreffen
70B-Generalisten

in Ihrem regulierten Sektor, auf Ihrer EU-Infrastruktur.

EuLLM destilliert und vertikalisiert Open-Weight-Modelle zu kompakten 7B-Spezialisten für die Bereiche Recht, Medizin und Technik — in der EU gehostet, AI Act-Konformitätskarten inklusive.

Auf GitHub starten Die Foundry erkunden

Entwickelt für Rechtsteams, Compliance-Beauftragte, medizinische Einrichtungen und technische Organisationen die keine Daten in US-Clouds senden können.

70B → 7B: Modellkomprimierung
~50×: Inferenzkosten vs. Frontier
Vision+Audio: Multimodal, vollständig lokal
AI Act: Konformitätskarten integriert
EIC 2026: EIC Accelerator-Bewerber

Forge

Die vertikale Modellschmiede

Nehmen Sie ein 70B-Frontier-Modell und destillieren Sie es zu einem schlanken 7B- oder 4B-Domänenspezialisten, der das Original in Ihrem Zielbereich übertrifft. Weniger Rechenaufwand, mehr Präzision, volle EU-Souveränität.

Structural pruning — irrelevante Kapazität entfernen, ohne von Grund auf neu zu trainieren
Knowledge distillation — Domänenexpertise in ein kleineres Modell übertragen
Quantization — Throughput auf bestehender Hardware maximieren
Identity fine-tuning — individuelle Persona, Brand Voice und Anweisungen
GGUF-Export — läuft sofort auf Engine, kein zusätzliches Tooling erforderlich

Dokumentation lesen →Benötigen Sie ein maßgeschneidertes vertikales Modell? Kontaktieren Sie uns →

Basismodell auswählen

Beliebiges Apache 2.0-Frontier-Modell (70B, 32B…)

Ihren Sektor definieren

Recht, Medizin, Finanzen, Technik…

Forge-Pipeline starten

Prune → Distill → Quantize → Fine-tune

Exportieren & bereitstellen

GGUF-Ausgabe, läuft sofort auf Engine

Hub

Europäisches Modellregister

Vorspezializierte vertikale Modelle für regulierte europäische Branchen, vollständig innerhalb der EU gehostet. Jedes Modell wird mit einer AI Act-Konformitätskarte geliefert.

Erstes Vertikale — Datensatz bereitQ3 2026

Legal IT

Vertragsanalyse, GDPR-Bewertung, EU-Regulierungskonformität — italienische Rechtsordnung

✓Trainiert auf kuratierter italienischer Rechtsprechung, Zivilgesetzbuch und EU-Regulierungskorpus
✓7B Parameter — AI Act-Konformitätskarte für Hochrisiko-KI inklusive
✓Destilliert aus einem 70B-Frontier-Open-Weight-Modell

Medizin

Klinische Dokumentation, ICD-Kodierung, Unterstützung bei der Patiententriagle

Ab 2026 verfügbar

Finanzen

Risikobewertung, KYC-Automatisierung, MiFID II-Konformitätsberichterstattung

Ab 2026 verfügbar

Benötigen Sie ein Vertikale, das wir noch nicht haben?

Wir entwickeln maßgeschneiderte Spezialmodelle für Ihren regulierten Sektor.

Kontaktieren Sie uns →

Alle Hub-Modelle verwenden ausschließlich Gewichte unter Apache 2.0 Lizenz — White-Label-Souveränität für europäische Unternehmen. Vollständige Roadmap ansehen →

Engine

Die Laufzeitumgebung, die alles beschleunigt

Ein produktionsreifer Inferenz-Server in Rust — direkter Ollama-Ersatz mit OpenAI-kompatibler API. Engine betreibt jedes vertikale EULLM-Modell mit 259 Tok/s ohne jegliche Telemetrie außerhalb der EU. API auf dem Ollama-Standardport (11434), integrierte Chat-Oberfläche auf 11435 — keine Konflikte.

Multimodal (Vision + Audio) — Bild-OCR, Szenenbeschreibung, Audiotranskription, vollständig lokal auf Consumer-GPUs
Continuous batching — 259 Tok/s bei 16 gleichzeitigen Anfragen
GPU-Beschleunigung: NVIDIA CUDA (getestet), AMD ROCm, Vulkan, Apple Metal
Quantized KV cache — Q4_0/Q5/Q8 für ~2-4× Kontext auf derselben GPU
Transparentes Web-Browsing (--web) — model-agnostic, funktioniert mit jedem GGUF
Dual-Listener — API auf :11434 (Ollama-Standard), Chat-Oberfläche auf :11435 (~29 KB im Binärformat, kein CDN)
Integriertes Audit-Logging für EU AI Act-Konformität
Standalone-Binärdateien: Linux x64 + Windows x64 getestet · macOS & ARM64 experimentell

Dokumentation lesen →

terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

Blog

Neueste Artikel

Alle ansehen →

13. Juni 2026 · 6 min read

Die USA haben bereits KI-Souveränität. Europa debattiert noch.

Am 12. Juni 2026 wies die US-Regierung Anthropic an, den Zugang zu seinen fortschrittlichsten KI-Modellen für jeden Nicht-Amerikaner auf dem Planeten zu sperren. Ohne Vorankündigung. Ohne Einspruchsmöglichkeit. Ohne Ausnahmen. Wer noch einen Weckruf brauchte, was digitale Souveränität in der Praxis wirklich bedeutet — hier ist er.

Weiterlesen →

1. April 2026 · 4 min read

Open-Source-KI in Europa: Stand der Dinge 2026

Europäische Open-Source-KI hat sich schneller entwickelt als fast jemand vorhergesagt hätte. Von Mistral über Qwen bis hin zu einem wachsenden Ökosystem an Infrastrukturwerkzeugen — der souveräne KI-Stack ist real und wettbewerbsfähig.

Weiterlesen →

15. März 2026 · 3 min read

Der EU AI Act: Was er für Ihre Organisation bedeutet

Der EU AI Act ist die erste umfassende KI-Regulierung der Welt. Hier erfahren Sie, was europäische Unternehmen wissen müssen — und warum der Betrieb eigener LLM-Infrastruktur zunehmend zur Compliance-Pflicht wird.

Weiterlesen →

Souveräne KI beginnt hier

Ihre Daten bleiben in Europa. Ihre Modelle tragen Ihre Marke. Keine API-Abhängigkeiten, kein Vendor Lock-in.

Auf GitHub markieren Blog lesen

7B-Spezialisten, die übertreffen70B-Generalisten

Die vertikale Modellschmiede

Europäisches Modellregister

Legal IT

Die Laufzeitumgebung, die alles beschleunigt

Neueste Artikel

Die USA haben bereits KI-Souveränität. Europa debattiert noch.

Open-Source-KI in Europa: Stand der Dinge 2026

Der EU AI Act: Was er für Ihre Organisation bedeutet

Souveräne KI beginnt hier

7B-Spezialisten, die übertreffen
70B-Generalisten