EULLM
Legal IT — premier vertical · dataset presque complet · Q3 2026

Des spécialistes 7B qui surpassent
les généralistes 70B

dans votre secteur réglementé, sur votre infrastructure EU.

EuLLM distille et verticalise des modèles open-weight en spécialistes 7B compacts pour les domaines juridique, médical et technique — hébergés dans l'UE, fiches de conformité AI Act incluses.

Conçu pour les équipes juridiques, les responsables conformité, les institutions médicales et les organisations techniques qui ne peuvent pas envoyer leurs données vers les clouds américains.

70B → 7B
Compression du modèle
~50×
Coût d'inférence vs frontier
Vision+Audio
Multimodal, entièrement local
AI Act
Fiches de conformité intégrées
EIC 2026
Candidat EIC Accelerator
Forge

La forge de modèles verticaux

Prenez un modèle frontier 70B et distillez-le en un spécialiste 7B ou 4B dans votre domaine — plus précis que l'original dans votre secteur cible. Moins de calcul, plus de précision, pleine souveraineté EU.

  • Structural pruning — suppression de la capacité non pertinente sans réentraîner depuis zéro
  • Knowledge distillation — transfert de l'expertise sectorielle dans un modèle plus petit
  • Quantization — maximisez le throughput sur votre matériel existant
  • Identity fine-tuning — persona personnalisée, brand voice et instructions
  • Export GGUF — fonctionne instantanément sur Engine, sans outillage supplémentaire
1

Choisir le modèle de base

N'importe quel modèle frontier Apache 2.0 (70B, 32B…)

2

Définir votre secteur

Juridique, médical, finance, technique…

3

Lancer la pipeline Forge

Prune → Distill → Quantize → Fine-tune

4

Exporter et déployer

Sortie GGUF, fonctionne instantanément sur Engine

Hub

Registre de modèles européen

Modèles verticaux pré-spécialisés pour les secteurs européens réglementés, hébergés entièrement dans l'UE. Chaque modèle est livré avec une fiche de conformité AI Act.

Premier vertical — dataset prêtQ3 2026

Legal IT

Analyse contractuelle, évaluation GDPR, conformité réglementaire UE — juridiction italienne

  • Entraîné sur la jurisprudence italienne sélectionnée, le code civil et le corpus réglementaire UE
  • 7B paramètres — fiche de conformité AI Act haut risque incluse
  • Distillé depuis un modèle frontier open-weight 70B
Médecine

Documentation clinique, codage ICD, aide au triage patient

À venir en 2026
Finance

Évaluation des risques, automatisation KYC, reporting de conformité MiFID II

À venir en 2026

Besoin d'un vertical que nous n'avons pas encore ?

Nous construisons des modèles spécialistes sur mesure pour votre secteur réglementé.

Contactez-nous →

Tous les modèles Hub utilisent exclusivement des poids sous licence Apache 2.0 — souveraineté white-label pour les entreprises européennes. Voir la feuille de route complète →

Engine

Le moteur qui rend tout ultra-rapide

Un serveur d'inférence prêt pour la production, écrit en Rust — remplacement drop-in d'Ollama avec une API OpenAI-compatible. Engine alimente chaque modèle vertical EULLM à 259 tok/s sans aucune télémétrie hors UE. API sur le port standard d'Ollama (11434), interface de chat intégrée sur 11435 — aucune collision.

  • Multimodal (vision + audio) — OCR d'images, description de scènes, transcription audio, entièrement local sur GPU grand public
  • Continuous batching — 259 tok/s avec 16 requêtes simultanées
  • Accélération GPU : NVIDIA CUDA (testé), AMD ROCm, Vulkan, Apple Metal
  • Quantized KV cache — Q4_0/Q5/Q8 pour ~2-4× de contexte sur le même GPU
  • Navigation web transparente (--web) — model-agnostic, fonctionne avec n'importe quel GGUF
  • Dual-listener — API sur :11434 (standard Ollama), interface de chat sur :11435 (~29 Ko dans le binaire, zéro CDN)
  • Audit logging intégré pour la conformité EU AI Act
  • Binaires standalone : Linux x64 + Windows x64 testés · macOS & ARM64 expérimental
terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

La souveraineté IA commence ici

Vos données restent en Europe. Vos modèles portent votre marque. Aucune dépendance aux API, aucun vendor lock-in.