EULLM
Legal IT — primer vertical · conjunto de datos casi completo · Q3 2026

Especialistas de 7B que superan a
los generalistas de 70B

en su sector regulado, sobre su infraestructura EU.

EuLLM destila y verticaliza modelos open-weight en especialistas compactos de 7B para los ámbitos jurídico, médico y técnico — alojados en la UE, fichas de conformidad AI Act incluidas.

Diseñado para equipos jurídicos, responsables de cumplimiento, instituciones médicas y organizaciones técnicas que no pueden enviar datos a nubes estadounidenses.

70B → 7B
Compresión del modelo
~50×
Coste de inferencia vs. frontier
Visión+Audio
Multimodal, completamente local
AI Act
Fichas de conformidad integradas
EIC 2026
Candidato EIC Accelerator
Forge

La forja de modelos verticales

Tome un modelo frontier de 70B y destílelo en un especialista de 7B o 4B en su dominio — más preciso que el original en su sector objetivo. Menos cómputo, mayor precisión, plena soberanía EU.

  • Structural pruning — eliminación de capacidad irrelevante sin reentrenar desde cero
  • Knowledge distillation — transferencia de experiencia sectorial a un modelo más pequeño
  • Quantization — maximice el throughput en su hardware existente
  • Identity fine-tuning — personalidad a medida, brand voice e instrucciones
  • Exportación GGUF — funciona al instante en Engine, sin herramientas adicionales
1

Seleccionar modelo base

Cualquier modelo frontier Apache 2.0 (70B, 32B…)

2

Definir su sector

Jurídico, médico, finanzas, técnico…

3

Ejecutar la pipeline Forge

Prune → Distill → Quantize → Fine-tune

4

Exportar y desplegar

Salida GGUF, funciona al instante en Engine

Hub

Registro europeo de modelos

Modelos verticales preespecializados para sectores europeos regulados, alojados íntegramente en la UE. Cada modelo incluye una ficha de conformidad AI Act.

Primer vertical — conjunto de datos listoQ3 2026

Legal IT

Análisis de contratos, evaluación GDPR, cumplimiento regulatorio UE — jurisdicción italiana

  • Entrenado sobre jurisprudencia italiana seleccionada, código civil y corpus normativo UE
  • 7B parámetros — ficha de conformidad AI Act de alto riesgo incluida
  • Destilado desde un modelo frontier open-weight de 70B
Medicina

Documentación clínica, codificación ICD, apoyo al triaje de pacientes

Disponible próximamente en 2026
Finanzas

Evaluación de riesgos, automatización KYC, reporting de cumplimiento MiFID II

Disponible próximamente en 2026

¿Necesita un vertical que aún no tenemos?

Desarrollamos modelos especialistas a medida para su sector regulado.

Contáctenos →

Todos los modelos Hub utilizan exclusivamente pesos con licencia Apache 2.0 — soberanía white-label para empresas europeas. Ver la hoja de ruta completa →

Engine

El motor que lo hace todo más rápido

Un servidor de inferencia listo para producción escrito en Rust — reemplazo drop-in de Ollama con API OpenAI-compatible. Engine impulsa cada modelo vertical EULLM a 259 tok/s sin ninguna telemetría fuera de la UE. API en el puerto estándar de Ollama (11434), interfaz de chat integrada en 11435 — sin conflictos.

  • Multimodal (visión + audio) — OCR de imágenes, descripción de escenas, transcripción de audio, completamente local en GPUs de consumo
  • Continuous batching — 259 tok/s con 16 solicitudes simultáneas
  • Aceleración GPU: NVIDIA CUDA (probado), AMD ROCm, Vulkan, Apple Metal
  • Quantized KV cache — Q4_0/Q5/Q8 para ~2-4× de contexto en la misma GPU
  • Navegación web transparente (--web) — model-agnostic, funciona con cualquier GGUF
  • Dual-listener — API en :11434 (estándar Ollama), interfaz de chat en :11435 (~29 KB en el binario, cero CDN)
  • Audit logging integrado para cumplimiento EU AI Act
  • Binarios standalone: Linux x64 + Windows x64 probados · macOS & ARM64 experimental
terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

La IA soberana empieza aquí

Sus datos permanecen en Europa. Sus modelos llevan su marca. Sin dependencias de API, sin vendor lock-in.