
Especialistas de 7B que superan a
los generalistas de 70B
en su sector regulado, sobre su infraestructura EU.
EuLLM destila y verticaliza modelos open-weight en especialistas compactos de 7B para los ámbitos jurídico, médico y técnico — alojados en la UE, fichas de conformidad AI Act incluidas.
Diseñado para equipos jurídicos, responsables de cumplimiento, instituciones médicas y organizaciones técnicas que no pueden enviar datos a nubes estadounidenses.
- 70B → 7B
- Compresión del modelo
- ~50×
- Coste de inferencia vs. frontier
- Visión+Audio
- Multimodal, completamente local
- AI Act
- Fichas de conformidad integradas
- EIC 2026
- Candidato EIC Accelerator
La forja de modelos verticales
Tome un modelo frontier de 70B y destílelo en un especialista de 7B o 4B en su dominio — más preciso que el original en su sector objetivo. Menos cómputo, mayor precisión, plena soberanía EU.
- Structural pruning — eliminación de capacidad irrelevante sin reentrenar desde cero
- Knowledge distillation — transferencia de experiencia sectorial a un modelo más pequeño
- Quantization — maximice el throughput en su hardware existente
- Identity fine-tuning — personalidad a medida, brand voice e instrucciones
- Exportación GGUF — funciona al instante en Engine, sin herramientas adicionales
Seleccionar modelo base
Cualquier modelo frontier Apache 2.0 (70B, 32B…)
Definir su sector
Jurídico, médico, finanzas, técnico…
Ejecutar la pipeline Forge
Prune → Distill → Quantize → Fine-tune
Exportar y desplegar
Salida GGUF, funciona al instante en Engine
Registro europeo de modelos
Modelos verticales preespecializados para sectores europeos regulados, alojados íntegramente en la UE. Cada modelo incluye una ficha de conformidad AI Act.
Legal IT
Análisis de contratos, evaluación GDPR, cumplimiento regulatorio UE — jurisdicción italiana
- ✓Entrenado sobre jurisprudencia italiana seleccionada, código civil y corpus normativo UE
- ✓7B parámetros — ficha de conformidad AI Act de alto riesgo incluida
- ✓Destilado desde un modelo frontier open-weight de 70B
Documentación clínica, codificación ICD, apoyo al triaje de pacientes
Evaluación de riesgos, automatización KYC, reporting de cumplimiento MiFID II
¿Necesita un vertical que aún no tenemos?
Desarrollamos modelos especialistas a medida para su sector regulado.
Todos los modelos Hub utilizan exclusivamente pesos con licencia Apache 2.0 — soberanía white-label para empresas europeas. Ver la hoja de ruta completa →
El motor que lo hace todo más rápido
Un servidor de inferencia listo para producción escrito en Rust — reemplazo drop-in de Ollama con API OpenAI-compatible. Engine impulsa cada modelo vertical EULLM a 259 tok/s sin ninguna telemetría fuera de la UE. API en el puerto estándar de Ollama (11434), interfaz de chat integrada en 11435 — sin conflictos.
- Multimodal (visión + audio) — OCR de imágenes, descripción de escenas, transcripción de audio, completamente local en GPUs de consumo
- Continuous batching — 259 tok/s con 16 solicitudes simultáneas
- Aceleración GPU: NVIDIA CUDA (probado), AMD ROCm, Vulkan, Apple Metal
- Quantized KV cache — Q4_0/Q5/Q8 para ~2-4× de contexto en la misma GPU
- Navegación web transparente (--web) — model-agnostic, funciona con cualquier GGUF
- Dual-listener — API en :11434 (estándar Ollama), interfaz de chat en :11435 (~29 KB en el binario, cero CDN)
- Audit logging integrado para cumplimiento EU AI Act
- Binarios standalone: Linux x64 + Windows x64 probados · macOS & ARM64 experimental
# Download Engine (Linux x64)
curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm
chmod +x eullm
# Run a model
./eullm run ./model.gguf --batch-size 16
# OpenAI-compatible API on :11434
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'
Últimos artículos
13 de junio de 2026 · 7 min read
Estados Unidos ya tiene soberanía en IA. Europa sigue debatiéndolo.
El 12 de junio de 2026, el gobierno estadounidense ordenó a Anthropic cortar el acceso a sus modelos de IA más avanzados para cualquier persona no estadounidense en el planeta. Sin previo aviso. Sin recurso posible. Sin excepciones. Si necesitaba una llamada de atención sobre lo que significa realmente la soberanía digital en la práctica, aquí está.
Leer más →
1 de abril de 2026 · 5 min read
IA de código abierto en Europa: El estado de la cuestión en 2026
La IA open source europea ha madurado más rápido de lo que casi nadie predijo. De Mistral a Qwen, pasando por un ecosistema creciente de herramientas de infraestructura, el stack de IA soberana es real — y es competitivo.
Leer más →
15 de marzo de 2026 · 4 min read
La EU AI Act: Lo que significa para su organización
La EU AI Act es la primera regulación integral de inteligencia artificial del mundo. Esto es lo que las empresas europeas necesitan saber — y por qué disponer de infraestructura LLM propia se está convirtiendo en un imperativo de cumplimiento normativo.
Leer más →
La IA soberana empieza aquí
Sus datos permanecen en Europa. Sus modelos llevan su marca. Sin dependencias de API, sin vendor lock-in.