
Especialistas 7B que superam
generalistas 70B
no seu setor regulado, na sua infraestrutura na UE.
A EuLLM destila e verticaliza modelos open-weight em especialistas compactos de 7B para os domínios jurídico, médico e técnico — alojados na UE, com cartões de conformidade com o EU AI Act incluídos.
Construído para equipas jurídicas, responsáveis de conformidade, instituições médicas and organizações de engenharia que não podem enviar dados para clouds americanas.
- 70B → 7B
- Compressão de modelos
- ~50×
- Menor custo de inferência vs. frontier
- Vision+Audio
- Multimodal, totalmente local
- AI Act
- Cartões de conformidade integrados
- EIC 2026
- Candidato a acelerador
A fundição vertical de modelos
Pegue num modelo frontier de 70B e destile-o num especialista de domínio compacto de 7B ou 4B que supera o original na sua área-alvo. Menos computação, mais precisão, soberania plena na UE.
- Poda estrutural — remova capacidade irrelevante sem treinar do zero
- Destilação de conhecimento — transfira experiência de domínio para um modelo mais pequeno
- Quantização — maximize o débito no hardware existente
- Ajuste fino de identidade — persona personalizada, voz de marca e instruções
- Exportação GGUF — corre imediatamente no Engine, sem ferramentas adicionais
Selecionar modelo base
Qualquer modelo frontier Apache 2.0 (70B, 32B…)
Definir o seu setor
Jurídico, médico, financeiro, técnico…
Executar o pipeline Forge
Podar → Destilar → Quantizar → Ajustar
Exportar e implementar
Saída GGUF, corre imediatamente no Engine
Registo de modelos baseado na UE
Modelos verticais pré-especializados para setores europeus regulados, alojados inteiramente dentro da UE. Cada modelo inclui um cartão de conformidade com o EU AI Act.
Legal IT
Análise de contratos, avaliação GDPR, conformidade regulatória da UE — jurisdição italiana
- ✓Treinado em jurisprudência italiana selecionada, código civil e corpus regulatório da UE
- ✓7B parâmetros — cartão de conformidade de alto risco do EU AI Act incluído
- ✓Destilado a partir de um modelo frontier open-weight de 70B
Documentação clínica, codificação ICD, apoio à triagem de doentes
Avaliação de risco, automatização KYC, relatórios de conformidade MiFID II
Precisa de um vertical que ainda não temos?
Desenvolvemos modelos especialistas personalizados para o seu setor regulado.
Todos os modelos Hub utilizam exclusivamente pesos licenciados ao abrigo da Apache 2.0 — soberania white-label para empresas europeias. Ver roadmap completo →
O runtime que torna tudo rápido
Um servidor de inferência pronto para produção construído em Rust — substituto direto do Ollama com uma API compatível com OpenAI. O Engine alimenta cada modelo vertical EULLM a 259 tok/s com zero telemetria fora da UE. API na porta padrão do Ollama (11434), interface de chat incorporada na 11435 — sem conflitos.
- Multimodal (vision + audio) — OCR de imagens, descrição de cenas, transcrição de áudio, totalmente local em GPUs de consumo
- Batching contínuo — 259 tok/s com 16 pedidos simultâneos
- Aceleração GPU: NVIDIA CUDA (testado), AMD ROCm, Vulkan, Apple Metal
- Cache KV quantizada — Q4_0/Q5/Q8 para ~2-4× mais contexto na mesma GPU
- Navegação web transparente (--web) — agnóstico ao modelo, funciona com qualquer GGUF
- Duplo listener — API em :11434 (padrão Ollama), interface de chat em :11435 (~29 KB no binário, sem CDN)
- Registo de auditoria integrado para conformidade com o EU AI Act
- Binários autónomos: Linux x64 + Windows x64 testados · macOS & ARM64 experimental
# Download Engine (Linux x64)
curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm
chmod +x eullm
# Run a model
./eullm run ./model.gguf --batch-size 16
# OpenAI-compatible API on :11434
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'
Artigos mais recentes
13 de junho de 2026 · 7 min read
Os EUA Já Têm Soberania em IA. A Europa Ainda Está a Debatê-la.
A 12 de junho de 2026, o governo dos EUA ordenou à Anthropic que cortasse o acesso aos seus modelos de IA mais avançados para todos os não-americanos do planeta. Sem aviso. Sem recurso. Sem exceções. Se precisava de um alerta sobre o que a soberania digital realmente significa na prática, aqui está.
Ler mais →
1 de abril de 2026 · 5 min read
IA Open-Source na Europa: O Estado da Arte em 2026
A IA open-source europeia amadureceu mais depressa do que quase alguém previu. De Mistral a Qwen e a um ecossistema crescente de ferramentas de infraestrutura, a pilha de IA soberana é real — e é competitiva.
Ler mais →
15 de março de 2026 · 4 min read
O EU AI Act: O Que Significa para a Sua Organização
O EU AI Act é o primeiro regulamento abrangente sobre IA do mundo. Eis o que as empresas europeias precisam de saber — e porque é que gerir a sua própria infraestrutura LLM se está a tornar uma necessidade de conformidade.
Ler mais →
A IA soberana começa aqui
Os seus dados ficam na Europa. Os seus modelos têm a sua marca. Sem dependências de API, sem aprisionamento a fornecedores.