EULLM
Legal IT — primeiro vertical · conjunto de dados quase completo · Q3 2026

Especialistas 7B que superam
generalistas 70B

no seu setor regulado, na sua infraestrutura na UE.

A EuLLM destila e verticaliza modelos open-weight em especialistas compactos de 7B para os domínios jurídico, médico e técnico — alojados na UE, com cartões de conformidade com o EU AI Act incluídos.

Construído para equipas jurídicas, responsáveis de conformidade, instituições médicas and organizações de engenharia que não podem enviar dados para clouds americanas.

70B → 7B
Compressão de modelos
~50×
Menor custo de inferência vs. frontier
Vision+Audio
Multimodal, totalmente local
AI Act
Cartões de conformidade integrados
EIC 2026
Candidato a acelerador
Forge

A fundição vertical de modelos

Pegue num modelo frontier de 70B e destile-o num especialista de domínio compacto de 7B ou 4B que supera o original na sua área-alvo. Menos computação, mais precisão, soberania plena na UE.

  • Poda estrutural — remova capacidade irrelevante sem treinar do zero
  • Destilação de conhecimento — transfira experiência de domínio para um modelo mais pequeno
  • Quantização — maximize o débito no hardware existente
  • Ajuste fino de identidade — persona personalizada, voz de marca e instruções
  • Exportação GGUF — corre imediatamente no Engine, sem ferramentas adicionais
1

Selecionar modelo base

Qualquer modelo frontier Apache 2.0 (70B, 32B…)

2

Definir o seu setor

Jurídico, médico, financeiro, técnico…

3

Executar o pipeline Forge

Podar → Destilar → Quantizar → Ajustar

4

Exportar e implementar

Saída GGUF, corre imediatamente no Engine

Hub

Registo de modelos baseado na UE

Modelos verticais pré-especializados para setores europeus regulados, alojados inteiramente dentro da UE. Cada modelo inclui um cartão de conformidade com o EU AI Act.

Primeiro vertical — conjunto de dados prontoQ3 2026

Legal IT

Análise de contratos, avaliação GDPR, conformidade regulatória da UE — jurisdição italiana

  • Treinado em jurisprudência italiana selecionada, código civil e corpus regulatório da UE
  • 7B parâmetros — cartão de conformidade de alto risco do EU AI Act incluído
  • Destilado a partir de um modelo frontier open-weight de 70B
Médico

Documentação clínica, codificação ICD, apoio à triagem de doentes

Disponível mais tarde em 2026
Finanças

Avaliação de risco, automatização KYC, relatórios de conformidade MiFID II

Disponível mais tarde em 2026

Precisa de um vertical que ainda não temos?

Desenvolvemos modelos especialistas personalizados para o seu setor regulado.

Fale connosco →

Todos os modelos Hub utilizam exclusivamente pesos licenciados ao abrigo da Apache 2.0 — soberania white-label para empresas europeias. Ver roadmap completo →

Engine

O runtime que torna tudo rápido

Um servidor de inferência pronto para produção construído em Rust — substituto direto do Ollama com uma API compatível com OpenAI. O Engine alimenta cada modelo vertical EULLM a 259 tok/s com zero telemetria fora da UE. API na porta padrão do Ollama (11434), interface de chat incorporada na 11435 — sem conflitos.

  • Multimodal (vision + audio) — OCR de imagens, descrição de cenas, transcrição de áudio, totalmente local em GPUs de consumo
  • Batching contínuo — 259 tok/s com 16 pedidos simultâneos
  • Aceleração GPU: NVIDIA CUDA (testado), AMD ROCm, Vulkan, Apple Metal
  • Cache KV quantizada — Q4_0/Q5/Q8 para ~2-4× mais contexto na mesma GPU
  • Navegação web transparente (--web) — agnóstico ao modelo, funciona com qualquer GGUF
  • Duplo listener — API em :11434 (padrão Ollama), interface de chat em :11435 (~29 KB no binário, sem CDN)
  • Registo de auditoria integrado para conformidade com o EU AI Act
  • Binários autónomos: Linux x64 + Windows x64 testados · macOS & ARM64 experimental
terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

A IA soberana começa aqui

Os seus dados ficam na Europa. Os seus modelos têm a sua marca. Sem dependências de API, sem aprisionamento a fornecedores.