Legal IT — primeiro vertical · conjunto de dados quase completo · Q3 2026

Especialistas 7B que superam
generalistas 70B

no seu setor regulado, na sua infraestrutura na UE.

A EuLLM destila e verticaliza modelos open-weight em especialistas compactos de 7B para os domínios jurídico, médico e técnico — alojados na UE, com cartões de conformidade com o EU AI Act incluídos.

Começar no GitHub Explorar a Foundry

Construído para equipas jurídicas, responsáveis de conformidade, instituições médicas and organizações de engenharia que não podem enviar dados para clouds americanas.

70B → 7B: Compressão de modelos
~50×: Menor custo de inferência vs. frontier
Vision+Audio: Multimodal, totalmente local
AI Act: Cartões de conformidade integrados
EIC 2026: Candidato a acelerador

Forge

A fundição vertical de modelos

Pegue num modelo frontier de 70B e destile-o num especialista de domínio compacto de 7B ou 4B que supera o original na sua área-alvo. Menos computação, mais precisão, soberania plena na UE.

Poda estrutural — remova capacidade irrelevante sem treinar do zero
Destilação de conhecimento — transfira experiência de domínio para um modelo mais pequeno
Quantização — maximize o débito no hardware existente
Ajuste fino de identidade — persona personalizada, voz de marca e instruções
Exportação GGUF — corre imediatamente no Engine, sem ferramentas adicionais

Ler a documentação →Precisa de um modelo vertical personalizado? Fale connosco →

Selecionar modelo base

Qualquer modelo frontier Apache 2.0 (70B, 32B…)

Definir o seu setor

Jurídico, médico, financeiro, técnico…

Executar o pipeline Forge

Podar → Destilar → Quantizar → Ajustar

Exportar e implementar

Saída GGUF, corre imediatamente no Engine

Hub

Registo de modelos baseado na UE

Modelos verticais pré-especializados para setores europeus regulados, alojados inteiramente dentro da UE. Cada modelo inclui um cartão de conformidade com o EU AI Act.

Primeiro vertical — conjunto de dados prontoQ3 2026

Legal IT

Análise de contratos, avaliação GDPR, conformidade regulatória da UE — jurisdição italiana

✓Treinado em jurisprudência italiana selecionada, código civil e corpus regulatório da UE
✓7B parâmetros — cartão de conformidade de alto risco do EU AI Act incluído
✓Destilado a partir de um modelo frontier open-weight de 70B

Médico

Documentação clínica, codificação ICD, apoio à triagem de doentes

Disponível mais tarde em 2026

Finanças

Avaliação de risco, automatização KYC, relatórios de conformidade MiFID II

Disponível mais tarde em 2026

Precisa de um vertical que ainda não temos?

Desenvolvemos modelos especialistas personalizados para o seu setor regulado.

Fale connosco →

Todos os modelos Hub utilizam exclusivamente pesos licenciados ao abrigo da Apache 2.0 — soberania white-label para empresas europeias. Ver roadmap completo →

Engine

O runtime que torna tudo rápido

Um servidor de inferência pronto para produção construído em Rust — substituto direto do Ollama com uma API compatível com OpenAI. O Engine alimenta cada modelo vertical EULLM a 259 tok/s com zero telemetria fora da UE. API na porta padrão do Ollama (11434), interface de chat incorporada na 11435 — sem conflitos.

Multimodal (vision + audio) — OCR de imagens, descrição de cenas, transcrição de áudio, totalmente local em GPUs de consumo
Batching contínuo — 259 tok/s com 16 pedidos simultâneos
Aceleração GPU: NVIDIA CUDA (testado), AMD ROCm, Vulkan, Apple Metal
Cache KV quantizada — Q4_0/Q5/Q8 para ~2-4× mais contexto na mesma GPU
Navegação web transparente (--web) — agnóstico ao modelo, funciona com qualquer GGUF
Duplo listener — API em :11434 (padrão Ollama), interface de chat em :11435 (~29 KB no binário, sem CDN)
Registo de auditoria integrado para conformidade com o EU AI Act
Binários autónomos: Linux x64 + Windows x64 testados · macOS & ARM64 experimental

Ler a documentação →

terminal

# Download Engine (Linux x64)

curl -L https://github.com/eullm/eullm/releases/latest/download/eullm-linux-x64 -o eullm

chmod +x eullm

# Run a model

./eullm run ./model.gguf --batch-size 16

# OpenAI-compatible API on :11434

curl http://localhost:11434/v1/chat/completions \

-H "Content-Type: application/json" \

-d '{"model":"qwen3","messages":[{"role":"user","content":"Ciao!"}]}'

Blog

Artigos mais recentes

Ver todos →

13 de junho de 2026 · 7 min read

Os EUA Já Têm Soberania em IA. A Europa Ainda Está a Debatê-la.

A 12 de junho de 2026, o governo dos EUA ordenou à Anthropic que cortasse o acesso aos seus modelos de IA mais avançados para todos os não-americanos do planeta. Sem aviso. Sem recurso. Sem exceções. Se precisava de um alerta sobre o que a soberania digital realmente significa na prática, aqui está.

Ler mais →

1 de abril de 2026 · 5 min read

IA Open-Source na Europa: O Estado da Arte em 2026

A IA open-source europeia amadureceu mais depressa do que quase alguém previu. De Mistral a Qwen e a um ecossistema crescente de ferramentas de infraestrutura, a pilha de IA soberana é real — e é competitiva.

Ler mais →

15 de março de 2026 · 4 min read

O EU AI Act: O Que Significa para a Sua Organização

O EU AI Act é o primeiro regulamento abrangente sobre IA do mundo. Eis o que as empresas europeias precisam de saber — e porque é que gerir a sua própria infraestrutura LLM se está a tornar uma necessidade de conformidade.

Ler mais →

A IA soberana começa aqui

Os seus dados ficam na Europa. Os seus modelos têm a sua marca. Sem dependências de API, sem aprisionamento a fornecedores.

Dar estrela no GitHub Ler o blog

Especialistas 7B que superamgeneralistas 70B

A fundição vertical de modelos

Registo de modelos baseado na UE

Legal IT

O runtime que torna tudo rápido

Artigos mais recentes

Os EUA Já Têm Soberania em IA. A Europa Ainda Está a Debatê-la.

IA Open-Source na Europa: O Estado da Arte em 2026

O EU AI Act: O Que Significa para a Sua Organização

A IA soberana começa aqui

Especialistas 7B que superam
generalistas 70B