Budujemy publicznie · Faza 1 w toku

Roadmap

Status każdego komponentu EULLM w czasie rzeczywistym, kamienie milowe, które osiągamy, oraz pełna historia każdego wydania.

Status komponentów

Przegląd platformy

Gotowy do produkcji

EULLM Engine

v0.6.2

Środowisko uruchomieniowe wnioskowania w Rust. Multimodalne vision + audio, zamiennik Ollama z API kompatybilnym z OpenAI i wbudowanym interfejsem czatu na localhost:11435.

Postęp88%

259 tok/s

Przepustowość

Vision+Audio

Multimodalne

✓ testowane

Windows

W trakcie tworzenia

EULLM Forge

Pipeline wertykalizacji modeli. Komponenty gotowe, integracja CLI end-to-end w toku.

Postęp42%

30B→7B

Redukcja rozmiaru

GGUF

Eksport

Beta

Pipeline

Podgląd

EULLM Hub

Rejestr modeli hostowany w UE z kartami zgodności z EU AI Act. Działa jako prototyp.

Postęp25%

Prototyp

Modele

3 planowane

Sektory

Tylko UE

Hosting

Możliwości Engine — v0.6.2

Środowisko uruchomieniowe Rust · ciągłe wsadowanie · multimodalne vision + audio · w pełni lokalnie na GPU konsumenckich

259 tok/s

Przepustowość

16 równoczesnych żądań

Vision+Audio

Multimodalne

OCR, sceny, transkrypcja

~2-4×

Kwantyzowane KV

kontekst, Q4_0/Q5/Q8

--web

Przeglądanie sieci

niezależne od modelu, dowolny GGUF

Fazy rozwoju

Co budujemy

01Bieżąca

Faza 01Fundament

Q1 2026

Podstawowy silnik wnioskowania osiąga jakość produkcyjną. Komponenty pipeline Forge zbudowane. Hub działa jako prototyp.

11/13 elementów85%
  • Engine: samodzielne binaria (Linux x64, Windows x64)
  • Multimodalne vision + audio (Gemma 4)
  • Ciągłe wsadowanie — 259 tok/s
  • Kwantyzowana pamięć podręczna KV — Q4_0/Q5/Q8 (~2-4× kontekstu)
  • API kompatybilne z OpenAI + drop-in Ollama
  • GPU: CUDA (testowane), ROCm, Vulkan, Metal
  • Wbudowane rejestrowanie audytowe EU AI Act
  • Przezroczyste przeglądanie sieci (--web, niezależne od modelu)
  • Interaktywny REPL: /temp, /maxtokens, /system
  • Wbudowany interfejs czatu — localhost:11435, ~29 KB w binarce
  • Forge: strukturalne przycinanie + destylacja wiedzy
  • Forge end-to-end pipeline CLI
  • Model demonstracyjny: legal-it-7b
02Planowana

Faza 02Ekosystem

Q2 2026

Pierwsze gotowe do produkcji modele Hub wchodzą do użycia. Stabilne CLI Forge. Rozszerzone wsparcie platformy.

1/8 elementów13%
  • Hub: model dla sektora prawnego (prawo UE/włoskie)
  • Hub: model wsparcia triage medycznego
  • Hub: model zgodności Finance & KYC
  • Karty zgodności EU AI Act dla wszystkich modeli Hub
  • Forge: stabilne CLI + pełna dokumentacja
  • Wsparcie Windows x64
  • Wnioskowanie na wielu GPU
  • Kreator kwantyzacji dla sprzętu konsumenckiego
03Przyszłość

Faza 03Enterprise

H2 2026

Hartowanie klasy enterprise: rozproszone wnioskowanie, kontrola dostępu, wizualny interfejs Forge Studio.

0/7 elementów0%
  • Rozproszone wnioskowanie wielowęzłowe
  • Operator Kubernetes
  • Kontrola dostępu SSO / RBAC
  • Forge Studio — wizualny interfejs dostrajania
  • Wersjonowanie modeli i przywracanie poprzednich wersji w Hub
  • Certyfikowane partnerstwa z europejskimi centrami danych
  • Poziomy wsparcia SLA
Changelog

Historia wydań

v0.6.2Najnowsze9 Jun 2026
  • Multimodal in the Chat UI — drop in an image or audio clip, fully local
  • Vision + audio understanding stable (Gemma 4): OCR, scene description, transcription
  • BOS token handling fix for multimodal prompts
v0.6.07 Jun 2026
  • Multimodal vision launched — image OCR and scene description on consumer GPUs
  • Audio understanding (experimental, CLI) — transcription and in-content search
  • Runs fully local, zero telemetry
v0.5.206 Jun 2026
  • Math expression rendering in the Chat UI
  • Quantized KV cache — Q4_0/Q5/Q8 for ~2-4× context on the same GPU
v0.5.331 May 2026
  • Embedded chat UI on localhost:11435 — ~29 KB in binary, zero CDN or external dependencies
  • eullm -V now shows the active backend variant
  • Standalone Windows binaries: CPU and CUDA
v0.4.427 May 2026
  • Web tool calling — transparent URL fetching in conversation
  • Legal-IT dataset preparation module
  • GPU layer fitting improvements
v0.4.38 Apr 2026
  • Drop-in Ollama replacement with continuous batching
  • Quantized KV cache for larger context on 16 GB GPUs
  • Transparent web browsing without function-call overhead
  • EU AI Act audit logging built-in
v0.3.136 Apr 2026
  • Interactive REPL: /temp, /maxtokens, /system commands
  • Quantized KV cache quality/accuracy automatic recommendations
v0.3.105 Apr 2026
  • Quantized KV cache math accuracy improvements
  • 1% accuracy loss isolated to matrix operations only
v0.3.53 Apr 2026
  • Default context window increased to 2 048 tokens
  • Math accuracy benchmarking suite added
v0.3.31 Apr 2026
  • Mixed KV cache type support
v0.3.230 Mar 2026
  • Bug fixes
  • Documentation updates
v0.2.9829 Mar 2026
  • Batch scheduler refinements
  • Build pipeline stabilization

Kształtuj roadmap

Otwórz zgłoszenie, głosuj na funkcje lub wnieś wkład w kod. EULLM jest budowane publicznie i każdy głos się liczy.