Budujemy publicznie · Faza 1 w toku

Roadmap

Status każdego komponentu EULLM w czasie rzeczywistym, kamienie milowe, które osiągamy, oraz pełna historia każdego wydania.

GitHub Releases Zobacz źródło

Status komponentów

Przegląd platformy

Gotowy do produkcji

EULLM Engine

v0.6.2

Środowisko uruchomieniowe wnioskowania w Rust. Multimodalne vision + audio, zamiennik Ollama z API kompatybilnym z OpenAI i wbudowanym interfejsem czatu na localhost:11435.

Postęp88%

259 tok/s

Przepustowość

Vision+Audio

Multimodalne

✓ testowane

Windows

W trakcie tworzenia

EULLM Forge

Pipeline wertykalizacji modeli. Komponenty gotowe, integracja CLI end-to-end w toku.

Postęp42%

30B→7B

Redukcja rozmiaru

GGUF

Eksport

Beta

Pipeline

Podgląd

EULLM Hub

Rejestr modeli hostowany w UE z kartami zgodności z EU AI Act. Działa jako prototyp.

Postęp25%

Prototyp

Modele

3 planowane

Sektory

Tylko UE

Hosting

Możliwości Engine — v0.6.2

Środowisko uruchomieniowe Rust · ciągłe wsadowanie · multimodalne vision + audio · w pełni lokalnie na GPU konsumenckich

259 tok/s

Przepustowość

16 równoczesnych żądań

Vision+Audio

Multimodalne

OCR, sceny, transkrypcja

~2-4×

Kwantyzowane KV

kontekst, Q4_0/Q5/Q8

--web

Przeglądanie sieci

niezależne od modelu, dowolny GGUF

Fazy rozwoju

Co budujemy

01Bieżąca

Faza 01 — Fundament

Q1 2026

Podstawowy silnik wnioskowania osiąga jakość produkcyjną. Komponenty pipeline Forge zbudowane. Hub działa jako prototyp.

11/13 elementów85%

Engine: samodzielne binaria (Linux x64, Windows x64)
Multimodalne vision + audio (Gemma 4)
Ciągłe wsadowanie — 259 tok/s
Kwantyzowana pamięć podręczna KV — Q4_0/Q5/Q8 (~2-4× kontekstu)
API kompatybilne z OpenAI + drop-in Ollama
GPU: CUDA (testowane), ROCm, Vulkan, Metal
Wbudowane rejestrowanie audytowe EU AI Act
Przezroczyste przeglądanie sieci (--web, niezależne od modelu)
Interaktywny REPL: /temp, /maxtokens, /system
Wbudowany interfejs czatu — localhost:11435, ~29 KB w binarce
Forge: strukturalne przycinanie + destylacja wiedzy
Forge end-to-end pipeline CLI
Model demonstracyjny: legal-it-7b

02Planowana

Faza 02 — Ekosystem

Q2 2026

Pierwsze gotowe do produkcji modele Hub wchodzą do użycia. Stabilne CLI Forge. Rozszerzone wsparcie platformy.

1/8 elementów13%

Hub: model dla sektora prawnego (prawo UE/włoskie)
Hub: model wsparcia triage medycznego
Hub: model zgodności Finance & KYC
Karty zgodności EU AI Act dla wszystkich modeli Hub
Forge: stabilne CLI + pełna dokumentacja
Wsparcie Windows x64
Wnioskowanie na wielu GPU
Kreator kwantyzacji dla sprzętu konsumenckiego

03Przyszłość

Faza 03 — Enterprise

H2 2026

Hartowanie klasy enterprise: rozproszone wnioskowanie, kontrola dostępu, wizualny interfejs Forge Studio.

0/7 elementów0%

Rozproszone wnioskowanie wielowęzłowe
Operator Kubernetes
Kontrola dostępu SSO / RBAC
Forge Studio — wizualny interfejs dostrajania
Wersjonowanie modeli i przywracanie poprzednich wersji w Hub
Certyfikowane partnerstwa z europejskimi centrami danych
Poziomy wsparcia SLA

Changelog

Historia wydań

v0.6.2Najnowsze9 Jun 2026

Multimodal in the Chat UI — drop in an image or audio clip, fully local
Vision + audio understanding stable (Gemma 4): OCR, scene description, transcription
BOS token handling fix for multimodal prompts

v0.6.07 Jun 2026

Multimodal vision launched — image OCR and scene description on consumer GPUs
Audio understanding (experimental, CLI) — transcription and in-content search
Runs fully local, zero telemetry

v0.5.206 Jun 2026

Math expression rendering in the Chat UI
Quantized KV cache — Q4_0/Q5/Q8 for ~2-4× context on the same GPU

v0.5.331 May 2026

Embedded chat UI on localhost:11435 — ~29 KB in binary, zero CDN or external dependencies
eullm -V now shows the active backend variant
Standalone Windows binaries: CPU and CUDA

v0.4.427 May 2026

Web tool calling — transparent URL fetching in conversation
Legal-IT dataset preparation module
GPU layer fitting improvements

v0.4.38 Apr 2026

Drop-in Ollama replacement with continuous batching
Quantized KV cache for larger context on 16 GB GPUs
Transparent web browsing without function-call overhead
EU AI Act audit logging built-in

v0.3.136 Apr 2026

Interactive REPL: /temp, /maxtokens, /system commands
Quantized KV cache quality/accuracy automatic recommendations

v0.3.105 Apr 2026

Quantized KV cache math accuracy improvements
1% accuracy loss isolated to matrix operations only

v0.3.53 Apr 2026

Default context window increased to 2 048 tokens
Math accuracy benchmarking suite added

v0.3.31 Apr 2026

Mixed KV cache type support

v0.3.230 Mar 2026

Bug fixes
Documentation updates

v0.2.9829 Mar 2026

Batch scheduler refinements
Build pipeline stabilization

Zobacz wszystkie wydania na GitHub →

Kształtuj roadmap

Otwórz zgłoszenie, głosuj na funkcje lub wnieś wkład w kod. EULLM jest budowane publicznie i każdy głos się liczy.

Otwórz zgłoszenie Dołącz do dyskusji