Vollständig lokale, cloud-unabhängige KI-Infrastruktur für strikt lokale, private, experimentelle KI-Experimente. Alle Berechnungen auf Mac Studio M3 Ultra (256 GB unified memory) — kein Cloud-Zugang, keine Daten verlassen den Rechner.
Stand: Juni 2026 · v3.8
| Komponente | Spezifikation |
|---|---|
| Modell | Apple Mac Studio M3 Ultra |
| Unified Memory | 256 GB (LLM + System + Chemie ohne Konflikt) |
| GPU | 80-core (MPS-Beschleunigung für ML-Tools) |
| CPU | 24-core (16 Performance + 8 Efficiency) |
| Betriebssystem | macOS Sequoia |
| Externer SSD | 4 TB OWC Aura Pro IV NVMe via Thunderbolt 5 (TB5-WORK) — hält DeepSeek V4 Flash GGUF (164 GB) und R1-671B (202 GB) |
| Memory Stick | /Volumes/CLAUDE-DATA — Backup, Bridge-Dateien, Session-Logs, Projekt-Persistenz |
RAM-Beschränkung: MAX_LOADED_MODELS=1, NUM_PARALLEL=1 — DSV4 (~164 GB) + qwen3:235b (~142 GB) = 306 GB > 256 GB. Deshalb strikt sequenzieller Betrieb.
| Modell | Größe | Rolle / Routing |
|---|---|---|
| qwen3:235b-a22b | 142 GB MoE | Flagship — komplexe Analyse, Philosophie, Mathematik-Synthese |
| DeepSeek-V4-Flash (DSV4) | ~164 GB MoE | 256K Kontext-Fenster — lange Dokumente, Corpus-Ingestion (Port 8888) |
| deepseek-r1:70b | ~45 GB | Adversarielle Prüfung, Chain-of-Thought, formale Verifikation |
| DeepSeek-R1-0528-671B | 202 GB (UD-IQ2_XXS, 5 Shards) | Hochqualitäts-Reasoning, llama-server 9650 Port 8889 (~23 tok/s) — Flagship für Critic/Comparator in komitee_bewertung; auf TB5-WORK |
| qwen3.6:35b-a3b | ~23 GB MoE | Schnelle All-Purpose, Routing-Interpreter (~47 tok/s) |
| gemma4:26b | ~17 GB | Multimodal, 256K Kontext, MTP-Spekulation (~80 tok/s) |
| mistral-small3.1:24b | ~15 GB | Leichtgewicht, Commit-Messages (Aider weak model) |
| bge-m3:latest | 1,2 GB | Multilinguales Embedding-Modell — primär für RAG, LanceDB-Indexe und Primärtext-Retrieval |
| mxbai-embed-large | 669 MB | Embedding-Modell (Vektordatenbanken) |
| llama-guard3:8b | 4.9 GB | Safety-Klassifikator |
284B MoE, 153 GB GGUF, gemischte Quantisierung (Q4KExperts/F16HC), auf TB5-WORK. Eigener llama-server 9650 auf Port 8888 — 256K Kontext, 99 GPU-Lagen. Automatisch via Router für sehr lange Eingaben (>400-Token-Komplexitätsschwelle) gestartet.
Zusätzlich zu Ollama ist MLX-LM 0.31.3 (Apple MLX-Bibliothek) installiert. OLLAMA_BACKEND=mlx ist dauerhaft in ~/.zshrc gesetzt — ca. 26–30 % Geschwindigkeitsgewinn bei langen Prompts durch Apple-Silicon-optimierte Kernel. Verwendbar auch direkt via mlx_lm.generate oder mlx_lm.server.
FastAPI-Middleware auf Port 11435 (~/llm_router/llm_proxy.py). Jede Anfrage von Open WebUI und allen anderen Clients läuft ausschließlich über diesen Proxy.
Zweistufiges Routing: Stufe 1 — regelbasierter Dispatcher (Domain-Keywords, Token-Länge, <1 ms). Stufe 2 (ambig) — L1-Reformulator (kleineres LLM klassifiziert Absicht).
Anti-Halluzinations-Protokoll: P4-Struktur in allen epistemischen Prompts. Synthegy-Evaluator: Jede Antwort durch separates Evaluator-LLM (Genauigkeit 1–5, Fundierung 1–5).
| Quelle | Zweck | Timeout |
|---|---|---|
| SearXNG (Port 8080) | Web-Suche, multilingual | 18s |
| Wikipedia | DE + EN + FR + RU | 20s |
| CORE (Open Access) | Wissenschaftliche Paper | 18s |
| OpenAlex | Akademische Literatur | 18s |
| Open Library | Bücher | 12s |
| arXiv | Mathematik/Physik-Preprints | 25s |
Spezialbefehle: /ensemble, /kreativ, /navigator, /destilliere, /speichere, /journal.
| Tool | Version | Verwendung |
|---|---|---|
| Lean 4 + Mathlib | 4.31.0-rc2 | Formale Verifikation; PR #39701 (kondensierte Moduln) · CI Build ✅ Lint ✅ |
| SageMath | 10.9 (ARM64) | Algebraische Geometrie, Berechnungen |
| PARI/GP | 2.17.3 | Zahlentheorie, Fundamentaleinheiten, Iwasawa |
| Julia 1.12.6 + Hecke.jl | 0.39.15 | Algebraische Zahlentheorie (ITensorNetworks 0.21.2, Nemo 0.54.2) |
| Macaulay2 | 1.26.05 | Kommutative Algebra, Gröbner-Basen |
| Kenzo (SBCL) | 7.0 (Common Lisp) | Effektive Homotopieberechnungen (K(Z/2,n)) |
| Lean 4 lean-liquid | aktuell | Formalisiertes LTE-Fundament (liquid Tensor) |
| Z3 Prover | 4.16.0 | SMT-Solving, formale Verifikation |
| Singular | 4.4.1 | Algebraische Geometrie, Normalen |
| Agda 2.8.0 / Rocq | aktuell | Typentheoretische Formalisierung |
| SpheriCo.jl | 0.1.0 (Julia) | Numerische Relativität: sphär. symmetrischer Skalarfeld-Kollaps (Choptuik-Projekt) |
| NRPy+ | 2.1.1 (conda nr_env) | Symbolische GR-Codegenerierung; Jupyter-Kernel registriert |
| SFcollapse1D | arm64-Binary | Skalarfeld-Kollaps in C++ (GCC 15.2.0, -O2 -fopenmp) |
| msolve | 0.10.0 | Polynomiales Gleichungssystem-Löser — Gröbner-Basen über ℤ/pℤ (LIP6, algebraische Geometrie) |
Open-WebUI-Tool für iterative Lean 4-Beweisverifikation (Ralph Loop, arXiv:2605.22763). Implementierungsgrundlage: Li et al. "Compile to Compress" (ICML 2026).
-- ERROR:-Kommentar. Li et al. Table 10: +3 % auf MiniF2F.lake env lean): Neuer Schritt VOR dem Ralph Loop: _praeval_lean_env() führt lake env lean MathProject/Test.lean aus. Strukturell unfixierbare Fehler (unknown package, file not found, parse error) → sofortiger Abbruch, spart max_runden × lake-build-Iterationen. Runde-1-Ergebnis wiederverwendet (kein Doppel-Build). Neue _FEHLER_UNFIXIERBAR-Muster: unknown package, file not found, unknown import.lean_iterativ(aufgabe_oder_sketch, modell='deepseek-r1:70b', max_runden=8, frische_versuche=0, locked_regions=True)
Basierend auf Sakka, Mizukami & Mitarai, "An LLM System for Autonomous Variational Quantum Circuit Design" (arXiv, Osaka, Juni 2026): Drei neue bzw. substantiell erweiterte Tools implementieren die Kernarchitektur des Papers (Exploration → Discussion → Review-Memory).
Drei-Rollen-Kritikzyklus statt generischem SCORE: X/10:
expertenrollen_domaene: mathematik (Arithmetischer Geometer · Homotopie-Theoretiker · Lean-4-Logiker · Falsifizierer), physik, philosophie, allgemein.R1-671B optional als Critic/Comparator-Backend (Port 8889). Ablationsstudien-Nachweis: Discussion > Self-Reflection (Sakka et al. Fig. 6).
discussion_verwenden · expertenrollen_domaene · searxng_url · r1_671b_url
Sakka et al. Ablation (Fig. 6): Exploration stabilisiert Optimierungstrajektorie unabhängig von Startqualität. Ohne: Korrelation = -0,57. Mit: +0,003 (stabil). SearXNG-Recherche → n_seeds=8 diverse Ideen → n_final=3 ausgewählt → danach komitee_bewertung.
Kausalkette: hypothese_neu → experiment_starten → ergebnis_erfassen → kritik_hinzufuegen → revision_erstellen. Speichert nicht nur WAS, sondern WARUM etwas funktionierte/scheiterte. Schema: 5 Knoten-Constraints (Hypothese, FExperiment, FErgebnis, FKritik, FRevision). Projekte: ArithGaugeTheory, Anima-IV, FloerCondensed.
Implementiert das Context-State-Schema aus Xie et al., Quest: Training Frontier Deep Research Agents with Fully Synthetic Tasks (arXiv:2605.24218, Mai 2026). Komprimiert lange Konversationsverläufe in ein strukturiertes JSON mit drei Buckets: trusted (verifizierte Fakten mit Quellenangabe), untrusted (widerlegte Claims), uncertain (offene Punkte mit explizitem need-Feld als konkrete Handlungsanweisung). Bestehende States werden gemergt, nie überschrieben.
Router-Proxy (Port 11435, OpenAI-kompatibel) mit Fallback auf Ollama direkt (Port 11434)
Erweitert komitee_bewertung um hierarchische Rubrik-Bäume nach QUEST (Xie et al., arXiv:2605.24218, Abschnitt 2.1). Jeder Knoten trägt eine critical-Markierung (kritisches Versagen nullt den Elternknoten) und eine aggregation_strategy (sequential oder parallel). Blattknoten-Bewertung erfolgt als ein einzelner Batch-Aufruf statt n Einzelaufrufen — alle Kriterien eines Proposals werden in einem LLM-Call bewertet, danach rekursiv durch den Baum aggregiert.
qwen3:235b-a22b für Rubrik-Generierung und Proposals, qwen3.6:35b-a3b für Blattknoten-Batch-Evaluierung
Installiert in Miniforge3-Umgebung chem_env (Python 3.12). Vollständig isoliert von unified_env, kein Konflikt mit LLM-Stack.
| Tool | Version | Domäne | Status |
|---|---|---|---|
| PySCF | 2.13.1 | Quantenchemie: HF/DFT/CCSD | ✓ Getestet |
| MACE-OFF23 | 0.3.16 | ML-Kraftfeld organische Moleküle | ✓ MPS-GPU |
| ASE | 3.28.0 | Molekülstruktur-Framework | ✓ |
| OpenMM | 8.4 | Molekulardynamik (OpenCL/GPU) | ✓ OpenCL |
| NEURON | 9.0.1 | Kompartiment-Neuronenmodelle, HH | ✓ |
| Brian2 | 2.10.1 | Spiking Neural Networks | ✓ |
| Nengo | 4.1.0 | Neural Engineering Framework | ✓ NEF |
| MNE | 1.12.1 | EEG/MEG-Signalanalyse | ✓ |
| RDKit | 2026.03.3 | Cheminformatik, SMILES-Parsing | ✓ |
| MDAnalysis | 2.10.0 | MD-Trajektorienanalyse | ✓ |
| NetworkX | 3.6.1 | Graphentheorie, Konnektomics | ✓ |
| nilearn/nibabel/dipy | aktuell | Neuroimaging, fMRI | ✓ |
| PyMOL (OS) | aktuell | Molekülvisualisierung | ✓ |
| Tellurium | 2.2.13 | Systembiologie, SBML | ✓ |
Verifikationstest PySCF: Hartree-Fock auf HF-Molekül, Ergebnis: E_HF = -99.987397 Hartree.
Physik-Stack für Quantenmechanik, Allgemeine Relativitätstheorie und Numerische Relativität. Ergänzt den Chemie/Bio-Stack durch spezialisierte GR-Werkzeuge (Cadabra2, EinsteinPy) und den Julia/NRPy+-Stack für numerischen Gravitationskollaps.
| Werkzeug | Version | Einsatzbereich |
|---|---|---|
| QuTiP | 5.2.3 | Quantenmechanik — Qubits, Lindblad-Evolution, offene Quantensysteme, Dekohärenz (Python 3.12) |
| Cadabra2 | 2.5.14 (headless) | Tensor-Kalkül für ART — symbolische Indexmanipulation, Riemann-/Ricci-Tensor, Einstein-Gleichungen; aus Quellcode gebaut (Python 3.14) |
| EinsteinPy | 0.4.0 | Allgemeine Relativitätstheorie — Geodäten, Schwarzschild/Kerr-Raumzeiten, Christoffel-Symbole (chem_env) |
| Julia DifferentialEquations | 8.0.0 | ODE/DDE/SDE-Ökosystem — Kerr-Geodäten, Post-Newton-Inspirale, N-Körper (OrdinaryDiffEq 7.0.0) |
| NeuralPDE.jl / DiffEqFlux.jl | on-demand | Physics-Informed Neural Networks für PDEs; kann mit Pkg.add aktiviert werden |
Open-WebUI-Werkzeuge: physik_simulation (Julia+QuTiP), qutip_simulation (Lindblad-Meister-Gleichung), physik_simulation_generieren (LLM→Code→Ausführung).
✓ Cadabra2 Tensor-Test: Ex('R^{a}_{b c d}') → Riemann-Tensor korrekt. EinsteinPy: Geodäten-Import OK.
| Dienst | Port | Funktion |
|---|---|---|
| LLM-Router-Proxy | 11435 | Zentrale Middleware, Routing, Synthegy |
| Ollama | 11434 | Modell-Backend (9 Modelle) |
| DSV4 llama-server 9650 | 8888 | DeepSeek V4 Flash, 256K Kontext |
| R1-671B llama-server | 8889 | DeepSeek-R1-0528-671B, Hochqualitäts-Reasoning (~23 tok/s) |
| Open WebUI 0.9.6 | 3002 | Chat-Interface, 28 Python-Tools |
| Perplexica | 3000 | Lokale Suche |
| SearXNG | 8080 | Meta-Suchmaschine |
| Neo4j 2026.05.0 | 7687 | Knowledge Graph + Forschungsgraph (Slow Memory) |
| PostgreSQL 15.18 | 5432 | Daten-Backend (Homebrew LaunchAgent) |
| ComfyUI (SDXL) | 8188 | Bildgenerierung on-device (SDXL Base 1.0; FLUX.1-dev entfernt) |
| Draw Things | 1.20260520 | Weitere Bildgenerierung on-device (SDXL); vollständig lokal |
| Lean 4 Verifier | Lokal | lake build für Mathlib-PRs |
| Master-Orchestrator | LaunchAgent | 21 Projekte, 100 Phasen automatisch |
| Werkzeug | Version | Funktion |
|---|---|---|
| Git | 2.50.1 (Apple Git-155) | Versionskontrolle — Mathlib-Fork, alle Projekte |
| GitHub CLI (gh) | 2.94.0 | GitHub-Integration, PR-Management, API-Zugriff |
| uv | 0.11.21 | Schneller Python-Paketmanager (Homebrew) |
| Node.js | 26.3.0 (via nvm 0.40.5) | Frontend-Build, Perplexica, diverse Tools |
| Aider | — | KI-Coding-Assistent (qwen3.6:35b-a3b als Backend, CONVENTIONS.md in 9 Projekten) |
Vektordatenbanken (LanceDB): plotinus_multilingual (78.674 Chunks), latin_passages, cardano_hybrid, philarchive, OSE-Wiki, Macrobius — BGE-M3-Embeddings, multilingual.
Neo4j (Port 7687, Bolt): persistentes Wissensgraph-System als "Slow Memory". Labels: Person, MathConcept, Project, Text, Argument. Synthegy-Scores und Evaluationsergebnisse persistiert. Zusätzlich: Forschungsgraph-Schema (Hypothese · FExperiment · FErgebnis · FKritik · FRevision) für kausales Review-Memory nach Sakka et al. 2026.