Local AI Starter Kit
Ihre komplette KI-Infrastruktur — self-hosted, in einem Paket. 10 Services, ein Docker Compose Befehl, null Cloud-Abhängigkeiten. Basierend auf dem Open-Source-Projekt von coleam00 (3,7k Stars).
- 100% self-hosted
- 0 € Cloud-Kosten
- DSGVO-konform von Tag 1
Warum ein Local AI Starter Kit?
Cloud-Kosten explodieren
OpenAI-API-Rechnungen von 200–2.000 €/Monat für Mittelstand und KMU. Jeder Agent-Aufruf kostet Tokens, jeder Prozessablauf produziert Gebühren. Bei steigender Nutzung skalieren die Kosten unkontrollierbar.
Datenschutz wird zum Risiko
Geschäftsdokumente, Verträge und Kundendaten fließen über Cloud-APIs ins Ausland. DSGVO-Konformität ist schwer nachzuweisen, Vertragsdatenverarbeitungsverträge (AVV) aufwändig. Ein Audit-Risiko.
Komplexe Einrichtung blockiert
n8n, Ollama, Vektordatenbank, Auth — jeder Service einzeln konfigurieren, Netzwerke verbinden, Versionen kompatibel halten. Wochen an Setup-Zeit, bis der erste Agent produktiv läuft.
Unsere Lösung
Ein vorkonfiguriertes Docker Compose Paket, das alle KI-Services verbindet — Netzwerke, Volumes, Credentials, vordefinierte Workflows. Ein Befehl, und alles läuft.
Ein Befehl, alles läuft
Docker Compose bootet die gesamte KI-Infrastruktur mit einem einzigen Kommando. Kein Cloud-Account, keine API-Keys, keine monatlichen Fixkosten. Läuft auf Ihrem eigenen Server — vollständige Datenhoheit und DSGVO-Konformität von Tag 1.
ChatGPT-Alternative für Ihr Team
Open WebUI als ChatGPT-ähnliche Oberfläche — direkt mit Ihren lokalen LLMs und n8n-Agenten verbunden. Jeder Mitarbeiter hat sofort Zugriff, keine Datenschutzbedenken, keine Token-Kosten. Vordefinierte RAG-Agent-Workflows zum sofortigen Loslegen.
Lokale LLMs ohne Cloud
Ollama läuft die neuesten Open-Source-Modelle direkt auf Ihrer Hardware — NVIDIA, AMD oder CPU. Keine Daten verlassen Ihr Netzwerk. Ideal für vertrauliche Geschäftsdokumente, Verträge und personenbezogene Daten.
Docker Compose bootet die gesamte KI-Infrastruktur mit einem einzigen Kommando. Kein Cloud-Account, keine API-Keys, keine monatlichen Fixkosten. Läuft auf Ihrem eigenen Server — vollständige Datenhoheit und DSGVO-Konformität von Tag 1.
Einrichtung in 3 Schritten
Von null lauffähiger KI-Infrastruktur bis zum ersten produktiven Agenten.
Repository klonen
15 MinGit clone, .env konfigurieren mit individuellen Passwörtern. Setup-Script startet alle Container automatisch.
Services starten
10 MinEin Python-Befehl bootet alle 10 Services — n8n, Ollama, Supabase, Open WebUI, Qdrant und mehr. Automatisches GPU-Profiling für NVIDIA, AMD oder CPU.
Ersten Agenten nutzen
30 MinVordefinierte RAG-Workflows importieren, Credentials anlegen, Ollama-Modelle laden. ChatGPT-Interface über Open WebUI öffnen — loslegen.
10 integrierte Komponenten
n8n
Low-Code-Automatisierung mit 400+ Integrationen und fortgeschrittenen AI-Knoten. Vordefinierte RAG-Agent-Workflows inklusive.
Supabase
Open-Source-Datenbank, Auth, Storage und Vector Store — die meistgenutzte Datenbank für KI-Agenten.
Ollama
Cross-Platform LLM-Runtime. Lokale Modelle installieren und betreiben — Llama, Mistral, Qwen und mehr.
Open WebUI
ChatGPT-ähnliche Oberfläche für lokale Modelle und n8n-Agenten. Multi-User, Funktions-Erweiterungen, DSGVO-konform.
Flowise
No/Low-Code AI-Agent-Builder — ergänzt n8n perfekt für visuelle LangChain-Workflow-Erstellung.
Qdrant
Hochperformante Open-Source-Vektordatenbank. Schneller als Postgres-basierte Lösungen für produktive RAG-Pipelines.
Neo4j
Knowledge-Graph-Engine für GraphRAG, LightRAG und Graphiti — komplexe Wissensnetzwerke lokal betreiben.
SearXNG
Private Metasuchmaschine — 229+ Dienste aggregiert, kein Tracking, kein Profiling. Web-Recherche für Agenten.
Caddy
Automatisches HTTPS/TLS für eigene Domains. Reverse Proxy für sichere, produktive Deployments.
Langfuse
Open-Source LLM-Observability. Agent-Entscheidungen nachvollziehbar, Debugging, Compliance-Logging.
Was Unternehmer davon haben
Keine Cloud-Kosten
0 € API-Kosten pro Monat. Lokale LLMs über Ollama, keine Token-Abrechnung. Selbst bei intensiver Nutzung bleiben die Kosten bei Strom und Hardware — planbar und transparent.
100% Datenhoheit
Alle Daten bleiben auf Ihrem Server. Kein Cloud-Transfer, kein AVV nötig, kein Risiko bei Audits. Verträge, Kundendaten, Finanzdokumente — alles bleibt im Haus.
Setup in unter 1 Stunde
Vorkonfiguriertes Docker Compose mit allen Netzwerken, Volumes und Credentials. Ein Befehl startet alles — inklusive vordefinierter Workflows und ChatGPT-Interface.
Skalierbar wachsen
Starten Sie mit CPU, rüsten Sie auf GPU auf. Von einem Nutzer zum ganzen Team. Vom einfachen Chatbot zum Multi-Agent-Workflow — ohne Architekturwechsel.
Hardware-Anforderungen
Einstieg (CPU)
Ab 300 € Einmalinvestition
Mini-PC oder Server mit 16 GB RAM, 256 GB SSD, beliebige CPU. Ausreichend für kleine Modelle (3–8B Parameter), 1–3 gleichzeitige Nutzer.
Empfohlen (GPU)
Ab 800 € Einmalinvestition
Server mit NVIDIA GPU (8+ GB VRAM), 32 GB RAM, 512 GB SSD. Flüssig für mittlere Modelle (8–14B), 5–10 gleichzeitige Nutzer, produktive RAG-Pipelines.
Enterprise (Multi-GPU)
Ab 2.000 € Einmalinvestition
Dedizierter Server mit Multi-GPU-Setup, 64+ GB RAM, 1 TB NVMe. Große Modelle (70B+), Teams 10–50 Nutzer, komplexe Multi-Agent-Workflows.
Was uns vom Selbst-Bauen unterscheidet
Getestete Konfiguration
10 Services, vordefinierte Netzwerke, abgestimmte Versionen. Kein Trial-and-Error, keine Inkompatibilitäten — alles funktioniert zusammen out-of-the-box.
Vordefinierte Workflows
RAG-Agent-Workflows zum sofortigen Import. Dokumenten-Chat, E-Mail-Klassifikation, Datenextraktion — nicht bei null anfangen, sondern sofort produktiv.
Bereit für Ihre eigene KI-Infrastruktur?
Local AI Starter Kit anfragen — unverbindlich, kostenlos, Antwort in 24 Stunden. Wir installieren und konfigurieren alles für Sie.