Agantila

Local AI Starter Kit

Ihre komplette KI-Infrastruktur — self-hosted, in einem Paket. 10 Services, ein Docker Compose Befehl, null Cloud-Abhängigkeiten. Basierend auf dem Open-Source-Projekt von coleam00 (3,7k Stars).

  • 100% self-hosted
  • 0 € Cloud-Kosten
  • DSGVO-konform von Tag 1

Warum ein Local AI Starter Kit?

  1. Cloud-Kosten explodieren

    OpenAI-API-Rechnungen von 200–2.000 €/Monat für Mittelstand und KMU. Jeder Agent-Aufruf kostet Tokens, jeder Prozessablauf produziert Gebühren. Bei steigender Nutzung skalieren die Kosten unkontrollierbar.

  2. Datenschutz wird zum Risiko

    Geschäftsdokumente, Verträge und Kundendaten fließen über Cloud-APIs ins Ausland. DSGVO-Konformität ist schwer nachzuweisen, Vertragsdatenverarbeitungsverträge (AVV) aufwändig. Ein Audit-Risiko.

  3. Komplexe Einrichtung blockiert

    n8n, Ollama, Vektordatenbank, Auth — jeder Service einzeln konfigurieren, Netzwerke verbinden, Versionen kompatibel halten. Wochen an Setup-Zeit, bis der erste Agent produktiv läuft.

Unsere Lösung

Ein vorkonfiguriertes Docker Compose Paket, das alle KI-Services verbindet — Netzwerke, Volumes, Credentials, vordefinierte Workflows. Ein Befehl, und alles läuft.

Ein Befehl, alles läuft

Docker Compose bootet die gesamte KI-Infrastruktur mit einem einzigen Kommando. Kein Cloud-Account, keine API-Keys, keine monatlichen Fixkosten. Läuft auf Ihrem eigenen Server — vollständige Datenhoheit und DSGVO-Konformität von Tag 1.

ChatGPT-Alternative für Ihr Team

Open WebUI als ChatGPT-ähnliche Oberfläche — direkt mit Ihren lokalen LLMs und n8n-Agenten verbunden. Jeder Mitarbeiter hat sofort Zugriff, keine Datenschutzbedenken, keine Token-Kosten. Vordefinierte RAG-Agent-Workflows zum sofortigen Loslegen.

Lokale LLMs ohne Cloud

Ollama läuft die neuesten Open-Source-Modelle direkt auf Ihrer Hardware — NVIDIA, AMD oder CPU. Keine Daten verlassen Ihr Netzwerk. Ideal für vertrauliche Geschäftsdokumente, Verträge und personenbezogene Daten.

Einrichtung in 3 Schritten

Von null lauffähiger KI-Infrastruktur bis zum ersten produktiven Agenten.

Repository klonen

15 Min

Git clone, .env konfigurieren mit individuellen Passwörtern. Setup-Script startet alle Container automatisch.

Services starten

10 Min

Ein Python-Befehl bootet alle 10 Services — n8n, Ollama, Supabase, Open WebUI, Qdrant und mehr. Automatisches GPU-Profiling für NVIDIA, AMD oder CPU.

Ersten Agenten nutzen

30 Min

Vordefinierte RAG-Workflows importieren, Credentials anlegen, Ollama-Modelle laden. ChatGPT-Interface über Open WebUI öffnen — loslegen.

10 integrierte Komponenten

n8n

Low-Code-Automatisierung mit 400+ Integrationen und fortgeschrittenen AI-Knoten. Vordefinierte RAG-Agent-Workflows inklusive.

AGENT 01

Supabase

Open-Source-Datenbank, Auth, Storage und Vector Store — die meistgenutzte Datenbank für KI-Agenten.

Paket 02

Ollama

Cross-Platform LLM-Runtime. Lokale Modelle installieren und betreiben — Llama, Mistral, Qwen und mehr.

Paket 03

Open WebUI

ChatGPT-ähnliche Oberfläche für lokale Modelle und n8n-Agenten. Multi-User, Funktions-Erweiterungen, DSGVO-konform.

Paket 04

Flowise

No/Low-Code AI-Agent-Builder — ergänzt n8n perfekt für visuelle LangChain-Workflow-Erstellung.

Paket 05

Qdrant

Hochperformante Open-Source-Vektordatenbank. Schneller als Postgres-basierte Lösungen für produktive RAG-Pipelines.

Paket 06

Neo4j

Knowledge-Graph-Engine für GraphRAG, LightRAG und Graphiti — komplexe Wissensnetzwerke lokal betreiben.

Paket 07

SearXNG

Private Metasuchmaschine — 229+ Dienste aggregiert, kein Tracking, kein Profiling. Web-Recherche für Agenten.

Paket 08

Caddy

Automatisches HTTPS/TLS für eigene Domains. Reverse Proxy für sichere, produktive Deployments.

Paket 09

Langfuse

Open-Source LLM-Observability. Agent-Entscheidungen nachvollziehbar, Debugging, Compliance-Logging.

Paket 10

Was Unternehmer davon haben

Keine Cloud-Kosten

0 € API-Kosten pro Monat. Lokale LLMs über Ollama, keine Token-Abrechnung. Selbst bei intensiver Nutzung bleiben die Kosten bei Strom und Hardware — planbar und transparent.

AGENT 01

100% Datenhoheit

Alle Daten bleiben auf Ihrem Server. Kein Cloud-Transfer, kein AVV nötig, kein Risiko bei Audits. Verträge, Kundendaten, Finanzdokumente — alles bleibt im Haus.

Paket 02

Setup in unter 1 Stunde

Vorkonfiguriertes Docker Compose mit allen Netzwerken, Volumes und Credentials. Ein Befehl startet alles — inklusive vordefinierter Workflows und ChatGPT-Interface.

Paket 03

Skalierbar wachsen

Starten Sie mit CPU, rüsten Sie auf GPU auf. Von einem Nutzer zum ganzen Team. Vom einfachen Chatbot zum Multi-Agent-Workflow — ohne Architekturwechsel.

Paket 04

Hardware-Anforderungen

Einstieg (CPU)

Ab 300 € Einmalinvestition

Mini-PC oder Server mit 16 GB RAM, 256 GB SSD, beliebige CPU. Ausreichend für kleine Modelle (3–8B Parameter), 1–3 gleichzeitige Nutzer.

AGENT 01

Empfohlen (GPU)

Ab 800 € Einmalinvestition

Server mit NVIDIA GPU (8+ GB VRAM), 32 GB RAM, 512 GB SSD. Flüssig für mittlere Modelle (8–14B), 5–10 gleichzeitige Nutzer, produktive RAG-Pipelines.

Paket 02

Enterprise (Multi-GPU)

Ab 2.000 € Einmalinvestition

Dedizierter Server mit Multi-GPU-Setup, 64+ GB RAM, 1 TB NVMe. Große Modelle (70B+), Teams 10–50 Nutzer, komplexe Multi-Agent-Workflows.

Paket 03

Was uns vom Selbst-Bauen unterscheidet

Getestete Konfiguration

10 Services, vordefinierte Netzwerke, abgestimmte Versionen. Kein Trial-and-Error, keine Inkompatibilitäten — alles funktioniert zusammen out-of-the-box.

Paket 01

Vordefinierte Workflows

RAG-Agent-Workflows zum sofortigen Import. Dokumenten-Chat, E-Mail-Klassifikation, Datenextraktion — nicht bei null anfangen, sondern sofort produktiv.

Paket 02
0
Monatliche Cloud-Kosten
0 Min
Setup-Zeit bis zum ersten Agenten
0 Services
Vorkonfigurierte Komponenten
0 %
Datenhoheit — nichts verlässt Ihr Netzwerk

Bereit für Ihre eigene KI-Infrastruktur?

Local AI Starter Kit anfragen — unverbindlich, kostenlos, Antwort in 24 Stunden. Wir installieren und konfigurieren alles für Sie.