What is Perplexica and how does it differ from Perplexity?

Perplexica is a self-hosted, open-source AI search engine you run locally or on a server, while Perplexity is a hosted service. With Perplexica, you choose providers and models, control privacy, and can use local LLMs via Ollama for zero per‑query cost.

How do I install Perplexica with Docker?

Clone the official repo, configure your `.env` with API keys and LLM settings, then run `docker compose up -d`. The web UI will be available at the configured port; see the GitHub readme for exact steps and updates.

Can Perplexica use local models like Llama 3 via Ollama?

Yes. Install Ollama, pull a model (e.g., `ollama pull llama3`), and point Perplexica’s LLM base URL to the Ollama endpoint. This enables private, local inference with no API usage fees.

Which search providers work with Perplexica?

Perplexica supports multiple providers such as Brave, Serper/SerpAPI, Bing, Tavily, and Google CSE, depending on your build. Add the corresponding API keys in your `.env` and select a default provider.

How can I improve answer quality in Perplexica?

Be specific with prompts (ask for citations, comparisons, constraints), choose a strong model, and enable more than one search provider for coverage. You can also limit scope to recent years and request structured outputs like tables or bullet points.

So verwenden Sie Perplexica: Eine vollständige, schnörkellose Anleitung für 2025

Wenn Sie schon länger ein Auge auf KI-Antworten im Perplexity-Stil geworfen haben, aber die volle Kontrolle wünschen, ist Perplexica der Open-Source-Weg – selbst gehostet, datenschutzfreundlich und überraschend leistungsfähig. In dieser Anleitung erklären wir, was Perplexica ist, wie man es installiert, wie man Provider und Modelle konfiguriert und wie man es tatsächlich täglich für Recherche, Programmierung und Content Discovery einsetzt.

Um die Dinge praktisch und lösungsorientiert zu halten, verwenden wir eine fragengesteuerte Struktur mit schnellen Schritten, Beispielbefehlen und Tipps zur Fehlerbehebung.

Übrigens: Perplexica wird aktiv entwickelt und typischerweise mit Docker bereitgestellt. Die offizielle GitHub-Readme skizziert den schnellsten Weg: Installieren Sie Docker, klonen Sie das Repo und führen Sie es über Docker Compose aus. Für einen Community-Überblick und Self-Hosting-Erkenntnisse, siehe diese Anleitung zum Ausführen von Perplexica mit Ollama. Es gibt auch einen aktiven Self-Hosting-Thread, der One-Command-Setup und vorgefertigte Images diskutiert.

Was ist Perplexica?

Perplexica ist eine selbst gehostete, KI-gestützte Suchmaschine, die Websuche mit großen Sprachmodellen kombiniert, um prägnante, quellengebundene Antworten zu liefern. Stellen Sie sich vor: Sie stellen eine komplexe Frage, die Suchmaschine durchsucht das Web, liest mehrere Quellen und synthetisiert eine klare Antwort mit Zitaten. Es ist als offene Alternative zu Tools im Perplexity-Stil positioniert, aber Sie führen es lokal oder auf Ihrem eigenen Server aus, um Transparenz und Kontrolle zu gewährleisten.

Kernideen:

Lokale oder selbst gehostete Kontrolle mit Docker

Verwendet Ihre bevorzugten Such-/Datenprovider (z. B. Brave, SerpAPI, Google CSE – konfigurierbar)

Funktioniert mit lokalen oder Remote-LLMs (z. B. über Ollama oder API-basierte Modelle)

Web-UI für natürliche Abfragen sowie fokussierte „Modi“ wie Web/Scholar/YouTube je nach Konfiguration

Für wen ist Perplexica geeignet?

Forscher, die zitierte, Multi-Source-Zusammenfassungen wünschen

Ingenieure, die lokale LLMs mit Web-Retrieval bevorzugen

Teams, die Datenschutz und Kostenkontrolle benötigen

Power-User, die Tools im Perplexity-Stil durch etwas Selbstgehostetes ersetzen

Schnellstart: Der schnellste Weg, Perplexica auszuführen

Hier ist der typische Ablauf basierend auf dem offiziellen Repository:

Voraussetzungen

Docker und Docker Compose installiert

Git installiert

Optional: Ollama installiert, wenn Sie lokale Modelle verwenden möchten (z. B. llama3, mistral, qwen)

Klonen Sie das Repository

git clone
cd Perplexica

Konfigurieren Sie Umgebungsvariablen

Kopieren Sie die Beispielumgebungsdatei, falls vorhanden (z. B. .env.example → .env).

Fügen Sie alle Such-/API-Schlüssel hinzu (Brave, Serper, Tavily, Bing, Google CSE usw.).

Konfigurieren Sie den LLM-Provider: lokaler Ollama-Endpunkt oder API (OpenAI/kompatibel) je nach Setup.

Starten Sie mit Docker Compose

docker compose up -d

Dies startet die notwendigen Dienste. Nach einer Minute sollte die Web-UI über den ausgegebenen Localhost-Port (üblicherweise ` oder wie in der Repo-Dokumentation angegeben) erreichbar sein.

Optional: Laden Sie ein lokales Modell über Ollama

# Installieren Sie Ollama (siehe ollama.com für Ihr Betriebssystem)
ollama pull llama3
# oder ein anderes unterstütztes Modell

Verweisen Sie die LLM-Konfiguration von Perplexica auf Ihren Ollama-Endpunkt (oft von Docker unter macOS/Windows oder unter Linux). Die Self-Hosting-Anleitung erklärt diese Paarung.

First-Run-Tour: Verwenden der Perplexica Web-UI

Sobald die UI gestartet ist, sehen Sie ein Suchfeld ähnlich wie bei modernen KI-Suchmaschinen.

Stellen Sie eine Frage in natürlicher Sprache: „Was sind die neuesten Benchmarks für Vektor-Datenbanken im Jahr 2025?“

Wählen Sie einen Fokus/Modus, falls verfügbar: Web, Akademisch/Scholar, YouTube oder einen allgemeineren Recherchemodus – Ihr Build und Ihre Provider bestimmen, welche angezeigt werden.

Drücken Sie die Eingabetaste. Perplexica wird Quellen abrufen, diese lesen und eine Zusammenfassung mit Zitaten entwerfen.

Erweitern Sie die Zitate, um Quellen zu inspizieren und die Glaubwürdigkeit zu bestätigen.

Tipps:

Verwenden Sie spezifische Prompts: Fügen Sie Einschränkungen wie „vergleiche Ansätze“, „liste Vor- und Nachteile auf“ oder „gib eine 200-Wort-Zusammenfassung mit 3 wichtigen Punkten“ hinzu.

Für Programmierthemen fragen Sie nach schrittweisen Snippets und verlinken Sie zurück zu den Originaldokumenten.

Für Videos (wenn der YouTube-Modus aktiviert ist) fragen Sie nach „fasse das neueste Tutorial dieses Kanals zu X zusammen“.

So konfigurieren Sie Suchprovider und API-Schlüssel

Perplexica ist auf einen oder mehrere Web-/Suchprovider angewiesen. Gängige Optionen sind Brave Search, Serper/SerpAPI (Google-ähnliche Ergebnisse), Bing Web Search, Tavily und Google Custom Search Engine (CSE). Sie geben API-Schlüssel in Ihrer .env-Datei an.

Typische Variablen, die Sie in .env sehen könnten:

BRAVE_API_KEY oder SERPER_API_KEY (oder SERPAPI_KEY)

BING_API_KEY

TAVILY_API_KEY

GOOGLE_CSE_ID und GOOGLE_CSE_API_KEY

OLLAMA_BASE_URL (für lokale Modelle)

OPENAI_API_KEY oder OPENAI_COMPATIBLE_BASE_URL für Cloud-Modelle

Stellen Sie nur das ein, was Sie benötigen. Viele Benutzer beginnen mit einem einzelnen Provider (z. B. Brave oder Tavily) und einem einzelnen LLM (Ollama oder einem OpenAI-kompatiblen Endpunkt) und erweitern dann.

Auswahl und Optimierung Ihres Modells

Sie können Perplexica ausführen mit:

Lokalen Modellen über Ollama: Datenschutzfreundlich und kostenlos pro Abfrage; Geschwindigkeit/Qualität hängt von Ihrer GPU/CPU und Modellgröße ab.

Cloud-Modellen über API: In der Regel schneller und stärker für komplexe Aufgaben, verursachen aber Nutzungskosten.

Empfehlungen:

Leichte Hardware: mistral:7b oder llama3:8b über Ollama für allgemeine Fragen und Antworten.

Mittlere/hohe Hardware: llama3:70b oder qwen2-Varianten, wenn Sie eine stärkere Argumentation benötigen.

API-gestützt: Erwägen Sie OpenAI-kompatible Modelle für die umfangreichsten Rechercheabfragen.

Verweisen Sie in den Einstellungen von Perplexica oder in .env das Standardmodell auf Ihr ausgewähltes LLM. Wenn Ihr Build mehrere Modelle unterstützt, können Sie pro Sitzung wechseln.

Smart Prompting für bessere Antworten

Verwenden Sie diese Muster, um die Ausgabe zu verbessern:

Evidenzanfrage: „Zitiere 3–5 seriöse Quellen mit Links. Fasse Übereinstimmungen und Meinungsverschiedenheiten zusammen.“

Strukturierte Ausgabe: „Gib eine 5-Punkte-Zusammenfassung gefolgt von einer Vergleichstabelle zurück.“

Einschränkungen: „Halte es unter 150 Wörtern. Füge dann eine 3-Punkte-Checkliste hinzu.“

Scope-Kontrolle: „Konzentriere dich nur auf die Entwicklungen von 2024–2025 und überspringe Paywall-Quellen.“

Beispiel-Workflows

Competitive Scan

Prompt: „Vergleiche Notion vs. Obsidian für Forschungsteams. Stelle Vor-/Nachteile, Preise und Updates für 2025 mit Zitaten bereit.“

Ergebnis: Eine prägnante Übersicht über Kompromisse mit Links zu Primärquellen.

Developer How‑To

Prompt: „Wie füge ich OpenTelemetry-Tracing in eine FastAPI-App hinzu? Füge Code-Snippets hinzu und verlinke zu offiziellen Dokumenten.“

Ergebnis: Schritt-für-Schritt-Code plus offizielle Referenzen.

Scientific Backgrounding

Prompt: „Fasse die Fortschritte bei Ionenantrieben (2023–2025) zusammen. Füge 4 von Experten begutachtete Quellen hinzu und notiere offene Probleme.“

Ergebnis: Paper-basierte Synthese mit offenen Fragen.

Video Knowledge Mining (falls aktiviert)

Prompt: „Fasse die wichtigsten Erkenntnisse aus den Videos der letzten Woche zu 'Rust Async Patterns' zusammen. Füge ggf. Zeitstempel hinzu.“

Tipps zur Fehlerbehebung und Performance

Docker kann das Modell nicht finden: Stellen Sie sicher, dass Ollama ausgeführt wird und die Basis-URL von Docker aus erreichbar ist. Versuchen Sie unter macOS/Windows host.docker.internal anstelle von localhost.

Leere Suchergebnisse: Überprüfen Sie den API-Schlüssel und das Kontingent des Providers. Versuchen Sie, zu einem anderen Provider zu wechseln oder einen zweiten als Fallback zu aktivieren.

Langsame Antworten: Verwenden Sie ein kleineres lokales Modell; reduzieren Sie die Anzahl der abgerufenen Seiten; oder wechseln Sie für umfangreiche Abfragen zu einem API-Modell.

Speicherspitzen: Beschränken Sie gleichzeitige Aufgaben oder reduzieren Sie das Context-Fenster, falls konfigurierbar.

Zitate fehlen: Präzisieren Sie Ihren Prompt („füge Quellenlinks mit Titeln hinzu“) oder überprüfen Sie, ob der Modus die Linkextraktion unterstützt.

Datenschutz- und Kostenkontrollen

Führen Sie nur lokale Modelle über Ollama aus, um Inhalte auf Ihrem Computer zu behalten.

Wählen Sie Provider mit erschwinglichen Preisen oder kostenlosen Tarifen (Brave/Tavily/Serper-Varianten können sich je nach Kontingent unterscheiden).

Zwischenspeichern Sie Ergebnisse, wenn Perplexica dies in Ihrem Build unterstützt. Sie reduzieren doppelte Aufrufe.

Aktualisieren von Perplexica

Laden Sie die neuesten Repository-Änderungen und aktualisieren Sie Ihre Container neu:

git pull
docker compose pull
docker compose up -d --build

Überprüfen Sie die Versionshinweise im GitHub-Repo auf Breaking Changes oder neue Provider-Optionen.

Integrationen und UI-Optionen

Viele Benutzer kombinieren Perplexica mit Ollama für einen vollständig lokalen Stack. Siehe diese Self-Hosting-Anleitung für praktische Verkabelung und Fallstricke.

Community-Posts teilen oft Docker Compose-Snippets, Umgebungsvorlagen und vorgefertigte Images für One-Command-Setup.

Wann Perplexica gegenüber gehosteten Alternativen zu bevorzugen ist

Sie benötigen Reproduzierbarkeit, lokale Protokolle und transparente Konfigurationen

Ihre Organisation blockiert externe KI-Tools

Sie möchten mit verschiedenen LLMs oder Retrieval-Einstellungen experimentieren

Sie legen Wert auf Kostenvorhersagbarkeit und Datenschutz

Erwähnenswert: Verwendung von Sider.AI zusammen mit Perplexica

Relevanz-Score: 8/10

Wenn Sie viel Zeit damit verbringen, Recherchefragen zu stellen und die Ergebnisse dann in Inhalte umzuwandeln (Briefings, Blog-Entwürfe, Foliennotizen), kann die Kombination von Perplexica mit einem Arbeitsbereich zum Schreiben/Analysieren die Dinge beschleunigen. Erwähnenswert: Mit Sider.AI können Sie mehrere Versionen Ihrer Ergebnisse schnell in einem übersichtlichen Editor entwerfen, bearbeiten und vergleichen. Nachdem Perplexica Quellen und Zusammenfassungen bereitgestellt hat, fügen Sie die Zitate ein und lassen Sie Sider bei Struktur, Ton und Politur helfen – insbesondere für lange Entwürfe oder Stakeholder-Zusammenfassungen.

Wichtige Erkenntnisse

Perplexica ist eine selbst gehostete KI-Suchmaschine, die Antworten mit Zitaten synthetisiert.

Führen Sie es schnell mit Docker aus; konfigurieren Sie Provider und Modelle in .env.

Verwenden Sie Ollama für lokale, private Inferenz – oder API-Modelle für Geschwindigkeit/Qualität.

Verbessern Sie die Ergebnisse mit strukturierten Prompts und fokussierten Modi.

Verwalten Sie die Kosten, indem Sie Provider sorgfältig auswählen und bei Möglichkeit zwischenspeichern.

Kurze Checkliste für den Einstieg

Installieren Sie Docker und Git

Klonen Sie das Repo und richten Sie .env ein

Wählen Sie Ihren Suchprovider und LLM (Ollama oder API)

docker compose up -d

Öffnen Sie die UI und führen Sie Ihre erste Abfrage aus

Iterieren Sie über Prompts und Provider-/Modellauswahl

FAQ

F1:Was ist Perplexica und wie unterscheidet es sich von Perplexity? Perplexica ist eine selbst gehostete Open-Source-KI-Suchmaschine, die Sie lokal oder auf einem Server ausführen, während Perplexity ein gehosteter Dienst ist. Mit Perplexica wählen Sie Provider und Modelle aus, kontrollieren den Datenschutz und können lokale LLMs über Ollama für null Kosten pro Abfrage verwenden.

F2:Wie installiere ich Perplexica mit Docker? Klonen Sie das offizielle Repo, konfigurieren Sie Ihre .env mit API-Schlüsseln und LLM-Einstellungen und führen Sie dann docker compose up -d aus. Die Web-UI ist über den konfigurierten Port erreichbar. Die genauen Schritte und Aktualisierungen finden Sie in der GitHub-Readme.

F3:Kann Perplexica lokale Modelle wie Llama 3 über Ollama verwenden? Ja. Installieren Sie Ollama, laden Sie ein Modell herunter (z. B. ollama pull llama3) und verweisen Sie die LLM-Basis-URL von Perplexica auf den Ollama-Endpunkt. Dies ermöglicht private, lokale Inferenz ohne API-Nutzungsgebühren.

F4:Welche Suchprovider funktionieren mit Perplexica? Perplexica unterstützt mehrere Provider wie Brave, Serper/SerpAPI, Bing, Tavily und Google CSE, abhängig von Ihrem Build. Fügen Sie die entsprechenden API-Schlüssel in Ihrer .env hinzu und wählen Sie einen Standardprovider aus.

F5:Wie kann ich die Antwortqualität in Perplexica verbessern? Seien Sie spezifisch mit Prompts (fragen Sie nach Zitaten, Vergleichen, Einschränkungen), wählen Sie ein starkes Modell und aktivieren Sie mehr als einen Suchprovider für eine bessere Abdeckung. Sie können auch den Umfang auf die letzten Jahre beschränken und strukturierte Ausgaben wie Tabellen oder Aufzählungspunkte anfordern.