Comment utiliser Perplexica : Un guide complet et sans fioritures pour 2025
Si vous avez lorgné sur les réponses d'IA à la Perplexity, mais que vous voulez un contrôle total, Perplexica est la voie open source : auto-hébergée, respectueuse de la vie privée et étonnamment performante. Dans ce guide, nous allons voir ce qu'est Perplexica, comment l'installer, comment configurer les fournisseurs et les modèles, et comment l'utiliser au quotidien pour la recherche, le codage et la découverte de contenu.
Pour que les choses restent pratiques et axées sur les solutions, nous utiliserons une structure axée sur les questions avec des étapes rapides, des exemples de commandes et des conseils de dépannage.
Au fait : Perplexica est activement développé et généralement déployé avec Docker. Le fichier Readme officiel sur GitHub décrit le chemin le plus rapide : installez Docker, clonez le dépôt et exécutez-le via Docker Compose. Pour un aperçu de la communauté et des informations sur l'auto-hébergement, consultez cette présentation sur l'exécution de Perplexica avec Ollama. Il existe également un fil de discussion actif sur l'auto-hébergement concernant la configuration en une seule commande et les images précompilées.
Qu'est-ce que Perplexica ?
Perplexica est un moteur de recherche auto-hébergé, alimenté par l'IA, qui combine la recherche web avec de grands modèles linguistiques pour produire des réponses concises et fondées sur des sources. Imaginez : vous posez une question complexe, il effectue une recherche sur le web, lit plusieurs sources et synthétise une réponse claire avec des citations. Il est présenté comme une alternative open source aux outils de type Perplexity, mais vous l'exécutez localement ou sur votre propre serveur pour plus de transparence et de contrôle.
Idées clés :
- Contrôle local ou auto-hébergé avec Docker
- Utilise vos fournisseurs de recherche/données préférés (par exemple, Brave, SerpAPI, Google CSE—configurable)
- Fonctionne avec des LLM locaux ou distants (par exemple, via Ollama ou des modèles basés sur l'API)
- Interface utilisateur Web pour les requêtes naturelles, ainsi que des « modes » ciblés comme Web/Scholar/YouTube en fonction de la configuration
À qui s'adresse Perplexica ?
- Aux chercheurs qui souhaitent des résumés cités et multi-sources
- Aux ingénieurs qui préfèrent les LLM locaux avec extraction web
- Aux équipes qui ont besoin de confidentialité et de contrôle des coûts
- Aux utilisateurs expérimentés qui remplacent les outils de type Perplexity par quelque chose d'auto-hébergé
Démarrage rapide : Le moyen le plus rapide d'exécuter Perplexica
Voici le flux typique basé sur le dépôt officiel :
- Docker et Docker Compose installés
- Facultatif : Ollama installé si vous souhaitez utiliser des modèles locaux (par exemple,
llama3, mistral, qwen)
- Configurer les variables d'environnement
- Copiez le fichier d'environnement exemple s'il est fourni (par exemple,
.env.example → .env).
- Ajoutez les clés de recherche/API (Brave, Serper, Tavily, Bing, Google CSE, etc.).
- Configurez le fournisseur LLM : point de terminaison Ollama local ou API (OpenAI/compatible) en fonction de votre configuration.
- Lancer avec Docker Compose
- Cela démarre les services nécessaires. Après une minute, l'interface utilisateur Web devrait être disponible sur le port localhost imprimé (généralement ` ou comme spécifié dans la documentation du dépôt).
- Facultatif : Télécharger un modèle local via Ollama
# Installer Ollama (voir ollama.com pour votre système d'exploitation)
ollama pull llama3
# ou un autre modèle pris en charge
- Pointez la configuration LLM de Perplexica vers votre point de terminaison Ollama (souvent
depuis Docker sur macOS/Windows ou sur Linux). La présentation de l'auto-hébergement explique cet appariement.
Visite de première exécution : Utilisation de l'interface utilisateur Web de Perplexica
Une fois l'interface utilisateur opérationnelle, vous verrez une boîte de recherche similaire aux moteurs de recherche d'IA modernes.
- Posez une question en langage naturel : « Quels sont les derniers benchmarks pour les bases de données vectorielles en 2025 ? »
- Choisissez une orientation/un mode si disponible : Web, Académique/Scholar, YouTube, ou un mode Recherche plus général—votre build et vos fournisseurs déterminent ceux qui apparaissent.
- Appuyez sur Entrée. Perplexica récupérera les sources, les lira et rédigera un résumé avec des citations.
- Développez les citations pour inspecter les sources et confirmer leur crédibilité.
Conseils :
- Utilisez des invites spécifiques : ajoutez des contraintes telles que « comparer les approches », « énumérer les avantages/inconvénients » ou « donner un résumé de 200 mots avec 3 points clés à retenir ».
- Pour les sujets de codage, demandez des extraits étape par étape et renvoyez aux documents originaux.
- Pour les vidéos (si le mode YouTube est activé), demandez « résumer le dernier tutoriel de cette chaîne sur X ».
Comment configurer les fournisseurs de recherche et les clés API
Perplexica s'appuie sur un ou plusieurs fournisseurs Web/de recherche. Les options courantes incluent Brave Search, Serper/SerpAPI (résultats de type Google), Bing Web Search, Tavily et Google Custom Search Engine (CSE). Vous fournirez les clés API dans votre fichier .env.
Variables typiques que vous pourriez voir dans .env :
- BRAVE_API_KEY ou SERPER_API_KEY (ou SERPAPI_KEY)
- GOOGLE_CSE_ID et GOOGLE_CSE_API_KEY
- OLLAMA_BASE_URL (pour les modèles locaux)
- OPENAI_API_KEY ou OPENAI_COMPATIBLE_BASE_URL pour les modèles cloud
Définissez uniquement ce dont vous avez besoin. De nombreux utilisateurs commencent avec un seul fournisseur (par exemple, Brave ou Tavily) et un seul LLM (Ollama ou un point de terminaison compatible OpenAI), puis se développent.
Choisir et régler votre modèle
Vous pouvez exécuter Perplexica avec :
- Modèles locaux via Ollama : Respectueux de la vie privée et gratuit par requête ; la vitesse/qualité dépend de votre GPU/CPU et de la taille du modèle.
- Modèles cloud via API : Généralement plus rapides et plus performants pour les tâches complexes, mais entraînent des coûts d'utilisation.
Recommandations :
- Matériel léger :
mistral:7b ou llama3:8b via Ollama pour les questions-réponses générales.
- Matériel moyen/haut de gamme : variantes
llama3:70b ou qwen2 si vous avez besoin d'un raisonnement plus puissant.
- Basé sur l'API : Envisagez les modèles compatibles OpenAI pour les requêtes de recherche les plus lourdes.
Dans les paramètres de Perplexica ou .env, pointez le modèle par défaut vers votre LLM choisi. Si votre build prend en charge plusieurs modèles, vous pouvez basculer par session.
Invites intelligentes pour de meilleures réponses
Utilisez ces modèles pour améliorer la sortie :
- Demande de preuves : « Citez 3 à 5 sources réputées avec des liens. Résumez les accords et les désaccords. »
- Sortie structurée : « Retournez un résumé en 5 points suivi d'un tableau de comparaison. »
- Contraintes : « Restez en dessous de 150 mots. Ajoutez ensuite une liste de contrôle en 3 points. »
- Contrôle de la portée : « Concentrez-vous uniquement sur les développements de 2024 à 2025 et ignorez les sources payantes. »
Exemples de flux de travail
- Invite : « Comparez Notion et Obsidian pour les équipes de recherche. Fournissez les avantages/inconvénients, les prix et les mises à jour de 2025 avec des citations. »
- Résultat : Une grille concise des compromis avec des liens vers les sources primaires.
- Guide pratique pour les développeurs
- Invite : « Comment ajouter le traçage OpenTelemetry dans une application FastAPI ? Incluez des extraits de code et un lien vers la documentation officielle. »
- Résultat : Code étape par étape plus références officielles.
- Invite : « Résumez les avancées des propulseurs ioniques (2023–2025). Incluez 4 sources évaluées par des pairs et notez les problèmes ouverts. »
- Résultat : Synthèse étayée par des documents avec des questions ouvertes.
- Exploration de connaissances vidéo (si activée)
- Invite : « Résumez les principaux points à retenir des vidéos de la semaine dernière sur les « modèles async de Rust ». Incluez les horodatages si disponibles. »
Conseils de dépannage et de performance
- Docker ne trouve pas le modèle : Assurez-vous qu'Ollama est en cours d'exécution et que l'URL de base est accessible depuis l'intérieur de Docker. Sur macOS/Windows, essayez
host.docker.internal au lieu de localhost.
- Résultats de recherche vides : Vérifiez la clé API et le quota du fournisseur. Essayez de passer à un autre fournisseur ou activez-en un deuxième en tant que solution de repli.
- Réponses lentes : Utilisez un modèle local plus petit ; réduisez le nombre de pages récupérées ; ou passez à un modèle API pour les requêtes lourdes.
- Pics de mémoire : Limitez les tâches simultanées ou réduisez la fenêtre contextuelle si elle est configurable.
- Citations manquantes : Resserrez votre invite (« inclure les liens vers les sources avec les titres ») ou vérifiez que le mode prend en charge l'extraction des liens.
Confidentialité et contrôle des coûts
- Exécutez uniquement des modèles locaux via Ollama pour conserver le contenu sur votre machine.
- Choisissez des fournisseurs avec des prix abordables ou des niveaux gratuits (les variantes Brave/Tavily/Serper peuvent différer selon le quota).
- Mettez les résultats en cache si Perplexica le prend en charge dans votre build ; vous réduirez les appels en double.
Mise à jour de Perplexica
- Extrayez les dernières modifications du dépôt et relancez vos conteneurs :
git pull
docker compose pull
docker compose up -d --build
- Consultez les notes de version sur le dépôt GitHub pour les changements importants ou les nouvelles options de fournisseur.
Intégrations et options d'interface utilisateur
- De nombreux utilisateurs associent Perplexica à Ollama pour une pile entièrement locale. Consultez cette présentation d'auto-hébergement pour le câblage pratique et les pièges.
- Les publications de la communauté partagent souvent des extraits de Docker Compose, des modèles d'environnement et des images précompilées pour une configuration en une seule commande.
Quand préférer Perplexica aux alternatives hébergées
- Vous avez besoin de reproductibilité, de journaux locaux et de configurations transparentes
- Votre organisation bloque les outils d'IA externes
- Vous voulez expérimenter avec différents LLM ou paramètres de récupération
- Vous vous souciez de la prévisibilité des coûts et de la confidentialité
Il est intéressant de noter : Utilisation de Sider.AI avec Perplexica
Score de pertinence : 8/10
Si vous passez beaucoup de temps à poser des questions de recherche, puis à transformer les résultats en contenu (résumés, brouillons de blog, notes de diapositives), l'association de Perplexica à un espace de travail d'écriture/d'analyse peut accélérer les choses. Il est intéressant de noter : Sider.AI vous permet de rédiger, de modifier et de comparer rapidement plusieurs versions de vos résultats dans un éditeur propre. Une fois que Perplexica a fait apparaître les sources et les résumés, collez les citations et laissez Sider vous aider avec la structure, le ton et le polissage, en particulier pour les plans de longue haleine ou les résumés des parties prenantes.
Points clés à retenir
- Perplexica est un moteur de recherche d'IA auto-hébergé qui synthétise les réponses avec des citations.
- Exécutez-le rapidement avec Docker ; configurez les fournisseurs et les modèles dans
.env.
- Utilisez Ollama pour une inférence locale et privée, ou des modèles API pour la vitesse/qualité.
- Améliorez les résultats avec des invites structurées et des modes ciblés.
- Gérez les coûts en sélectionnant soigneusement les fournisseurs et en mettant en cache lorsque cela est possible.
Liste de contrôle rapide pour démarrer
- Cloner le dépôt et configurer
.env
- Choisissez votre fournisseur de recherche et votre LLM (Ollama ou API)
- Ouvrez l'interface utilisateur et exécutez votre première requête
- Itérez sur les invites et les choix de fournisseurs/modèles
FAQ
Q1 : Qu'est-ce que Perplexica et en quoi diffère-t-il de Perplexity ?
Perplexica est un moteur de recherche d'IA open source auto-hébergé que vous exécutez localement ou sur un serveur, tandis que Perplexity est un service hébergé. Avec Perplexica, vous choisissez les fournisseurs et les modèles, contrôlez la confidentialité et pouvez utiliser des LLM locaux via Ollama pour un coût nul par requête.
Q2 : Comment installer Perplexica avec Docker ?
Clonez le dépôt officiel, configurez votre .env avec les clés API et les paramètres LLM, puis exécutez docker compose up -d. L'interface utilisateur Web sera disponible sur le port configuré ; consultez le fichier Readme de GitHub pour connaître les étapes exactes et les mises à jour.
Q3 : Perplexica peut-il utiliser des modèles locaux comme Llama 3 via Ollama ?
Oui. Installez Ollama, téléchargez un modèle (par exemple, ollama pull llama3), et pointez l'URL de base LLM de Perplexica vers le point de terminaison Ollama. Cela permet une inférence locale et privée sans frais d'utilisation de l'API.
Q4 : Quels fournisseurs de recherche fonctionnent avec Perplexica ?
Perplexica prend en charge plusieurs fournisseurs tels que Brave, Serper/SerpAPI, Bing, Tavily et Google CSE, en fonction de votre build. Ajoutez les clés API correspondantes dans votre .env et sélectionnez un fournisseur par défaut.
Q5 : Comment puis-je améliorer la qualité des réponses dans Perplexica ?
Soyez précis avec les invites (demandez des citations, des comparaisons, des contraintes), choisissez un modèle fort et activez plus d'un fournisseur de recherche pour la couverture. Vous pouvez également limiter la portée aux années récentes et demander des sorties structurées comme des tableaux ou des puces.