Com utilitzar Perplexica: Una guia completa i sense floritures per al 2025
Si has estat observant respostes d'IA a l'estil de Perplexity però vols control total, Perplexica és la ruta de codi obert: autoallotjada, respectuosa amb la privadesa i sorprenentment capaç. En aquesta guia, repassarem què és Perplexica, com instal·lar-la, com configurar proveïdors i models, i com utilitzar-la realment dia a dia per a la investigació, la codificació i el descobriment de contingut.
Per mantenir les coses pràctiques i orientades a la solució, utilitzarem una estructura dirigida per preguntes amb passos ràpids, ordres d'exemple i consells per a la resolució de problemes.
Per cert: Perplexica es desenvolupa activament i normalment es desplega amb Docker. El fitxer readme oficial de GitHub descriu el camí més ràpid: instal·la Docker, clona el repositori i executa-ho mitjançant Docker Compose. Per a una visió general de la comunitat i conclusions sobre l'autoallotjament, consulta aquest tutorial sobre com executar Perplexica amb Ollama. També hi ha un fil autoallotjat actiu que discuteix la configuració d'una ordre i les imatges preconstruïdes.
Què és Perplexica?
Perplexica és un motor de cerca autoallotjat i impulsat per IA que combina la cerca web amb models de llenguatge grans per produir respostes concises i fonamentades en fonts. Pensa: fas una pregunta complexa, cerca a la web, llegeix múltiples fonts i sintetitza una resposta clara amb citacions. Es posiciona com una alternativa oberta a les eines d'estil Perplexity, però l'executes localment o al teu propi servidor per a la transparència i el control.
Idees clau:
- Control local o autoallotjat amb Docker
- Utilitza els teus proveïdors de cerca/dades preferits (per exemple, Brave, SerpAPI, Google CSE—configurable)
- Funciona amb LLM locals o remots (per exemple, mitjançant Ollama o models basats en API)
- IU web per a consultes naturals, a més de "modes" enfocats com ara Web/Scholar/YouTube segons la configuració
Per a qui és Perplexica?
- Investigadors que volen resums citats de múltiples fonts
- Enginyers que prefereixen LLM locals amb recuperació web
- Equips que necessiten privadesa i control de costos
- Usuaris avançats que substitueixen les eines d'estil Perplexity per alguna cosa autoallotjada
Inici ràpid: la manera més ràpida d'executar Perplexica
Aquest és el flux típic basat en el repositori oficial:
- Docker i Docker Compose instal·lats
- Opcional: Ollama instal·lat si vols utilitzar models locals (per exemple,
llama3, mistral, qwen)
- Configura les variables d'entorn
- Copia el fitxer d'entorn d'exemple si se'n proporciona un (per exemple,
.env.example → .env).
- Afegeix qualsevol clau de cerca/API (Brave, Serper, Tavily, Bing, Google CSE, etc.).
- Configura el proveïdor de LLM: punt final local d'Ollama o API (OpenAI/compatible) segons la teva configuració.
- Inicia amb Docker Compose
- Això inicia els serveis necessaris. Al cap d'un minut, la IU web hauria d'estar disponible al port localhost imprès (normalment ` o tal com s'especifica a la documentació del repositori).
- Opcional: obtén un model local mitjançant Ollama
# Instal·la Ollama (consulta ollama.com per al teu sistema operatiu)
ollama pull llama3
# o un altre model compatible
- Apunta la configuració de LLM de Perplexica al teu punt final d'Ollama (sovint
des de Docker a macOS/Windows o a Linux). El tutorial d'autoallotjament explica aquest emparellament.
Recorregut de primer ús: ús de la IU web de Perplexica
Una vegada que la IU estigui en funcionament, veuràs un quadre de cerca similar als motors de cerca d'IA moderns.
- Fes una pregunta en llenguatge natural: "Quins són els últims benchmarks per a les bases de dades vectorials el 2025?"
- Tria un enfocament/mode si està disponible: Web, Acadèmic/Scholar, YouTube o un mode de recerca més general; la teva compilació i proveïdors determinen quins apareixen.
- Prem Enter. Perplexica obtindrà fonts, les llegirà i redactarà un resum amb citacions.
- Expandeix les citacions per inspeccionar les fonts i confirmar la credibilitat.
Consells:
- Utilitza indicacions específiques: afegeix restriccions com "compara enfocaments", "enumera els avantatges/desavantatges" o "dóna un resum de 200 paraules amb 3 punts clau".
- Per a temes de codificació, demana fragments pas a pas i enllaça amb la documentació original.
- Per a vídeos (si el mode de YouTube està habilitat), demana "resumeix l'últim tutorial d'aquest canal sobre X".
Com configurar proveïdors de cerca i claus API
Perplexica es basa en un o més proveïdors web/de cerca. Les opcions comunes inclouen Brave Search, Serper/SerpAPI (resultats similars a Google), Bing Web Search, Tavily i Google Custom Search Engine (CSE). Proporcionaràs les claus API al teu fitxer .env.
Variables típiques que podries veure a .env:
- BRAVE_API_KEY o SERPER_API_KEY (o SERPAPI_KEY)
- GOOGLE_CSE_ID i GOOGLE_CSE_API_KEY
- OLLAMA_BASE_URL (per a models locals)
- OPENAI_API_KEY o OPENAI_COMPATIBLE_BASE_URL per a models al núvol
Estableix només el que necessites. Molts usuaris comencen amb un sol proveïdor (per exemple, Brave o Tavily) i un sol LLM (Ollama o un punt final compatible amb OpenAI), i després s'expandeixen.
Triar i ajustar el teu model
Pots executar Perplexica amb:
- Models locals mitjançant Ollama: respectuós amb la privadesa i gratuït per consulta; la velocitat/qualitat depèn de la teva GPU/CPU i la mida del model.
- Models al núvol mitjançant API: normalment més ràpids i forts per a tasques complexes, però impliquen un cost d'ús.
Recomanacions:
- Hardware lleuger:
mistral:7b o llama3:8b mitjançant Ollama per a preguntes i respostes generals.
- Hardware mitjà/alt: variants
llama3:70b o qwen2 si necessites un raonament més fort.
- Amb suport d'API: considera models compatibles amb OpenAI per a les consultes de recerca més pesades.
A la configuració de Perplexica o a .env, apunta el model predeterminat al teu LLM triat. Si la teva compilació admet múltiples models, pots canviar-los per sessió.
Indicacions intel·ligents per a millors respostes
Utilitza aquests patrons per millorar la sortida:
- Sol·licitud d'evidència: "Cita 3-5 fonts reputades amb enllaços. Resumeix els acords i desacords."
- Sortida estructurada: "Retorna un resum de 5 punts seguit d'una taula comparativa."
- Restriccions: "Mantén-ho per sota de les 150 paraules. Després afegeix una llista de verificació de 3 elements."
- Control d'abast: "Centra't només en els desenvolupaments del 2024-2025 i omet les fonts de pagament."
Fluxos de treball d'exemple
- Indicació: "Compara Notion vs Obsidian per a equips de recerca. Proporcioneu avantatges/desavantatges, preus i actualitzacions del 2025 amb citacions."
- Resultat: una graella concisa de compensacions amb enllaços a fonts primàries.
- Instruccions per a desenvolupadors
- Indicació: "Com afegir el seguiment d'OpenTelemetry a una aplicació FastAPI? Incloeu fragments de codi i enllaç a la documentació oficial."
- Resultat: codi pas a pas més referències oficials.
- Indicació: "Resumeix els avenços del propulsor d'ions (2023-2025). Incloeu 4 fonts revisades per parells i anoteu els problemes oberts."
- Resultat: síntesi amb suport de documents amb preguntes obertes.
- Extracció de coneixement de vídeo (si està habilitat)
- Indicació: "Resumeix les conclusions clau dels vídeos de la setmana passada sobre 'Patrons asíncrons de Rust'. Incloeu marques de temps si estan disponibles."
Consells per a la resolució de problemes i el rendiment
- Docker no pot trobar el model: assegura't que Ollama s'estigui executant i que l'URL base sigui accessible des de l'interior de Docker. A macOS/Windows, prova
host.docker.internal en lloc de localhost.
- Resultats de cerca buits: verifica la clau API i la quota del proveïdor. Prova de canviar a un altre proveïdor o habilita'n un segon com a alternativa.
- Respostes lentes: utilitza un model local més petit; redueix el nombre de pàgines recuperades; o canvia a un model API per a consultes pesades.
- Pics de memòria: limita les tasques simultànies o redueix la finestra de context si es pot configurar.
- Citacions que falten: ajusta la teva indicació ("inclou enllaços de font amb títols") o verifica que el mode admet l'extracció d'enllaços.
Controls de privadesa i costos
- Executa només models locals mitjançant Ollama per mantenir el contingut a la teva màquina.
- Tria proveïdors amb preus assequibles o nivells gratuïts (les variants de Brave/Tavily/Serper poden diferir segons la quota).
- Emmagatzema en memòria cau els resultats si Perplexica ho admet a la teva compilació; reduiràs les trucades duplicades.
Actualització de Perplexica
- Obté els últims canvis del repositori i torna a carregar els teus contenidors:
git pull
docker compose pull
docker compose up -d --build
- Consulta les notes de la versió al repositori de GitHub per obtenir canvis importants o noves opcions de proveïdor.
Integracions i opcions d'IU
- Molts usuaris combinen Perplexica amb Ollama per a una pila totalment local. Consulta aquest tutorial d'autoallotjament per obtenir connexions pràctiques i inconvenients.
- Les publicacions de la comunitat sovint comparteixen fragments de Docker Compose, plantilles d'entorn i imatges preconstruïdes per a la configuració d'una ordre.
Quan preferir Perplexica a les alternatives allotjades
- Necessites reproductibilitat, registres locals i configuracions transparents
- La teva organització bloqueja les eines d'IA externes
- Vols experimentar amb diferents LLM o configuracions de recuperació
- Et preocupa la predictibilitat dels costos i la privadesa
Val la pena destacar: ús de Sider.AI juntament amb Perplexica
Puntuació de rellevància: 8/10
Si dediques molt de temps a fer preguntes de recerca i després a convertir els resultats en contingut (informes, esborranys de blocs, notes de diapositives), combinar Perplexica amb un espai de treball d'escriptura/anàlisi pot accelerar les coses. Val la pena destacar: Sider.AI et permet redactar, editar i comparar múltiples versions de les teves conclusions ràpidament dins d'un editor net. Després que Perplexica faci aparèixer fonts i resums, enganxa les citacions i deixa que Sider t'ajudi amb l'estructura, el to i el poliment, especialment per a esquemes de format llarg o resums d'interessats.
Conclusions clau
- Perplexica és un motor de cerca d'IA autoallotjat que sintetitza respostes amb citacions.
- Executa-ho ràpidament amb Docker; configura els proveïdors i els models a
.env.
- Utilitza Ollama per a la inferència local i privada, o models API per a la velocitat/qualitat.
- Millora els resultats amb indicacions estructurades i modes enfocats.
- Gestiona els costos seleccionant els proveïdors amb cura i emmagatzemant en memòria cau sempre que sigui possible.
Llista de verificació ràpida per començar
- Clona el repositori i configura
.env
- Tria el teu proveïdor de cerca i LLM (Ollama o API)
- Obre la IU i executa la teva primera consulta
- Itera sobre les indicacions i les opcions de proveïdor/model
PMF
P1: Què és Perplexica i en què es diferencia de Perplexity?
Perplexica és un motor de cerca d'IA de codi obert autoallotjat que executes localment o en un servidor, mentre que Perplexity és un servei allotjat. Amb Perplexica, tria proveïdors i models, controla la privadesa i pots utilitzar LLM locals mitjançant Ollama per a un cost per consulta zero.
P2: Com instal·lo Perplexica amb Docker?
Clona el repositori oficial, configura el teu .env amb claus API i configuració de LLM, després executa docker compose up -d. La IU web estarà disponible al port configurat; consulta el fitxer readme de GitHub per obtenir passos i actualitzacions exactes.
P3: Pot Perplexica utilitzar models locals com Llama 3 mitjançant Ollama?
Sí. Instal·la Ollama, obtén un model (per exemple, ollama pull llama3) i apunta l'URL base de LLM de Perplexica al punt final d'Ollama. Això permet la inferència local i privada sense tarifes d'ús d'API.
P4: Quins proveïdors de cerca funcionen amb Perplexica?
Perplexica admet múltiples proveïdors com Brave, Serper/SerpAPI, Bing, Tavily i Google CSE, segons la teva compilació. Afegeix les claus API corresponents al teu .env i selecciona un proveïdor predeterminat.
P5: Com puc millorar la qualitat de la resposta a Perplexica?
Sigues específic amb les indicacions (demana citacions, comparacions, restriccions), tria un model fort i habilita més d'un proveïdor de cerca per a la cobertura. També pots limitar l'abast als anys recents i sol·licitar sortides estructurades com taules o punts.