What is Perplexica and how does it differ from Perplexity?

Perplexica is a self-hosted, open-source AI search engine you run locally or on a server, while Perplexity is a hosted service. With Perplexica, you choose providers and models, control privacy, and can use local LLMs via Ollama for zero per‑query cost.

How do I install Perplexica with Docker?

Clone the official repo, configure your `.env` with API keys and LLM settings, then run `docker compose up -d`. The web UI will be available at the configured port; see the GitHub readme for exact steps and updates.

Can Perplexica use local models like Llama 3 via Ollama?

Yes. Install Ollama, pull a model (e.g., `ollama pull llama3`), and point Perplexica’s LLM base URL to the Ollama endpoint. This enables private, local inference with no API usage fees.

Which search providers work with Perplexica?

Perplexica supports multiple providers such as Brave, Serper/SerpAPI, Bing, Tavily, and Google CSE, depending on your build. Add the corresponding API keys in your `.env` and select a default provider.

How can I improve answer quality in Perplexica?

Be specific with prompts (ask for citations, comparisons, constraints), choose a strong model, and enable more than one search provider for coverage. You can also limit scope to recent years and request structured outputs like tables or bullet points.

Cách Sử Dụng Perplexica: Hướng Dẫn Đầy Đủ, Không Rườm Rà cho Năm 2025

Nếu bạn đã để mắt đến các câu trả lời AI theo phong cách Perplexity nhưng muốn kiểm soát hoàn toàn, thì Perplexica là con đường mã nguồn mở—tự lưu trữ, thân thiện với quyền riêng tư và có khả năng đáng ngạc nhiên. Trong hướng dẫn này, chúng ta sẽ cùng nhau tìm hiểu Perplexica là gì, cách cài đặt, cách định cấu hình nhà cung cấp và mô hình, và cách thực sự sử dụng nó hàng ngày để nghiên cứu, viết code và khám phá nội dung.

Để mọi thứ mang tính thực tế và hướng đến giải pháp, chúng ta sẽ sử dụng cấu trúc dựa trên câu hỏi với các bước nhanh chóng, lệnh ví dụ và mẹo khắc phục sự cố.

Tiện đây: Perplexica đang được phát triển tích cực và thường được triển khai bằng Docker. Hướng dẫn sử dụng chính thức trên GitHub phác thảo con đường nhanh nhất: cài đặt Docker, sao chép repo và chạy qua Docker Compose. Để có cái nhìn tổng quan về cộng đồng và những điều cần lưu ý khi tự lưu trữ, hãy xem hướng dẫn về cách chạy Perplexica với Ollama này. Ngoài ra còn có một luồng tự lưu trữ tích cực thảo luận về thiết lập một lệnh và hình ảnh dựng sẵn.

Perplexica Là Gì?

Perplexica là một công cụ tìm kiếm hỗ trợ AI, tự lưu trữ, kết hợp tìm kiếm trên web với các mô hình ngôn ngữ lớn để tạo ra các câu trả lời ngắn gọn, dựa trên nguồn. Hãy nghĩ: đặt một câu hỏi phức tạp, nó sẽ tìm kiếm trên web, đọc nhiều nguồn và tổng hợp một phản hồi rõ ràng với các trích dẫn. Nó được định vị như một giải pháp thay thế mã nguồn mở cho các công cụ theo phong cách Perplexity, nhưng bạn chạy nó cục bộ hoặc trên máy chủ của riêng bạn để đảm bảo tính minh bạch và khả năng kiểm soát.

Những ý tưởng chính:

Kiểm soát cục bộ hoặc tự lưu trữ bằng Docker

Sử dụng các nhà cung cấp tìm kiếm/dữ liệu ưa thích của bạn (ví dụ: Brave, SerpAPI, Google CSE—có thể định cấu hình)

Hoạt động với LLM cục bộ hoặc từ xa (ví dụ: thông qua Ollama hoặc các mô hình dựa trên API)

Giao diện người dùng web cho các truy vấn tự nhiên, cộng với các “chế độ” tập trung như Web/Scholar/YouTube tùy thuộc vào cấu hình

Perplexica Dành Cho Ai?

Các nhà nghiên cứu muốn có các bản tóm tắt đa nguồn, được trích dẫn

Các kỹ sư thích LLM cục bộ với khả năng truy xuất web

Các nhóm cần quyền riêng tư và kiểm soát chi phí

Người dùng thành thạo thay thế các công cụ theo phong cách Perplexity bằng một thứ gì đó tự lưu trữ

Bắt Đầu Nhanh: Cách Nhanh Nhất để Chạy Perplexica

Đây là quy trình điển hình dựa trên kho lưu trữ chính thức:

Điều kiện tiên quyết

Docker và Docker Compose đã được cài đặt

Git đã được cài đặt

Tùy chọn: Ollama đã được cài đặt nếu bạn muốn sử dụng các mô hình cục bộ (ví dụ: llama3, mistral, qwen)

Sao Chép Kho Lưu Trữ

git clone
cd Perplexica

Định Cấu Hình Biến Môi Trường

Sao chép tệp môi trường ví dụ nếu được cung cấp (ví dụ: .env.example → .env).

Thêm bất kỳ khóa tìm kiếm/API nào (Brave, Serper, Tavily, Bing, Google CSE, v.v.).

Định cấu hình nhà cung cấp LLM: điểm cuối Ollama cục bộ hoặc API (OpenAI/tương thích) tùy thuộc vào thiết lập của bạn.

Khởi Chạy bằng Docker Compose

docker compose up -d

Thao tác này khởi động các dịch vụ cần thiết. Sau một phút, giao diện người dùng web sẽ khả dụng tại cổng localhost đã in (thường là ` hoặc như được chỉ định trong tài liệu của repo).

Tùy chọn: Kéo Một Mô Hình Cục Bộ Thông Qua Ollama

# Cài đặt Ollama (xem ollama.com cho hệ điều hành của bạn)
ollama pull llama3
# hoặc một mô hình được hỗ trợ khác

Trỏ cấu hình LLM của Perplexica đến điểm cuối Ollama của bạn (thường là từ Docker trên macOS/Windows hoặc trên Linux). Hướng dẫn tự lưu trữ giải thích cách ghép nối này.

Tham Quan Lần Đầu: Sử Dụng Giao Diện Người Dùng Web Perplexica

Sau khi giao diện người dùng hoạt động, bạn sẽ thấy một hộp tìm kiếm tương tự như các công cụ tìm kiếm AI hiện đại.

Đặt câu hỏi bằng ngôn ngữ tự nhiên: “Điểm chuẩn mới nhất cho cơ sở dữ liệu vector trong năm 2025 là gì?”

Chọn tiêu điểm/chế độ nếu có: Web, Học thuật/Học giả, YouTube hoặc chế độ Nghiên cứu chung hơn—bản dựng và nhà cung cấp của bạn xác định những gì xuất hiện.

Nhấn Enter. Perplexica sẽ tìm nạp các nguồn, đọc chúng và soạn thảo một bản tóm tắt với các trích dẫn.

Mở rộng các trích dẫn để kiểm tra các nguồn và xác nhận độ tin cậy.

Lời khuyên:

Sử dụng các lời nhắc cụ thể: thêm các ràng buộc như “so sánh các phương pháp tiếp cận”, “liệt kê ưu/nhược điểm” hoặc “đưa ra bản tóm tắt 200 từ với 3 điểm chính được gạch đầu dòng”.

Đối với các chủ đề viết code, hãy yêu cầu các đoạn mã từng bước và liên kết trở lại tài liệu gốc.

Đối với video (nếu chế độ YouTube được bật), hãy yêu cầu “tóm tắt hướng dẫn mới nhất của kênh này về X”.

Cách Định Cấu Hình Nhà Cung Cấp Tìm Kiếm và Khóa API

Perplexica dựa vào một hoặc nhiều nhà cung cấp web/tìm kiếm. Các tùy chọn phổ biến bao gồm Brave Search, Serper/SerpAPI (kết quả giống Google), Bing Web Search, Tavily và Google Custom Search Engine (CSE). Bạn sẽ cung cấp khóa API trong tệp .env của mình.

Các biến điển hình bạn có thể thấy trong .env:

BRAVE_API_KEY hoặc SERPER_API_KEY (hoặc SERPAPI_KEY)

BING_API_KEY

TAVILY_API_KEY

GOOGLE_CSE_ID và GOOGLE_CSE_API_KEY

OLLAMA_BASE_URL (cho các mô hình cục bộ)

OPENAI_API_KEY hoặc OPENAI_COMPATIBLE_BASE_URL cho các mô hình đám mây

Chỉ đặt những gì bạn cần. Nhiều người dùng bắt đầu với một nhà cung cấp duy nhất (ví dụ: Brave hoặc Tavily) và một LLM duy nhất (Ollama hoặc một điểm cuối tương thích với OpenAI), sau đó mở rộng.

Chọn và Điều Chỉnh Mô Hình Của Bạn

Bạn có thể chạy Perplexica với:

Các mô hình cục bộ thông qua Ollama: Thân thiện với quyền riêng tư và miễn phí cho mỗi truy vấn; tốc độ/chất lượng phụ thuộc vào GPU/CPU và kích thước mô hình của bạn.

Các mô hình đám mây thông qua API: Thường nhanh hơn và mạnh hơn cho các tác vụ phức tạp nhưng phải chịu chi phí sử dụng.

Đề xuất:

Phần cứng nhẹ: mistral:7b hoặc llama3:8b thông qua Ollama cho Q&A chung.

Phần cứng trung bình/cao: Các biến thể llama3:70b hoặc qwen2 nếu bạn cần lý luận mạnh mẽ hơn.

Hỗ trợ API: Hãy cân nhắc các mô hình tương thích với OpenAI cho các truy vấn nghiên cứu nặng nhất.

Trong cài đặt của Perplexica hoặc .env, hãy trỏ mô hình mặc định đến LLM bạn đã chọn. Nếu bản dựng của bạn hỗ trợ nhiều mô hình, bạn có thể chuyển đổi cho mỗi phiên.

Lời Nhắc Thông Minh để Có Câu Trả Lời Tốt Hơn

Sử dụng các mẫu sau để cải thiện đầu ra:

Yêu cầu bằng chứng: “Trích dẫn 3–5 nguồn uy tín có liên kết. Tóm tắt các thỏa thuận và bất đồng.”

Đầu ra có cấu trúc: “Trả về bản tóm tắt 5 điểm, sau đó là bảng so sánh.”

Ràng buộc: “Giữ nó dưới 150 từ. Sau đó thêm danh sách kiểm tra 3 mục.”

Kiểm soát phạm vi: “Chỉ tập trung vào các phát triển năm 2024–2025 và bỏ qua các nguồn bị khóa trả phí.”

Quy Trình Làm Việc Ví Dụ

Quét Cạnh Tranh

Lời nhắc: “So sánh Notion với Obsidian cho các nhóm nghiên cứu. Cung cấp ưu/nhược điểm, giá cả và cập nhật năm 2025 với các trích dẫn.”

Kết quả: Một lưới ngắn gọn về các đánh đổi với các liên kết đến các nguồn chính.

Hướng Dẫn Dành Cho Nhà Phát Triển

Lời nhắc: “Cách thêm theo dõi OpenTelemetry trong ứng dụng FastAPI? Bao gồm các đoạn mã và liên kết đến tài liệu chính thức.”

Kết quả: Mã từng bước cộng với các tham chiếu chính thức.

Nền Tảng Khoa Học

Lời nhắc: “Tóm tắt những tiến bộ của động cơ đẩy ion (2023–2025). Bao gồm 4 nguồn được đánh giá ngang hàng và lưu ý các vấn đề mở.”

Kết quả: Tổng hợp dựa trên giấy tờ với các câu hỏi mở.

Khai Thác Kiến Thức Video (Nếu Được Bật)

Lời nhắc: “Tóm tắt những điểm chính từ các video tuần trước về ‘Các mẫu bất đồng bộ Rust’. Bao gồm dấu thời gian nếu có.”

Mẹo Khắc Phục Sự Cố và Hiệu Suất

Docker không thể tìm thấy mô hình: Đảm bảo Ollama đang chạy và URL cơ sở có thể truy cập được từ bên trong Docker. Trên macOS/Windows, hãy thử host.docker.internal thay vì localhost.

Kết quả tìm kiếm trống: Xác minh khóa API và hạn ngạch của nhà cung cấp. Hãy thử chuyển sang một nhà cung cấp khác hoặc bật nhà cung cấp thứ hai làm dự phòng.

Phản hồi chậm: Sử dụng mô hình cục bộ nhỏ hơn; giảm số lượng trang được truy xuất; hoặc chuyển sang mô hình API cho các truy vấn nặng.

Tăng đột biến bộ nhớ: Giới hạn các tác vụ đồng thời hoặc giảm cửa sổ ngữ cảnh nếu có thể định cấu hình.

Thiếu trích dẫn: Thắt chặt lời nhắc của bạn (“bao gồm các liên kết nguồn có tiêu đề”) hoặc xác minh chế độ hỗ trợ trích xuất liên kết.

Quyền Riêng Tư và Kiểm Soát Chi Phí

Chỉ chạy các mô hình cục bộ thông qua Ollama để giữ nội dung trên máy của bạn.

Chọn các nhà cung cấp có giá cả phải chăng hoặc các bậc miễn phí (các biến thể Brave/Tavily/Serper có thể khác nhau theo hạn ngạch).

Bộ nhớ cache kết quả nếu Perplexica hỗ trợ nó trong bản dựng của bạn; bạn sẽ giảm các cuộc gọi trùng lặp.

Cập Nhật Perplexica

Kéo các thay đổi kho lưu trữ mới nhất và tải lại các container của bạn:

git pull
docker compose pull
docker compose up -d --build

Kiểm tra ghi chú phát hành trên repo GitHub để biết các thay đổi đột phá hoặc các tùy chọn nhà cung cấp mới.

Tích Hợp và Tùy Chọn Giao Diện Người Dùng

Nhiều người dùng ghép nối Perplexica với Ollama để có một ngăn xếp hoàn toàn cục bộ. Xem hướng dẫn tự lưu trữ này để biết cách kết nối và những cạm bẫy thực tế.

Các bài đăng trên cộng đồng thường chia sẻ các đoạn Docker Compose, mẫu môi trường và hình ảnh dựng sẵn để thiết lập một lệnh.

Khi Nào Nên Ưu Tiên Perplexica Hơn Các Giải Pháp Thay Thế Được Lưu Trữ

Bạn cần khả năng tái tạo, nhật ký cục bộ và cấu hình minh bạch

Tổ chức của bạn chặn các công cụ AI bên ngoài

Bạn muốn thử nghiệm với các LLM hoặc cài đặt truy xuất khác nhau

Bạn quan tâm đến khả năng dự đoán chi phí và quyền riêng tư

Điều đáng chú ý: Sử dụng Sider.AI cùng với Perplexica

Điểm liên quan: 8/10

Nếu bạn dành nhiều thời gian để đặt câu hỏi nghiên cứu và sau đó biến kết quả thành nội dung (tóm tắt, bản nháp blog, ghi chú slide), thì việc ghép nối Perplexica với không gian làm việc viết/phân tích có thể tăng tốc mọi thứ. Điều đáng chú ý: Sider.AI cho phép bạn soạn thảo, chỉnh sửa và so sánh nhiều phiên bản khám phá của bạn một cách nhanh chóng bên trong một trình chỉnh sửa sạch sẽ. Sau khi Perplexica đưa ra các nguồn và bản tóm tắt, hãy dán các trích dẫn và để Sider giúp bạn cấu trúc, giọng văn và đánh bóng—đặc biệt đối với các phác thảo dài hoặc bản tóm tắt các bên liên quan.

Những Điểm Chính

Perplexica là một công cụ tìm kiếm AI tự lưu trữ, tổng hợp các câu trả lời bằng các trích dẫn.

Chạy nó nhanh chóng với Docker; định cấu hình nhà cung cấp và mô hình trong .env.

Sử dụng Ollama để suy luận cục bộ, riêng tư—hoặc các mô hình API để có tốc độ/chất lượng.

Cải thiện kết quả bằng các lời nhắc có cấu trúc và các chế độ tập trung.

Quản lý chi phí bằng cách chọn nhà cung cấp một cách cẩn thận và lưu vào bộ nhớ cache nếu có thể.

Danh Sách Kiểm Tra Nhanh Để Bắt Đầu

Cài đặt Docker và Git

Sao chép repo và thiết lập .env

Chọn nhà cung cấp tìm kiếm và LLM của bạn (Ollama hoặc API)

docker compose up -d

Mở giao diện người dùng và chạy truy vấn đầu tiên của bạn

Lặp lại các lời nhắc và lựa chọn nhà cung cấp/mô hình

Câu Hỏi Thường Gặp

Q1: Perplexica là gì và nó khác với Perplexity như thế nào? Perplexica là một công cụ tìm kiếm AI mã nguồn mở, tự lưu trữ mà bạn chạy cục bộ hoặc trên máy chủ, trong khi Perplexity là một dịch vụ được lưu trữ. Với Perplexica, bạn chọn nhà cung cấp và mô hình, kiểm soát quyền riêng tư và có thể sử dụng LLM cục bộ thông qua Ollama với chi phí bằng không cho mỗi truy vấn.

Q2: Làm cách nào để cài đặt Perplexica với Docker? Sao chép repo chính thức, định cấu hình .env của bạn với khóa API và cài đặt LLM, sau đó chạy docker compose up -d. Giao diện người dùng web sẽ khả dụng tại cổng được định cấu hình; xem tệp readme trên GitHub để biết các bước và cập nhật chính xác.

Q3: Perplexica có thể sử dụng các mô hình cục bộ như Llama 3 thông qua Ollama không? Vâng. Cài đặt Ollama, kéo một mô hình (ví dụ: ollama pull llama3) và trỏ URL cơ sở LLM của Perplexica đến điểm cuối Ollama. Điều này cho phép suy luận cục bộ, riêng tư mà không mất phí sử dụng API.

Q4: Những nhà cung cấp tìm kiếm nào hoạt động với Perplexica? Perplexica hỗ trợ nhiều nhà cung cấp như Brave, Serper/SerpAPI, Bing, Tavily và Google CSE, tùy thuộc vào bản dựng của bạn. Thêm các khóa API tương ứng trong .env của bạn và chọn một nhà cung cấp mặc định.

Q5: Làm cách nào tôi có thể cải thiện chất lượng câu trả lời trong Perplexica? Hãy cụ thể với các lời nhắc (yêu cầu trích dẫn, so sánh, ràng buộc), chọn một mô hình mạnh mẽ và bật nhiều nhà cung cấp tìm kiếm để có phạm vi phủ sóng. Bạn cũng có thể giới hạn phạm vi cho những năm gần đây và yêu cầu các đầu ra có cấu trúc như bảng hoặc dấu đầu dòng.