Sider.ai
  • 聊天
  • Wisebase
  • 工具
  • 瀏覽器插件
  • 客户端
  • 定價
立即下載
登入

透過 Sider 更快學習、更深入思考、更聰明成長。

產品
應用程式
  • 擴充功能
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
工具
  • 網站產生器New
  • AI 投影片New
  • AI 論文寫作
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI 圖像生成器
  • 意大利腦洞
  • 背景移除器
  • 背景更換器
  • 照片橡皮擦
  • 文字移除器
  • 修補
  • 圖像升級器
  • 創建
  • AI 翻譯器
  • 圖像翻譯器
  • PDF 翻譯器
Sider
  • 聯絡我們
  • 幫助中心
  • 下載
  • 定價
  • 教育優惠
  • 最新消息
  • 部落格
  • 社群
  • 合作夥伴
  • 聯盟
  • 邀請
©2026 版權所有
使用條款
隱私政策
  • 首頁
  • 部落格
  • AI 工具
  • 2025年掌握RAG的10個最佳LlamaIndex教學

2025年掌握RAG的10個最佳LlamaIndex教學

更新於 2025年9月23日

9 分鐘


2025 年掌握 RAG 的 10 佳 LlamaIndex 教學

如果您聽說檢索增強生成 (RAG) 可以讓您的 LLM 應用程式更智慧,那就對了。 現在構建可靠、類似搜尋的 AI 助理最快的方法是學好 LlamaIndex,而最好的 LlamaIndex 教學可以將您的學習曲線從幾個月縮短到幾天。
在本指南中,我們為每個級別精心挑選了最好的 LlamaIndex 教學,從複製貼上的快速入門到生產級管道。 您會找到影片演練、實作筆記本和用於多租戶資料、結構化提取、代理和評估的高級方法。
我們還會將每個教學對應到您關心的技能或結果:在您的文件上構建聊天、擴展嵌入、新增工具、串流答案或驗證結果。
到最後,您將知道從哪個 LlamaIndex 教學開始,接下來要學習哪些教學,以及如何將它們組合成真正的產品。

現在 LlamaIndex 教學為何重要

  • RAG 是 AI 應用程式的現在式。 LLM 會產生幻覺; RAG 將答案建立在您的資料中。
  • LlamaIndex 是最具凝聚力的 RAG 堆疊。 它將索引、檢索、查詢規劃、可觀察性和評估包裝到可組合的模組中,這些模組可以與 LangChain、OpenAI、Anthropic 和開源 LLM 很好地協同工作。
  • 教學是您的快速通道。 最好的 LlamaIndex 教學不僅展示程式碼,還展示架構決策:分塊、重新排序、快取和防護欄。
如果您的目標是:「與我的文件聊天,並且不要產生幻覺」,此列表將幫助您實現目標。

我們如何挑選最好的 LlamaIndex 教學

  • 以結果為導向: 您應該在每個教學後交付一些有用的東西。
  • 2025 年最新: 反映當前的 LlamaIndex API(例如,VectorStoreIndex、Settings、QueryPipeline、ReActAgent)。
  • 生產意識: 顯示評估、追蹤和迭代,而不僅僅是 hello world。
  • 廣度 + 深度: 從快速入門到代理、多模態和結構化提取。

10 佳 LlamaIndex 教學(精選)

以下是精心策劃的路徑。 從您的級別開始; 根據需要跳轉。

1) 15 分鐘快速入門:在您的 PDF 上聊天

  • 最適合: 絕對初學者和產品經理
  • 您將構建: 上傳 PDF、索引、提問、取得引文
  • 主要概念: SimpleDirectoryReader、VectorStoreIndex、Settings、嵌入
  • 為何如此出色: 最少的程式碼,最大的頓悟時刻!
範例骨架:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
  • 接下來您將學習: 分塊大小、top‑k 以及重新排序為何重要。

2) 具有分塊、中繼資料和重新排序的 RAG 基礎知識

  • 最適合: 初學者 → 中級
  • 您將構建: 具有更好上下文品質的更智慧的檢索器
  • 主要概念: SentenceSplitter、中繼資料篩選器、rerank 元件
  • 為何如此出色: 顯示一些旋鈕如何大幅減少幻覺
嘗試:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
  • 結果: 用於長文件的更高品質的上下文視窗。

3) LlamaIndex + OpenAI 函數呼叫(工具使用和結構化輸出)

  • 最適合: 自動化工作流程的構建者
  • 您將構建: 呼叫工具並傳回 JSON 結構描述的代理
  • 主要概念: QueryPipeline、工具規格、Pydantic 結構描述、函數呼叫
  • 為何如此出色: 將問答與實際操作(搜尋、CRUD、API)橋接起來
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
  • 結果: 用於結構化提取和操作的生產就緒模式。

4) 構建生產向量儲存庫(Postgres、Pinecone、Weaviate)

  • 最適合: 計劃擴展的團隊
  • 您將構建: 具有篩選器和混合搜尋的持久向量儲存
  • 主要概念: VectorStoreIndex 轉接器、混合 BM25+嵌入、中繼資料
  • 為何如此出色: 教導持久性、遷移和成本控制
提示:
  • 使用 Postgres/pgvector 進行簡單、經濟實惠的部署。
  • Pinecone/Weaviate 用於託管規模; 調整 ef_construction、ef_search。
  • 新增混合檢索以處理罕見術語和縮寫。

5) 使用代理進行查詢規劃和多步驟推理

  • 最適合: 複雜問題和多資料集搜尋
  • 您將構建: 將查詢分解為子查詢的規劃器
  • 主要概念: ReActAgent、SubQuestionQueryEngine、路由
  • 為何如此出色: 從「檢索然後回答」轉變為「思考然後搜尋」。
模式:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) 可觀察性和評估:追蹤、紮根和基準

  • 最適合: 任何交付實際應用程式的人
  • 您將構建: 偵測迴歸和幻覺的回饋迴路
  • 主要概念: LlamaIndex 評估、分級 QA、引文檢查、追蹤
  • 為何如此出色: 教導您在擴展之前衡量重要事項
檢查清單:
  • 使用追蹤記錄所有提示/回應。
  • 使用分級 QA 資料集進行迴歸測試。
  • 追蹤紮根和引文覆蓋率。

7) 用於多模態資料的 RAG(影像、表格、Markdown)

  • 最適合: 具有圖表、螢幕截圖和表格的文件
  • 您將構建: 從影像提取文字並對表格進行推理的管道
  • 主要概念: OCR + 版面配置剖析、表格分塊、多模態模型
  • 為何如此出色: 真實世界的文件很混亂; 本教學課程向您展示如何馴服它們。

8) 多租戶和檢索隔離

  • 最適合: SaaS 構建者
  • 您將構建: 一種 RAG 服務,其中每個客戶的資料都是隔離的
  • 主要概念: 命名空間、中繼資料防護、每個租戶的索引、RBAC
  • 為何如此出色: 預設情況下的安全性和隱私; 乾淨的升級路徑。

9) 大規模結構化提取(發票、日誌、合約)

  • 最適合: 營運、財務、法律工作流程
  • 您將構建: 具有結構描述驗證的確定性 JSON 輸出
  • 主要概念: Pydantic 結構描述、重試、工具增強驗證
  • 為何如此出色: 減少手動審查並使 LLM 輸出可靠。

10) 端到端生產模式:從筆記本到 CI/CD

  • 最適合: 轉向生產的團隊
  • 您將構建: 具有資料擷取、索引作業、評估和發布閘道的完整管道
  • 主要概念: 背景工作程式、排定的重新索引、功能標誌
  • 為何如此出色: 顯示如何自信地持續交付。

為您的目標選擇正確的 LlamaIndex 教學

使用此快速路由器來選擇您的下一步:
  • 「我今天需要結果。」 從快速入門(教學 1)開始,然後新增重新排序(教學 2)。
  • 「我想要操作,而不僅僅是答案。」 跳到函數呼叫和代理(教學 3 和 5)。
  • 「我們有規模和合規性需求。」 儲存 + 多租戶模式(教學 4 和 8)。
  • 「我們如何信任答案?」 評估和追蹤(教學 6)。
  • 「我們的文件以視覺效果為主。」 多模態 RAG(教學 7)。
  • 「我們需要結構化資料。」 使用結構描述和驗證器(教學 9)。

深入探討:您將在頂級 LlamaIndex 教學中看到的最佳實務

1) 分塊是產品決策

  • 權衡: 較大的分塊 = 更多上下文,但更高的權杖成本; 較小的分塊 = 更高的召回率,但含義分散。
  • 良好的預設值: 512–1024 個權杖,重疊約 10–20%。
  • 中繼資料很重要: 保留來源、頁面、章節、標題。

2) 檢索品質勝過模型大小

  • 重新排序: 新增交叉編碼器或嵌入重新排序器以獲得更好的 MRR。
  • 混合搜尋: 將 BM25 用於罕見術語,並將嵌入用於語義。
  • 篩選器: 按文件類型、日期或租戶縮小範圍以提高精確度。

3) 儘早評估,始終評估

  • 分級 QA: 建立一小組帶有引文的問答對。
  • 指標: 答案正確性、紮根、延遲和每次查詢的成本。
  • 安全地進行 A/B 測試: 在切換之前,以陰影方式部署新的分塊器或檢索器。

4) 優先考慮操作

  • 結構化輸出: 使用結構描述進行提取任務。
  • 工具: 將 API(搜尋、日曆、DB)包裝為代理呼叫的函數。
  • 防護欄: 驗證輸出、實作重試、記錄工具錯誤。

5) 成本和延遲衛生

  • 快取嵌入: 對文字進行重複資料刪除並在建置中重複使用向量。
  • 批次操作: 批量建立索引; 串流答案以改善 UX。
  • 更智慧的上下文: 不要過度填充提示,而是使用 top‑k + 重新排序。

使用最佳 LlamaIndex 教學的 7 天學習計畫

  • 第 1 天: 快速入門(教學 1)。 在 20 頁的 PDF 上構建聊天。 交付 CLI。
  • 第 2 天: 改善檢索(教學 2)。 新增重新排序器 + 混合搜尋。
  • 第 3 天: 新增函數呼叫(教學 3)。 為您的 API 中的常見問題建立工具。
  • 第 4 天: 移至實際的向量儲存庫(教學 4)。 在本機使用 pgvector。
  • 第 5 天: 引入規劃器(教學 5)。 在兩個索引之間路由問題。
  • 第 6 天: 新增評估(教學 6)。 建立 30 個問題的測試集和基準。
  • 第 7 天: 生產通行證(教學 10)。 背景作業、可觀察性、CI。

範例專案:使用 LlamaIndex 的「文件禮賓」

  • 目標: 一種安全的內部助理,可以回答有關流程文件的問題並開啟工單。
  • 堆疊: LlamaIndex、Postgres/pgvector、OpenAI/Anthropic、FastAPI、S3。
  • 步驟:
  1. 擷取 Confluence 匯出和 PDF(保留中繼資料 + ACL)。
  1. 以 768 個權杖分塊; 索引到 pgvector。
  1. 新增混合檢索和重新排序器。
  1. 建立工具:create_jira_ticket、lookup_oncall、fetch_policy。
  1. 使用 50 個精選問題新增評估; 衡量紮根。
  1. 使用串流 UI 和引文預覽進行部署。
  • 結果: 快速、引用的答案; 一鍵式任務自動化; 可衡量的準確性。

這些教學課程可協助您避免的常見錯誤

  • 跳過評估: 如果您不測試,您將交付迴歸。
  • 忽略中繼資料: 您將失去來源歸屬和路由能力。
  • 超大的分塊: 權杖膨脹會增加成本,而不會提供更好的答案。
  • 工具規格不足: 代理需要明確的輸入和確定性的輸出。
  • 沒有隔離: 多租戶 RAG 必須防止跨客戶洩漏。

補充 LlamaIndex 教學的工具

  • 向量儲存庫: pgvector、Pinecone、Weaviate、Qdrant
  • 重新排序器: Cohere Rerank、FlagEmbedding、Voyage rerank
  • 分塊器: 語義分割器、表格感知分割器
  • 評估: Ragas 風格的 QA、LlamaIndex 評估、自訂評分標準評分器
  • UI: Streamlit、Next.js、FastAPI websockets 用於串流權杖
順便說一句,如果您喜歡在瀏覽器中透過實作來學習,值得注意的是,Sider.ai 可讓您並排與程式碼、文件和網頁聊天。 您可以從 LlamaIndex 教學中貼上程式碼片段、執行提示並更快地迭代,這對於測試 RAG 提示和在您學習的同時提取結構化輸出非常方便。

要搜尋的內容:尋找最新的 LlamaIndex 教學

  • 「2025 年最佳 LlamaIndex 教學」
  • 「LlamaIndex 快速入門 RAG pdf」
  • 「LlamaIndex SubQuestionQueryEngine 範例」
  • 「LlamaIndex 評估紮根教學」
  • 「LlamaIndex pgvector Pinecone 指南」
  • 「LlamaIndex 代理函數呼叫範例」
尋找使用 Settings.llm、Settings.embed_model、VectorStoreIndex 和 as_query_engine 的最新程式碼,這些是目前的慣用語。

主要要點

  • 最好的 LlamaIndex 教學可協助您交付成果,而不僅僅是程式碼片段。
  • 從在文件上聊天開始,然後分層檢索品質、工具和評估。
  • 使用實際的向量儲存庫、新增規劃器以解決複雜問題,並不斷測試。
  • 小的架構選擇(分塊、重新排序、篩選器)比交換模型更能改變結果。
  • 當您遵循結構化的計畫並構建實際的東西時,學習會加速。

下一步

  • 從前三個教學中選擇一個,並立即構建一個最小的應用程式。
  • 在擴展使用者之前新增評估。
  • 規劃您的生產遷移:儲存、驗證、可觀察性和 CI。
  • 隨著範圍的擴大,重新造訪進階教學(代理、多模態、多租戶)。

常見問題

Q1:適合初學者的最佳 LlamaIndex 教學有哪些? 從使用 VectorStoreIndex 和 SimpleDirectoryReader 在您的 PDF 上構建聊天的快速入門開始。 然後新增一個關於分塊、中繼資料和重新排序的教學課程,以提高檢索品質。
Q2:如何使用 LlamaIndex 構建生產 RAG 應用程式? 遵循涵蓋向量儲存庫 (pgvector、Pinecone)、混合檢索和使用分級 QA 進行評估的教學課程。 新增追蹤、結構化輸出和 CI/CD 以從筆記本轉移到生產。
Q3:哪個 LlamaIndex 教學教導代理和工具使用? 尋找使用 ReAct 風格代理、QueryPipeline 和具有 Pydantic 結構描述的函數呼叫的指南。 這些教學課程展示瞭如何路由查詢、呼叫 API 和傳回結構化 JSON。
Q4:如何評估 LlamaIndex RAG 的準確性? 使用評估教學課程,這些教學課程介紹了紮根檢查、引文覆蓋率和分級 QA 資料集。 追蹤正確性、延遲和成本,以便在部署之前捕獲迴歸。
Q5:是否有適用於多模態文件的 LlamaIndex 教學? 是的,尋找將 OCR 和版面配置剖析結合用於影像和表格的教學課程,然後使用中繼資料為提取的文字建立索引。 它們展示瞭如何在 RAG 中處理圖表、螢幕截圖和複雜的 PDF。

最新文章
如何精通 ChatPDF:從密集文件中更快獲取洞見

如何精通 ChatPDF:從密集文件中更快獲取洞見

快速且準確文件的最佳 X 自動翻譯替代方案

快速且準確文件的最佳 X 自動翻譯替代方案

三星 AI 翻譯在伊朗無法使用?實用解決方法

三星 AI 翻譯在伊朗無法使用?實用解決方法

波斯語翻譯工具:加速且精準工作的實用指南

波斯語翻譯工具:加速且精準工作的實用指南

深度且具引用的研究最佳Grok替代方案

深度且具引用的研究最佳Grok替代方案

您真正會用到的 AI 圖像生成器 15 大功能

您真正會用到的 AI 圖像生成器 15 大功能