10 สุดยอดบทเรียน LlamaIndex เพื่อเชี่ยวชาญ RAG ในปี 2025
หากคุณเคยได้ยินว่า Retrieval-Augmented Generation (RAG) สามารถทำให้แอป LLM ของคุณฉลาดขึ้นได้ คุณคิดถูกแล้ว วิธีที่เร็วที่สุดในการสร้างผู้ช่วย AI ที่เชื่อถือได้และเหมือนการค้นหาในปัจจุบันคือการเรียนรู้ LlamaIndex ให้ดี และบทเรียน LlamaIndex ที่ดีที่สุดสามารถลดช่วงการเรียนรู้ของคุณจากหลายเดือนเหลือเพียงไม่กี่วัน
ในคู่มือนี้ เราคัดเลือกบทเรียน LlamaIndex ที่ดีที่สุดสำหรับทุกระดับ ตั้งแต่การเริ่มต้นอย่างรวดเร็วแบบคัดลอกและวาง ไปจนถึงไปป์ไลน์ระดับโปรดักชัน คุณจะพบวิดีโอแนะนำ โน้ตบุ๊กเชิงปฏิบัติ และสูตรขั้นสูงสำหรับข้อมูลแบบ Multi-Tenant, การดึงข้อมูลแบบมีโครงสร้าง, เอเจนต์ และการประเมินผล
เราจะจับคู่แต่ละบทเรียนกับทักษะหรือผลลัพธ์ที่คุณสนใจด้วย ไม่ว่าจะเป็นการสร้างแชทจากเอกสารของคุณ, การปรับขนาด Embedding, การเพิ่มเครื่องมือ, การสตรีมคำตอบ หรือการตรวจสอบผลลัพธ์
เมื่อถึงตอนท้าย คุณจะรู้ว่าควรเริ่มต้นด้วยบทเรียน LlamaIndex ใด ควรติดตามบทเรียนใดต่อไป และจะรวมบทเรียนเหล่านั้นเข้ากับผลิตภัณฑ์จริงได้อย่างไร
เหตุใดบทเรียน LlamaIndex จึงมีความสำคัญในขณะนี้
- RAG คือกาลปัจจุบันของแอป AI LLM สร้างภาพหลอน; RAG ให้คำตอบที่อิงตามข้อมูลของคุณ
- LlamaIndex คือสแต็ก RAG ที่สอดคล้องกันมากที่สุด มันครอบคลุมการจัดทำดัชนี, การดึงข้อมูล, การวางแผนคิวรี, การสังเกตการณ์ และการประเมินผล เป็นโมดูลที่สามารถประกอบกันได้ ซึ่งทำงานได้ดีกับ LangChain, OpenAI, Anthropic และ LLM แบบโอเพนซอร์ส
- บทเรียนคือเส้นทางลัดของคุณ บทเรียน LlamaIndex ที่ดีที่สุดไม่เพียงแต่แสดงโค้ดเท่านั้น แต่ยังแสดงถึงการตัดสินใจด้านสถาปัตยกรรมด้วย: การแบ่งส่วน, การจัดลำดับใหม่, การแคช และ Guardrail
หากเป้าหมายของคุณคือ: “แชทกับเอกสารของฉันและอย่าสร้างภาพหลอน” รายการนี้จะช่วยให้คุณไปถึงจุดนั้นได้
วิธีที่เราเลือกบทเรียน LlamaIndex ที่ดีที่สุด
- มุ่งเน้นผลลัพธ์: คุณควรส่งมอบสิ่งที่เป็นประโยชน์หลังจากแต่ละบทเรียน
- อัปเดตล่าสุดสำหรับปี 2025: สะท้อนถึง API ของ LlamaIndex ในปัจจุบัน (เช่น
VectorStoreIndex, Settings, QueryPipeline, ReActAgent)
- ตระหนักถึงการผลิต: แสดงการประเมินผล, การติดตาม และการทำซ้ำ นอกเหนือจาก Hello World
- ความกว้าง + ความลึก: ตั้งแต่การเริ่มต้นอย่างรวดเร็วไปจนถึงเอเจนต์, Multimodal และการดึงข้อมูลแบบมีโครงสร้าง
10 สุดยอดบทเรียน LlamaIndex (คัดเลือกมาอย่างดี)
ด้านล่างนี้คือเส้นทางที่คัดสรรมา เริ่มต้นที่ระดับของคุณ; ข้ามไปตามต้องการ
1) การเริ่มต้นอย่างรวดเร็วใน 15 นาที: แชทจากไฟล์ PDF ของคุณ
- เหมาะสำหรับ: ผู้เริ่มต้นและผู้จัดการผลิตภัณฑ์
- สิ่งที่คุณจะได้สร้าง: อัปโหลดไฟล์ PDF, จัดทำดัชนี, ถามคำถาม, รับการอ้างอิง
- แนวคิดหลัก:
SimpleDirectoryReader, VectorStoreIndex, Settings, Embeddings
- เหตุผลที่ยอดเยี่ยม: โค้ดน้อยที่สุด, ช่วงเวลา "อ๋อ!" สูงสุด
ตัวอย่างโครงสร้าง:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- สิ่งที่คุณจะได้เรียนรู้ต่อไป: ขนาด Chunk, Top‑k และเหตุผลที่การจัดลำดับใหม่มีความสำคัญ
2) หลักการพื้นฐานของ RAG ด้วยการแบ่งส่วน, Metadata และการจัดลำดับใหม่
- เหมาะสำหรับ: ผู้เริ่มต้น → ระดับกลาง
- สิ่งที่คุณจะได้สร้าง: ตัวดึงข้อมูลที่ฉลาดกว่าด้วยคุณภาพบริบทที่ดีขึ้น
- แนวคิดหลัก:
SentenceSplitter, ตัวกรอง Metadata, คอมโพเนนต์ Rerank
- เหตุผลที่ยอดเยี่ยม: แสดงให้เห็นว่าการปรับแต่งเพียงเล็กน้อยสามารถลดภาพหลอนได้อย่างมาก
ลอง:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- ผลลัพธ์: หน้าต่างบริบทคุณภาพสูงขึ้นสำหรับเอกสารขนาดยาว
3) LlamaIndex + OpenAI Function Calling (การใช้เครื่องมือ & เอาต์พุตแบบมีโครงสร้าง)
- เหมาะสำหรับ: ผู้สร้างที่ทำให้เวิร์กโฟลว์เป็นอัตโนมัติ
- สิ่งที่คุณจะได้สร้าง: เอเจนต์ที่เรียกเครื่องมือและส่งคืน Schema JSON
- แนวคิดหลัก:
QueryPipeline, Tool Spec, Schema Pydantic, Function Calling
- เหตุผลที่ยอดเยี่ยม: เชื่อม Q&A กับการกระทำจริง (การค้นหา, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- ผลลัพธ์: รูปแบบที่พร้อมสำหรับการผลิตสำหรับการดึงข้อมูลแบบมีโครงสร้างและการดำเนินการ
4) การสร้าง Vector Store ระดับโปรดักชัน (Postgres, Pinecone, Weaviate)
- เหมาะสำหรับ: ทีมที่วางแผนจะปรับขนาด
- สิ่งที่คุณจะได้สร้าง: ที่เก็บข้อมูล Vector ที่ทนทานพร้อมตัวกรองและการค้นหาแบบ Hybrid
- แนวคิดหลัก: อะแดปเตอร์
VectorStoreIndex, Hybrid BM25+Embeddings, Metadata
- เหตุผลที่ยอดเยี่ยม: สอนเรื่องความคงทน, การโยกย้าย และการควบคุมต้นทุน
เคล็ดลับ:
- ใช้ Postgres/pgvector สำหรับการปรับใช้ที่เรียบง่ายและราคาไม่แพง
- Pinecone/Weaviate สำหรับการปรับขนาดที่มีการจัดการ; ปรับ
ef_construction, ef_search.
- เพิ่มการดึงข้อมูลแบบ Hybrid เพื่อจัดการกับคำศัพท์และตัวย่อที่หายาก
5) การวางแผนคิวรีและการให้เหตุผลแบบหลายขั้นตอนด้วยเอเจนต์
- เหมาะสำหรับ: คำถามที่ซับซ้อนและการค้นหาแบบ Multi‑Dataset
- สิ่งที่คุณจะได้สร้าง: Planner ที่แยกคิวรีออกเป็นคิวรีย่อย
- แนวคิดหลัก:
ReActAgent, SubQuestionQueryEngine, การกำหนดเส้นทาง
- เหตุผลที่ยอดเยี่ยม: ก้าวข้าม "ดึงข้อมูลแล้วตอบ" ไปสู่ "คิดแล้วค้นหา"
รูปแบบ:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) การสังเกตการณ์และการประเมินผล: การติดตาม, Groundedness และเกณฑ์มาตรฐาน
- เหมาะสำหรับ: ทุกคนที่ส่งมอบแอปจริง
- สิ่งที่คุณจะได้สร้าง: ลูปข้อเสนอแนะเพื่อตรวจจับการถดถอยและภาพหลอน
- แนวคิดหลัก: LlamaIndex Evals, Graded QA, การตรวจสอบการอ้างอิง, การติดตาม
- เหตุผลที่ยอดเยี่ยม: สอนให้คุณวัดสิ่งที่สำคัญก่อนที่จะปรับขนาด
รายการตรวจสอบ:
- บันทึก Prompts/Responses ทั้งหมดด้วยการติดตาม
- ใช้ชุดข้อมูล Graded QA สำหรับการทดสอบการถดถอย
- ติดตาม Groundedness และ Citation Coverage
7) RAG สำหรับข้อมูล Multimodal (รูปภาพ, ตาราง, Markdown)
- เหมาะสำหรับ: เอกสารที่มีแผนภูมิ, ภาพหน้าจอ และตาราง
- สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ที่ดึงข้อความจากรูปภาพและให้เหตุผลเหนือตาราง
- แนวคิดหลัก: OCR + การแยกวิเคราะห์ Layout, การแบ่งส่วนตาราง, โมเดล Multimodal
- เหตุผลที่ยอดเยี่ยม: เอกสารในโลกแห่งความเป็นจริงนั้นยุ่งเหยิง; บทเรียนนี้แสดงให้เห็นว่าคุณจะทำให้พวกมันเชื่องได้อย่างไร
8) Multi‑Tenant และการแยกการดึงข้อมูล
- เหมาะสำหรับ: ผู้สร้าง SaaS
- สิ่งที่คุณจะได้สร้าง: บริการ RAG ที่ข้อมูลของลูกค้าแต่ละรายถูกแยกออกจากกัน
- แนวคิดหลัก: Namespace, Metadata Guards, ดัชนีต่อผู้เช่า, RBAC
- เหตุผลที่ยอดเยี่ยม: ความปลอดภัยและความเป็นส่วนตัวโดยการออกแบบ; เส้นทางการอัปเกรดที่สะอาด
9) การดึงข้อมูลแบบมีโครงสร้างในระดับใหญ่ (ใบแจ้งหนี้, บันทึก, สัญญา)
- เหมาะสำหรับ: การดำเนินงาน, การเงิน, เวิร์กโฟลว์ทางกฎหมาย
- สิ่งที่คุณจะได้สร้าง: เอาต์พุต JSON ที่แน่นอนพร้อมการตรวจสอบ Schema
- แนวคิดหลัก: Schema Pydantic, การลองใหม่, การตรวจสอบที่เพิ่มประสิทธิภาพด้วยเครื่องมือ
- เหตุผลที่ยอดเยี่ยม: ลดการตรวจสอบด้วยตนเองและทำให้เอาต์พุต LLM เชื่อถือได้
10) รูปแบบการผลิตแบบ End‑to‑End: จากโน้ตบุ๊กไปสู่ CI/CD
- เหมาะสำหรับ: ทีมที่กำลังย้ายไปสู่การผลิต
- สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์เต็มรูปแบบพร้อมการนำเข้าข้อมูล, งานจัดทำดัชนี, การประเมินผล และ Release Gates
- แนวคิดหลัก: Background Workers, การจัดทำดัชนีใหม่ตามกำหนดเวลา, Feature Flags
- เหตุผลที่ยอดเยี่ยม: แสดงให้เห็นวิธีการจัดส่งอย่างต่อเนื่องด้วยความมั่นใจ
การเลือกบทเรียน LlamaIndex ที่เหมาะสมกับเป้าหมายของคุณ
ใช้ Router ด่วนนี้เพื่อเลือกขั้นตอนต่อไปของคุณ:
- “ฉันต้องการผลลัพธ์วันนี้” เริ่มต้นด้วยการเริ่มต้นอย่างรวดเร็ว (บทเรียน #1) จากนั้นเพิ่มการจัดลำดับใหม่ (บทเรียน #2)
- “ฉันต้องการการกระทำ ไม่ใช่แค่คำตอบ” ไปที่ Function Calling และเอเจนต์ (บทเรียน #3 และ #5)
- “เรามีความต้องการด้านขนาดและการปฏิบัติตามข้อกำหนด” รูปแบบ Storage + Multi‑Tenant (บทเรียน #4 และ #8)
- “เราจะเชื่อใจคำตอบได้อย่างไร” Evals และการติดตาม (บทเรียน #6)
- “เอกสารของเราเน้นภาพเป็นหลัก” Multimodal RAG (บทเรียน #7)
- “เราต้องการข้อมูลที่มีโครงสร้าง” ใช้ Schema และ Validator (บทเรียน #9)
เจาะลึก: แนวทางปฏิบัติที่ดีที่สุดที่คุณจะเห็นในบทเรียน LlamaIndex ชั้นนำ
1) การแบ่งส่วนคือการตัดสินใจเกี่ยวกับผลิตภัณฑ์
- ข้อดีข้อเสีย: Chunk ที่ใหญ่กว่า = บริบทมากขึ้น แต่ต้นทุนโทเค็นสูงขึ้น Chunk ที่เล็กลง = การเรียกคืนที่สูงขึ้น แต่ความหมายกระจัดกระจาย
- ค่าเริ่มต้นที่ดี: 512–1024 โทเค็น โดยมีช่วงทับซ้อน ~10–20%
- Metadata มีความสำคัญ: รักษาส่วนที่มา, หน้า, ส่วน, หัวข้อ
2) คุณภาพการดึงข้อมูลดีกว่าขนาดโมเดล
- การจัดลำดับใหม่: เพิ่ม Cross‑Encoder หรือ Embedding Reranker เพื่อ MRR ที่ดีขึ้น
- การค้นหาแบบ Hybrid: รวม BM25 สำหรับคำศัพท์ที่หายากเข้ากับ Embedding สำหรับความหมาย
- ตัวกรอง: จำกัดให้แคบลงตามประเภทเอกสาร, วันที่ หรือผู้เช่า เพื่อปรับปรุงความแม่นยำ
3) ประเมินผลตั้งแต่เนิ่นๆ ประเมินผลเสมอ
- Graded QA: สร้างชุดคำถาม–คำตอบขนาดเล็กพร้อมการอ้างอิง
- เมตริก: ความถูกต้องของคำตอบ, Groundedness, เวลาแฝง และต้นทุนต่อคิวรี
- A/B อย่างปลอดภัย: Shadow Deploy การแบ่งส่วนหรือตัวดึงข้อมูลใหม่ก่อนที่จะตัด
4) ทำให้การกระทำเป็น First‑Class
- เอาต์พุตแบบมีโครงสร้าง: ใช้ Schema สำหรับงานดึงข้อมูล
- เครื่องมือ: ห่อ API (การค้นหา, ปฏิทิน, DB) เป็นฟังก์ชันเพื่อให้เอเจนต์เรียก
- Guardrail: ตรวจสอบความถูกต้องของเอาต์พุต, Implement การลองใหม่, บันทึกข้อผิดพลาดของเครื่องมือ
5) สุขอนามัยด้านต้นทุนและเวลาแฝง
- Cache Embeddings: Deduplicate ข้อความและนำ Vector กลับมาใช้ใหม่ในการสร้าง
- การดำเนินการแบบ Batch: จัดทำดัชนีเป็นกลุ่ม; สตรีมคำตอบเพื่อปรับปรุง UX
- บริบทที่ชาญฉลาดกว่า: อย่าใส่ Prompt มากเกินไป—Top‑k + Rerank แทน
แผนการเรียนรู้ 7 วันโดยใช้บทเรียน LlamaIndex ที่ดีที่สุด
- วันที่ 1: การเริ่มต้นอย่างรวดเร็ว (บทเรียน #1) สร้างแชทจากไฟล์ PDF 20 หน้า ส่งมอบ CLI
- วันที่ 2: ปรับปรุงการดึงข้อมูล (บทเรียน #2) เพิ่ม Reranker + การค้นหาแบบ Hybrid
- วันที่ 3: เพิ่ม Function Calling (บทเรียน #3) สร้างเครื่องมือสำหรับคำถามที่พบบ่อยใน API ของคุณ
- วันที่ 4: ย้ายไปยัง Vector Store จริง (บทเรียน #4) ใช้ pgvector ในเครื่อง
- วันที่ 5: แนะนำ Planner (บทเรียน #5) กำหนดเส้นทางคำถามข้ามสองดัชนี
- วันที่ 6: เพิ่มการประเมินผล (บทเรียน #6) สร้างชุดทดสอบ 30 คำถามและ Baseline
- วันที่ 7: Production Pass (บทเรียน #10) งาน Background, การสังเกตการณ์, CI
ตัวอย่างโครงการ: "Docs Concierge" ด้วย LlamaIndex
- เป้าหมาย: ผู้ช่วยภายในที่ปลอดภัยซึ่งตอบคำถามเกี่ยวกับเอกสารกระบวนการและเปิด Ticket
- สแต็ก: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3
- นำเข้า Confluence Exports และไฟล์ PDF (เก็บ Metadata + ACL)
- Chunk ที่ 768 โทเค็น; จัดทำดัชนีไปยัง pgvector
- เพิ่มการดึงข้อมูลแบบ Hybrid และ Reranker
- สร้างเครื่องมือ:
Create_jira_ticket, Lookup_oncall, Fetch_policy.
- เพิ่มการประเมินผลด้วย 50 คำถามที่คัดสรรมา; วัด Groundedness
- ปรับใช้กับ Streaming UI และ Citation Previews
- ผลลัพธ์: คำตอบที่รวดเร็วและมีการอ้างอิง; ระบบอัตโนมัติของงานด้วยคลิกเดียว; ความแม่นยำที่วัดได้
ข้อผิดพลาดทั่วไปที่บทเรียนเหล่านี้ช่วยให้คุณหลีกเลี่ยงได้
- ข้ามการประเมินผล: หากคุณไม่ทดสอบ คุณจะส่งมอบการถดถอย
- ละเลย Metadata: คุณจะสูญเสียการระบุแหล่งที่มาและพลังการกำหนดเส้นทาง
- Chunk ขนาดใหญ่เกินไป: Token Bloat เพิ่มต้นทุนโดยไม่มีคำตอบที่ดีกว่า
- ระบุเครื่องมือไม่ครบถ้วน: เอเจนต์ต้องการอินพุตที่ชัดเจนและเอาต์พุตที่แน่นอน
- ไม่มีการแยก: Multi‑Tenant RAG ต้องป้องกันการรั่วไหลข้ามลูกค้า
เครื่องมือที่เสริมบทเรียน LlamaIndex
- Vector Store: pgvector, Pinecone, Weaviate, Qdrant
- Reranker: Cohere Rerank, FlagEmbedding, Voyage Rerank
- Chunker: Semantic Splitter, Table-Aware Splitter
- Evals: Ragas-Style QA, LlamaIndex Evals, Custom Rubric Graders
- UI: Streamlit, Next.js, FastAPI Websockets สำหรับ Streaming Tokens
อนึ่ง หากคุณชอบเรียนรู้โดยการลงมือปฏิบัติจริงภายในเบราว์เซอร์ของคุณ ควรสังเกตว่า Sider.ai ช่วยให้คุณแชทกับโค้ด, เอกสาร และหน้าเว็บแบบเคียงข้างกันได้ คุณสามารถวาง Snippet จากบทเรียน LlamaIndex เรียกใช้ Prompts และทำซ้ำได้เร็วขึ้น ซึ่งเป็นประโยชน์สำหรับการทดสอบ RAG Prompts และการดึงเอาต์พุตแบบมีโครงสร้างในขณะที่คุณติดตาม สิ่งที่จะค้นหา: การค้นหาบทเรียน LlamaIndex ที่ทันสมัย
- “บทเรียน LlamaIndex ที่ดีที่สุด 2025”
- “LlamaIndex Quickstart RAG PDF”
- “ตัวอย่าง LlamaIndex SubQuestionQueryEngine”
- “บทเรียน Groundedness การประเมินผล LlamaIndex”
- “คู่มือ LlamaIndex pgvector Pinecone”
- “ตัวอย่าง Function Calling ของ LlamaIndex Agents”
มองหาโค้ดล่าสุดที่ใช้ Settings.llm, Settings.embed_model, VectorStoreIndex และ As_query_engine—นี่คือสำนวนปัจจุบัน
ประเด็นสำคัญ
- บทเรียน LlamaIndex ที่ดีที่สุดช่วยให้คุณส่งมอบผลลัพธ์ ไม่ใช่แค่ Snippet โค้ด
- เริ่มต้นด้วยการแชทจากเอกสาร จากนั้นใส่คุณภาพการดึงข้อมูล เครื่องมือ และการประเมินผล
- ใช้ Vector Store จริง เพิ่ม Planner สำหรับคำถามที่ซับซ้อน และทดสอบอย่างไม่หยุดหย่อน
- ตัวเลือกทางสถาปัตยกรรมขนาดเล็ก—การแบ่งส่วน, การจัดลำดับใหม่, ตัวกรอง—เปลี่ยนผลลัพธ์มากกว่าการสลับโมเดล
- การเรียนรู้จะเร็วขึ้นเมื่อคุณทำตามแผนที่มีโครงสร้างและสร้างสิ่งที่จับต้องได้
อะไรต่อไป
- เลือกหนึ่งบทเรียนจากสามอันดับแรกและสร้างแอปขั้นต่ำในวันนี้
- เพิ่มการประเมินผลก่อนที่คุณจะปรับขนาดผู้ใช้
- วางแผนการโยกย้ายการผลิตของคุณ: Storage, Auth, การสังเกตการณ์ และ CI
- กลับมาดูบทเรียนขั้นสูง (เอเจนต์, Multimodal, Multi‑Tenant) เมื่อขอบเขตของคุณเติบโตขึ้น
คำถามที่พบบ่อย
Q1: บทเรียน LlamaIndex ที่ดีที่สุดสำหรับผู้เริ่มต้นคืออะไร?
เริ่มต้นด้วยการเริ่มต้นอย่างรวดเร็วที่สร้างแชทจากไฟล์ PDF ของคุณโดยใช้ VectorStoreIndex และ SimpleDirectoryReader จากนั้นเพิ่มบทเรียนเกี่ยวกับการแบ่งส่วน, Metadata และการจัดลำดับใหม่เพื่อเพิ่มคุณภาพการดึงข้อมูล
Q2: ฉันจะสร้างแอป RAG ระดับโปรดักชันด้วย LlamaIndex ได้อย่างไร?
ทำตามบทเรียนที่ครอบคลุม Vector Store (pgvector, Pinecone), การดึงข้อมูลแบบ Hybrid และการประเมินผลด้วย Graded QA เพิ่มการติดตาม, เอาต์พุตแบบมีโครงสร้าง และ CI/CD เพื่อย้ายจากโน้ตบุ๊กไปสู่การผลิต
Q3: บทเรียน LlamaIndex ใดที่สอนเรื่องเอเจนต์และการใช้เครื่องมือ
มองหาคู่มือที่ใช้เอเจนต์สไตล์ ReAct, QueryPipeline และ Function Calling ด้วย Schema Pydantic บทเรียนเหล่านี้แสดงวิธีการกำหนดเส้นทางคิวรี เรียก API และส่งคืน JSON ที่มีโครงสร้าง
Q4: ฉันจะประเมินความแม่นยำของ LlamaIndex RAG ได้อย่างไร
ใช้บทเรียนการประเมินผลที่แนะนำการตรวจสอบ Groundedness, Citation Coverage และชุดข้อมูล Graded QA ติดตามความถูกต้อง, เวลาแฝง และต้นทุนเพื่อจับการถดถอยก่อนที่จะปรับใช้
Q5: มีบทเรียน LlamaIndex สำหรับเอกสาร Multimodal หรือไม่?
มี มองหาบทเรียนที่รวม OCR และการแยกวิเคราะห์ Layout สำหรับรูปภาพและตาราง จากนั้นจัดทำดัชนีข้อความที่ดึงออกมาพร้อม Metadata พวกเขาแสดงวิธีการจัดการกับแผนภูมิ, ภาพหน้าจอ และไฟล์ PDF ที่ซับซ้อนใน RAG