What are the best LlamaIndex tutorials for beginners?

Start with a quickstart that builds chat over your PDFs using VectorStoreIndex and SimpleDirectoryReader. Then add a tutorial on chunking, metadata, and reranking to boost retrieval quality.

How do I build a production RAG app with LlamaIndex?

Follow tutorials that cover vector stores (pgvector, Pinecone), hybrid retrieval, and evaluation with graded QA. Add tracing, structured outputs, and CI/CD to move from notebooks to production.

Which LlamaIndex tutorial teaches agents and tool use?

Look for guides using ReAct-style agents, QueryPipeline, and function calling with Pydantic schemas. These tutorials show how to route queries, call APIs, and return structured JSON.

How can I evaluate LlamaIndex RAG accuracy?

Use evaluation tutorials that introduce groundedness checks, citation coverage, and graded QA datasets. Track correctness, latency, and cost to catch regressions before deploying.

Are there LlamaIndex tutorials for multimodal documents?

Yes, seek tutorials that combine OCR and layout parsing for images and tables, then index the extracted text with metadata. They show how to handle charts, screenshots, and complex PDFs in RAG.

10 สุดยอดบทเรียน LlamaIndex เพื่อเชี่ยวชาญ RAG ในปี 2025

หากคุณเคยได้ยินว่า Retrieval-Augmented Generation (RAG) สามารถทำให้แอป LLM ของคุณฉลาดขึ้นได้ คุณคิดถูกแล้ว วิธีที่เร็วที่สุดในการสร้างผู้ช่วย AI ที่เชื่อถือได้และเหมือนการค้นหาในปัจจุบันคือการเรียนรู้ LlamaIndex ให้ดี และบทเรียน LlamaIndex ที่ดีที่สุดสามารถลดช่วงการเรียนรู้ของคุณจากหลายเดือนเหลือเพียงไม่กี่วัน

ในคู่มือนี้ เราคัดเลือกบทเรียน LlamaIndex ที่ดีที่สุดสำหรับทุกระดับ ตั้งแต่การเริ่มต้นอย่างรวดเร็วแบบคัดลอกและวาง ไปจนถึงไปป์ไลน์ระดับโปรดักชัน คุณจะพบวิดีโอแนะนำ โน้ตบุ๊กเชิงปฏิบัติ และสูตรขั้นสูงสำหรับข้อมูลแบบ Multi-Tenant, การดึงข้อมูลแบบมีโครงสร้าง, เอเจนต์ และการประเมินผล

เราจะจับคู่แต่ละบทเรียนกับทักษะหรือผลลัพธ์ที่คุณสนใจด้วย ไม่ว่าจะเป็นการสร้างแชทจากเอกสารของคุณ, การปรับขนาด Embedding, การเพิ่มเครื่องมือ, การสตรีมคำตอบ หรือการตรวจสอบผลลัพธ์

เมื่อถึงตอนท้าย คุณจะรู้ว่าควรเริ่มต้นด้วยบทเรียน LlamaIndex ใด ควรติดตามบทเรียนใดต่อไป และจะรวมบทเรียนเหล่านั้นเข้ากับผลิตภัณฑ์จริงได้อย่างไร

เหตุใดบทเรียน LlamaIndex จึงมีความสำคัญในขณะนี้

RAG คือกาลปัจจุบันของแอป AI LLM สร้างภาพหลอน; RAG ให้คำตอบที่อิงตามข้อมูลของคุณ

LlamaIndex คือสแต็ก RAG ที่สอดคล้องกันมากที่สุด มันครอบคลุมการจัดทำดัชนี, การดึงข้อมูล, การวางแผนคิวรี, การสังเกตการณ์ และการประเมินผล เป็นโมดูลที่สามารถประกอบกันได้ ซึ่งทำงานได้ดีกับ LangChain, OpenAI, Anthropic และ LLM แบบโอเพนซอร์ส

บทเรียนคือเส้นทางลัดของคุณ บทเรียน LlamaIndex ที่ดีที่สุดไม่เพียงแต่แสดงโค้ดเท่านั้น แต่ยังแสดงถึงการตัดสินใจด้านสถาปัตยกรรมด้วย: การแบ่งส่วน, การจัดลำดับใหม่, การแคช และ Guardrail

หากเป้าหมายของคุณคือ: “แชทกับเอกสารของฉันและอย่าสร้างภาพหลอน” รายการนี้จะช่วยให้คุณไปถึงจุดนั้นได้

วิธีที่เราเลือกบทเรียน LlamaIndex ที่ดีที่สุด

มุ่งเน้นผลลัพธ์: คุณควรส่งมอบสิ่งที่เป็นประโยชน์หลังจากแต่ละบทเรียน

อัปเดตล่าสุดสำหรับปี 2025: สะท้อนถึง API ของ LlamaIndex ในปัจจุบัน (เช่น VectorStoreIndex, Settings, QueryPipeline, ReActAgent)

ตระหนักถึงการผลิต: แสดงการประเมินผล, การติดตาม และการทำซ้ำ นอกเหนือจาก Hello World

ความกว้าง + ความลึก: ตั้งแต่การเริ่มต้นอย่างรวดเร็วไปจนถึงเอเจนต์, Multimodal และการดึงข้อมูลแบบมีโครงสร้าง

10 สุดยอดบทเรียน LlamaIndex (คัดเลือกมาอย่างดี)

ด้านล่างนี้คือเส้นทางที่คัดสรรมา เริ่มต้นที่ระดับของคุณ; ข้ามไปตามต้องการ

1) การเริ่มต้นอย่างรวดเร็วใน 15 นาที: แชทจากไฟล์ PDF ของคุณ

เหมาะสำหรับ: ผู้เริ่มต้นและผู้จัดการผลิตภัณฑ์

สิ่งที่คุณจะได้สร้าง: อัปโหลดไฟล์ PDF, จัดทำดัชนี, ถามคำถาม, รับการอ้างอิง

แนวคิดหลัก: SimpleDirectoryReader, VectorStoreIndex, Settings, Embeddings

เหตุผลที่ยอดเยี่ยม: โค้ดน้อยที่สุด, ช่วงเวลา "อ๋อ!" สูงสุด

ตัวอย่างโครงสร้าง:

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)

สิ่งที่คุณจะได้เรียนรู้ต่อไป: ขนาด Chunk, Top‑k และเหตุผลที่การจัดลำดับใหม่มีความสำคัญ

2) หลักการพื้นฐานของ RAG ด้วยการแบ่งส่วน, Metadata และการจัดลำดับใหม่

เหมาะสำหรับ: ผู้เริ่มต้น → ระดับกลาง

สิ่งที่คุณจะได้สร้าง: ตัวดึงข้อมูลที่ฉลาดกว่าด้วยคุณภาพบริบทที่ดีขึ้น

แนวคิดหลัก: SentenceSplitter, ตัวกรอง Metadata, คอมโพเนนต์ Rerank

เหตุผลที่ยอดเยี่ยม: แสดงให้เห็นว่าการปรับแต่งเพียงเล็กน้อยสามารถลดภาพหลอนได้อย่างมาก

ลอง:

from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)

ผลลัพธ์: หน้าต่างบริบทคุณภาพสูงขึ้นสำหรับเอกสารขนาดยาว

3) LlamaIndex + OpenAI Function Calling (การใช้เครื่องมือ & เอาต์พุตแบบมีโครงสร้าง)

เหมาะสำหรับ: ผู้สร้างที่ทำให้เวิร์กโฟลว์เป็นอัตโนมัติ

สิ่งที่คุณจะได้สร้าง: เอเจนต์ที่เรียกเครื่องมือและส่งคืน Schema JSON

แนวคิดหลัก: QueryPipeline, Tool Spec, Schema Pydantic, Function Calling

เหตุผลที่ยอดเยี่ยม: เชื่อม Q&A กับการกระทำจริง (การค้นหา, CRUD, API)

from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))

ผลลัพธ์: รูปแบบที่พร้อมสำหรับการผลิตสำหรับการดึงข้อมูลแบบมีโครงสร้างและการดำเนินการ

4) การสร้าง Vector Store ระดับโปรดักชัน (Postgres, Pinecone, Weaviate)

เหมาะสำหรับ: ทีมที่วางแผนจะปรับขนาด

สิ่งที่คุณจะได้สร้าง: ที่เก็บข้อมูล Vector ที่ทนทานพร้อมตัวกรองและการค้นหาแบบ Hybrid

แนวคิดหลัก: อะแดปเตอร์ VectorStoreIndex, Hybrid BM25+Embeddings, Metadata

เหตุผลที่ยอดเยี่ยม: สอนเรื่องความคงทน, การโยกย้าย และการควบคุมต้นทุน

เคล็ดลับ:

ใช้ Postgres/pgvector สำหรับการปรับใช้ที่เรียบง่ายและราคาไม่แพง

Pinecone/Weaviate สำหรับการปรับขนาดที่มีการจัดการ; ปรับ ef_construction, ef_search.

เพิ่มการดึงข้อมูลแบบ Hybrid เพื่อจัดการกับคำศัพท์และตัวย่อที่หายาก

5) การวางแผนคิวรีและการให้เหตุผลแบบหลายขั้นตอนด้วยเอเจนต์

เหมาะสำหรับ: คำถามที่ซับซ้อนและการค้นหาแบบ Multi‑Dataset

สิ่งที่คุณจะได้สร้าง: Planner ที่แยกคิวรีออกเป็นคิวรีย่อย

แนวคิดหลัก: ReActAgent, SubQuestionQueryEngine, การกำหนดเส้นทาง

เหตุผลที่ยอดเยี่ยม: ก้าวข้าม "ดึงข้อมูลแล้วตอบ" ไปสู่ "คิดแล้วค้นหา"

รูปแบบ:

from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) การสังเกตการณ์และการประเมินผล: การติดตาม, Groundedness และเกณฑ์มาตรฐาน

เหมาะสำหรับ: ทุกคนที่ส่งมอบแอปจริง

สิ่งที่คุณจะได้สร้าง: ลูปข้อเสนอแนะเพื่อตรวจจับการถดถอยและภาพหลอน

แนวคิดหลัก: LlamaIndex Evals, Graded QA, การตรวจสอบการอ้างอิง, การติดตาม

เหตุผลที่ยอดเยี่ยม: สอนให้คุณวัดสิ่งที่สำคัญก่อนที่จะปรับขนาด

รายการตรวจสอบ:

บันทึก Prompts/Responses ทั้งหมดด้วยการติดตาม

ใช้ชุดข้อมูล Graded QA สำหรับการทดสอบการถดถอย

ติดตาม Groundedness และ Citation Coverage

7) RAG สำหรับข้อมูล Multimodal (รูปภาพ, ตาราง, Markdown)

เหมาะสำหรับ: เอกสารที่มีแผนภูมิ, ภาพหน้าจอ และตาราง

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ที่ดึงข้อความจากรูปภาพและให้เหตุผลเหนือตาราง

แนวคิดหลัก: OCR + การแยกวิเคราะห์ Layout, การแบ่งส่วนตาราง, โมเดล Multimodal

เหตุผลที่ยอดเยี่ยม: เอกสารในโลกแห่งความเป็นจริงนั้นยุ่งเหยิง; บทเรียนนี้แสดงให้เห็นว่าคุณจะทำให้พวกมันเชื่องได้อย่างไร

8) Multi‑Tenant และการแยกการดึงข้อมูล

เหมาะสำหรับ: ผู้สร้าง SaaS

สิ่งที่คุณจะได้สร้าง: บริการ RAG ที่ข้อมูลของลูกค้าแต่ละรายถูกแยกออกจากกัน

แนวคิดหลัก: Namespace, Metadata Guards, ดัชนีต่อผู้เช่า, RBAC

เหตุผลที่ยอดเยี่ยม: ความปลอดภัยและความเป็นส่วนตัวโดยการออกแบบ; เส้นทางการอัปเกรดที่สะอาด

9) การดึงข้อมูลแบบมีโครงสร้างในระดับใหญ่ (ใบแจ้งหนี้, บันทึก, สัญญา)

เหมาะสำหรับ: การดำเนินงาน, การเงิน, เวิร์กโฟลว์ทางกฎหมาย

สิ่งที่คุณจะได้สร้าง: เอาต์พุต JSON ที่แน่นอนพร้อมการตรวจสอบ Schema

แนวคิดหลัก: Schema Pydantic, การลองใหม่, การตรวจสอบที่เพิ่มประสิทธิภาพด้วยเครื่องมือ

เหตุผลที่ยอดเยี่ยม: ลดการตรวจสอบด้วยตนเองและทำให้เอาต์พุต LLM เชื่อถือได้

10) รูปแบบการผลิตแบบ End‑to‑End: จากโน้ตบุ๊กไปสู่ CI/CD

เหมาะสำหรับ: ทีมที่กำลังย้ายไปสู่การผลิต

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์เต็มรูปแบบพร้อมการนำเข้าข้อมูล, งานจัดทำดัชนี, การประเมินผล และ Release Gates

แนวคิดหลัก: Background Workers, การจัดทำดัชนีใหม่ตามกำหนดเวลา, Feature Flags

เหตุผลที่ยอดเยี่ยม: แสดงให้เห็นวิธีการจัดส่งอย่างต่อเนื่องด้วยความมั่นใจ

การเลือกบทเรียน LlamaIndex ที่เหมาะสมกับเป้าหมายของคุณ

ใช้ Router ด่วนนี้เพื่อเลือกขั้นตอนต่อไปของคุณ:

“ฉันต้องการผลลัพธ์วันนี้” เริ่มต้นด้วยการเริ่มต้นอย่างรวดเร็ว (บทเรียน #1) จากนั้นเพิ่มการจัดลำดับใหม่ (บทเรียน #2)

“ฉันต้องการการกระทำ ไม่ใช่แค่คำตอบ” ไปที่ Function Calling และเอเจนต์ (บทเรียน #3 และ #5)

“เรามีความต้องการด้านขนาดและการปฏิบัติตามข้อกำหนด” รูปแบบ Storage + Multi‑Tenant (บทเรียน #4 และ #8)

“เราจะเชื่อใจคำตอบได้อย่างไร” Evals และการติดตาม (บทเรียน #6)

“เอกสารของเราเน้นภาพเป็นหลัก” Multimodal RAG (บทเรียน #7)

“เราต้องการข้อมูลที่มีโครงสร้าง” ใช้ Schema และ Validator (บทเรียน #9)

เจาะลึก: แนวทางปฏิบัติที่ดีที่สุดที่คุณจะเห็นในบทเรียน LlamaIndex ชั้นนำ

1) การแบ่งส่วนคือการตัดสินใจเกี่ยวกับผลิตภัณฑ์

ข้อดีข้อเสีย: Chunk ที่ใหญ่กว่า = บริบทมากขึ้น แต่ต้นทุนโทเค็นสูงขึ้น Chunk ที่เล็กลง = การเรียกคืนที่สูงขึ้น แต่ความหมายกระจัดกระจาย

ค่าเริ่มต้นที่ดี: 512–1024 โทเค็น โดยมีช่วงทับซ้อน ~10–20%

Metadata มีความสำคัญ: รักษาส่วนที่มา, หน้า, ส่วน, หัวข้อ

2) คุณภาพการดึงข้อมูลดีกว่าขนาดโมเดล

การจัดลำดับใหม่: เพิ่ม Cross‑Encoder หรือ Embedding Reranker เพื่อ MRR ที่ดีขึ้น

การค้นหาแบบ Hybrid: รวม BM25 สำหรับคำศัพท์ที่หายากเข้ากับ Embedding สำหรับความหมาย

ตัวกรอง: จำกัดให้แคบลงตามประเภทเอกสาร, วันที่ หรือผู้เช่า เพื่อปรับปรุงความแม่นยำ

3) ประเมินผลตั้งแต่เนิ่นๆ ประเมินผลเสมอ

Graded QA: สร้างชุดคำถาม–คำตอบขนาดเล็กพร้อมการอ้างอิง

เมตริก: ความถูกต้องของคำตอบ, Groundedness, เวลาแฝง และต้นทุนต่อคิวรี

A/B อย่างปลอดภัย: Shadow Deploy การแบ่งส่วนหรือตัวดึงข้อมูลใหม่ก่อนที่จะตัด

4) ทำให้การกระทำเป็น First‑Class

เอาต์พุตแบบมีโครงสร้าง: ใช้ Schema สำหรับงานดึงข้อมูล

เครื่องมือ: ห่อ API (การค้นหา, ปฏิทิน, DB) เป็นฟังก์ชันเพื่อให้เอเจนต์เรียก

Guardrail: ตรวจสอบความถูกต้องของเอาต์พุต, Implement การลองใหม่, บันทึกข้อผิดพลาดของเครื่องมือ

5) สุขอนามัยด้านต้นทุนและเวลาแฝง

Cache Embeddings: Deduplicate ข้อความและนำ Vector กลับมาใช้ใหม่ในการสร้าง

การดำเนินการแบบ Batch: จัดทำดัชนีเป็นกลุ่ม; สตรีมคำตอบเพื่อปรับปรุง UX

บริบทที่ชาญฉลาดกว่า: อย่าใส่ Prompt มากเกินไป—Top‑k + Rerank แทน

แผนการเรียนรู้ 7 วันโดยใช้บทเรียน LlamaIndex ที่ดีที่สุด

วันที่ 1: การเริ่มต้นอย่างรวดเร็ว (บทเรียน #1) สร้างแชทจากไฟล์ PDF 20 หน้า ส่งมอบ CLI

วันที่ 2: ปรับปรุงการดึงข้อมูล (บทเรียน #2) เพิ่ม Reranker + การค้นหาแบบ Hybrid

วันที่ 3: เพิ่ม Function Calling (บทเรียน #3) สร้างเครื่องมือสำหรับคำถามที่พบบ่อยใน API ของคุณ

วันที่ 4: ย้ายไปยัง Vector Store จริง (บทเรียน #4) ใช้ pgvector ในเครื่อง

วันที่ 5: แนะนำ Planner (บทเรียน #5) กำหนดเส้นทางคำถามข้ามสองดัชนี

วันที่ 6: เพิ่มการประเมินผล (บทเรียน #6) สร้างชุดทดสอบ 30 คำถามและ Baseline

วันที่ 7: Production Pass (บทเรียน #10) งาน Background, การสังเกตการณ์, CI

ตัวอย่างโครงการ: "Docs Concierge" ด้วย LlamaIndex

เป้าหมาย: ผู้ช่วยภายในที่ปลอดภัยซึ่งตอบคำถามเกี่ยวกับเอกสารกระบวนการและเปิด Ticket

สแต็ก: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3

ขั้นตอน:

นำเข้า Confluence Exports และไฟล์ PDF (เก็บ Metadata + ACL)

Chunk ที่ 768 โทเค็น; จัดทำดัชนีไปยัง pgvector

เพิ่มการดึงข้อมูลแบบ Hybrid และ Reranker

สร้างเครื่องมือ: Create_jira_ticket, Lookup_oncall, Fetch_policy.

เพิ่มการประเมินผลด้วย 50 คำถามที่คัดสรรมา; วัด Groundedness

ปรับใช้กับ Streaming UI และ Citation Previews

ผลลัพธ์: คำตอบที่รวดเร็วและมีการอ้างอิง; ระบบอัตโนมัติของงานด้วยคลิกเดียว; ความแม่นยำที่วัดได้

ข้อผิดพลาดทั่วไปที่บทเรียนเหล่านี้ช่วยให้คุณหลีกเลี่ยงได้

ข้ามการประเมินผล: หากคุณไม่ทดสอบ คุณจะส่งมอบการถดถอย

ละเลย Metadata: คุณจะสูญเสียการระบุแหล่งที่มาและพลังการกำหนดเส้นทาง

Chunk ขนาดใหญ่เกินไป: Token Bloat เพิ่มต้นทุนโดยไม่มีคำตอบที่ดีกว่า

ระบุเครื่องมือไม่ครบถ้วน: เอเจนต์ต้องการอินพุตที่ชัดเจนและเอาต์พุตที่แน่นอน

ไม่มีการแยก: Multi‑Tenant RAG ต้องป้องกันการรั่วไหลข้ามลูกค้า

เครื่องมือที่เสริมบทเรียน LlamaIndex

Vector Store: pgvector, Pinecone, Weaviate, Qdrant

Reranker: Cohere Rerank, FlagEmbedding, Voyage Rerank

Chunker: Semantic Splitter, Table-Aware Splitter

Evals: Ragas-Style QA, LlamaIndex Evals, Custom Rubric Graders

UI: Streamlit, Next.js, FastAPI Websockets สำหรับ Streaming Tokens

อนึ่ง หากคุณชอบเรียนรู้โดยการลงมือปฏิบัติจริงภายในเบราว์เซอร์ของคุณ ควรสังเกตว่า Sider.ai ช่วยให้คุณแชทกับโค้ด, เอกสาร และหน้าเว็บแบบเคียงข้างกันได้ คุณสามารถวาง Snippet จากบทเรียน LlamaIndex เรียกใช้ Prompts และทำซ้ำได้เร็วขึ้น ซึ่งเป็นประโยชน์สำหรับการทดสอบ RAG Prompts และการดึงเอาต์พุตแบบมีโครงสร้างในขณะที่คุณติดตาม

สิ่งที่จะค้นหา: การค้นหาบทเรียน LlamaIndex ที่ทันสมัย

“บทเรียน LlamaIndex ที่ดีที่สุด 2025”

“LlamaIndex Quickstart RAG PDF”

“ตัวอย่าง LlamaIndex SubQuestionQueryEngine”

“บทเรียน Groundedness การประเมินผล LlamaIndex”

“คู่มือ LlamaIndex pgvector Pinecone”

“ตัวอย่าง Function Calling ของ LlamaIndex Agents”

มองหาโค้ดล่าสุดที่ใช้ Settings.llm, Settings.embed_model, VectorStoreIndex และ As_query_engine—นี่คือสำนวนปัจจุบัน

ประเด็นสำคัญ

บทเรียน LlamaIndex ที่ดีที่สุดช่วยให้คุณส่งมอบผลลัพธ์ ไม่ใช่แค่ Snippet โค้ด

เริ่มต้นด้วยการแชทจากเอกสาร จากนั้นใส่คุณภาพการดึงข้อมูล เครื่องมือ และการประเมินผล

ใช้ Vector Store จริง เพิ่ม Planner สำหรับคำถามที่ซับซ้อน และทดสอบอย่างไม่หยุดหย่อน

ตัวเลือกทางสถาปัตยกรรมขนาดเล็ก—การแบ่งส่วน, การจัดลำดับใหม่, ตัวกรอง—เปลี่ยนผลลัพธ์มากกว่าการสลับโมเดล

การเรียนรู้จะเร็วขึ้นเมื่อคุณทำตามแผนที่มีโครงสร้างและสร้างสิ่งที่จับต้องได้

อะไรต่อไป

เลือกหนึ่งบทเรียนจากสามอันดับแรกและสร้างแอปขั้นต่ำในวันนี้

เพิ่มการประเมินผลก่อนที่คุณจะปรับขนาดผู้ใช้

วางแผนการโยกย้ายการผลิตของคุณ: Storage, Auth, การสังเกตการณ์ และ CI

กลับมาดูบทเรียนขั้นสูง (เอเจนต์, Multimodal, Multi‑Tenant) เมื่อขอบเขตของคุณเติบโตขึ้น

คำถามที่พบบ่อย

Q1: บทเรียน LlamaIndex ที่ดีที่สุดสำหรับผู้เริ่มต้นคืออะไร? เริ่มต้นด้วยการเริ่มต้นอย่างรวดเร็วที่สร้างแชทจากไฟล์ PDF ของคุณโดยใช้ VectorStoreIndex และ SimpleDirectoryReader จากนั้นเพิ่มบทเรียนเกี่ยวกับการแบ่งส่วน, Metadata และการจัดลำดับใหม่เพื่อเพิ่มคุณภาพการดึงข้อมูล

Q2: ฉันจะสร้างแอป RAG ระดับโปรดักชันด้วย LlamaIndex ได้อย่างไร? ทำตามบทเรียนที่ครอบคลุม Vector Store (pgvector, Pinecone), การดึงข้อมูลแบบ Hybrid และการประเมินผลด้วย Graded QA เพิ่มการติดตาม, เอาต์พุตแบบมีโครงสร้าง และ CI/CD เพื่อย้ายจากโน้ตบุ๊กไปสู่การผลิต

Q3: บทเรียน LlamaIndex ใดที่สอนเรื่องเอเจนต์และการใช้เครื่องมือ มองหาคู่มือที่ใช้เอเจนต์สไตล์ ReAct, QueryPipeline และ Function Calling ด้วย Schema Pydantic บทเรียนเหล่านี้แสดงวิธีการกำหนดเส้นทางคิวรี เรียก API และส่งคืน JSON ที่มีโครงสร้าง

Q4: ฉันจะประเมินความแม่นยำของ LlamaIndex RAG ได้อย่างไร ใช้บทเรียนการประเมินผลที่แนะนำการตรวจสอบ Groundedness, Citation Coverage และชุดข้อมูล Graded QA ติดตามความถูกต้อง, เวลาแฝง และต้นทุนเพื่อจับการถดถอยก่อนที่จะปรับใช้

Q5: มีบทเรียน LlamaIndex สำหรับเอกสาร Multimodal หรือไม่? มี มองหาบทเรียนที่รวม OCR และการแยกวิเคราะห์ Layout สำหรับรูปภาพและตาราง จากนั้นจัดทำดัชนีข้อความที่ดึงออกมาพร้อม Metadata พวกเขาแสดงวิธีการจัดการกับแผนภูมิ, ภาพหน้าจอ และไฟล์ PDF ที่ซับซ้อนใน RAG