What are the best LlamaIndex tutorials for beginners?

Start with a quickstart that builds chat over your PDFs using VectorStoreIndex and SimpleDirectoryReader. Then add a tutorial on chunking, metadata, and reranking to boost retrieval quality.

How do I build a production RAG app with LlamaIndex?

Follow tutorials that cover vector stores (pgvector, Pinecone), hybrid retrieval, and evaluation with graded QA. Add tracing, structured outputs, and CI/CD to move from notebooks to production.

Which LlamaIndex tutorial teaches agents and tool use?

Look for guides using ReAct-style agents, QueryPipeline, and function calling with Pydantic schemas. These tutorials show how to route queries, call APIs, and return structured JSON.

How can I evaluate LlamaIndex RAG accuracy?

Use evaluation tutorials that introduce groundedness checks, citation coverage, and graded QA datasets. Track correctness, latency, and cost to catch regressions before deploying.

Are there LlamaIndex tutorials for multimodal documents?

Yes, seek tutorials that combine OCR and layout parsing for images and tables, then index the extracted text with metadata. They show how to handle charts, screenshots, and complex PDFs in RAG.

10 Tutorial LlamaIndex Terbaik untuk Menguasai RAG pada Tahun 2025

Jika anda pernah mendengar bahawa Retrieval-Augmented Generation (RAG) boleh menjadikan aplikasi LLM anda lebih bijak, anda betul. Cara terpantas untuk menghasilkan pembantu AI seperti carian yang boleh dipercayai hari ini adalah dengan mempelajari LlamaIndex dengan baik—dan tutorial LlamaIndex terbaik boleh memendekkan keluk pembelajaran anda daripada berbulan-bulan kepada beberapa hari.

Dalam panduan ini, kami memilih sendiri tutorial LlamaIndex terbaik untuk setiap peringkat—daripada permulaan pantas salin-tampal kepada saluran paip gred pengeluaran. Anda akan menemui panduan video, buku nota praktikal dan resipi lanjutan untuk data berbilang penyewa, pengekstrakan berstruktur, agen dan penilaian.

Kami juga akan memetakan setiap tutorial kepada kemahiran atau hasil yang anda inginkan: membina sembang melalui dokumen anda, menskalakan pembenaman, menambah alatan, menstrim jawapan atau mengesahkan hasil.

Menjelang akhir panduan ini, anda akan tahu tutorial LlamaIndex mana untuk dimulakan, tutorial mana yang perlu diikuti seterusnya dan cara menggabungkannya menjadi produk sebenar.

Mengapa Tutorial LlamaIndex Penting Sekarang

RAG ialah masa kini aplikasi AI. LLM berhalusinasi; RAG mendasarkan jawapan dalam data anda.

LlamaIndex ialah tindanan RAG yang paling padu. Ia membungkus pengindeksan, perolehan, perancangan pertanyaan, kebolehcerapan dan penilaian ke dalam modul boleh gubah yang berfungsi dengan baik dengan LangChain, OpenAI, Anthropic dan LLM sumber terbuka.

Tutorial ialah laluan pantas anda. Tutorial LlamaIndex terbaik menunjukkan bukan sahaja kod, tetapi juga keputusan seni bina: pengepalan, penyusunan semula, penimbalan dan rel panduan.

Jika matlamat anda ialah: “Berbual dengan dokumen saya dan jangan berhalusinasi,” senarai ini akan membawa anda ke sana.

Cara Kami Memilih Tutorial LlamaIndex Terbaik

Berorientasikan hasil: Anda sepatutnya menghasilkan sesuatu yang berguna selepas setiap tutorial.

Terkini untuk 2025: Mencerminkan API LlamaIndex semasa (cth., VectorStoreIndex, Settings, QueryPipeline, ReActAgent).

Menyedari pengeluaran: Menunjukkan penilaian, pengesanan dan lelaran—melangkaui hello world.

Keluasan + kedalaman: Daripada permulaan pantas kepada agen, multimodal dan pengekstrakan berstruktur.

10 Tutorial LlamaIndex Terbaik (Dipilih Sendiri)

Di bawah ialah laluan yang dipilih susun. Mulakan pada tahap anda; lompat di mana perlu.

1) Permulaan Pantas 15 Minit: Berbual Melalui PDF Anda

Terbaik untuk: Mereka yang baru bermula dan pengurus produk

Perkara yang akan anda bina: Muat naik PDF, indeks, tanya soalan, dapatkan petikan

Konsep utama: SimpleDirectoryReader, VectorStoreIndex, Settings, pembenaman

Mengapa ia hebat: Kod minimum, momen aha! maksimum

Contoh rangka:

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)

Perkara yang akan anda pelajari seterusnya: Saiz cebisan, top‑k dan sebab penyusunan semula penting.

2) Asas RAG Dengan Pengepalan, Metadata dan Penyusunan Semula

Terbaik untuk: Pemula → pertengahan

Perkara yang akan anda bina: Pengambilan yang lebih bijak dengan kualiti konteks yang lebih baik

Konsep utama: SentenceSplitter, penapis metadata, komponen rerank

Mengapa ia hebat: Menunjukkan cara beberapa tombol mengurangkan halusinasi secara drastik

Cuba:

from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)

Hasil: Tetingkap konteks berkualiti tinggi untuk dokumen panjang.

3) LlamaIndex + Panggilan Fungsi OpenAI (Penggunaan Alat & Output Berstruktur)

Terbaik untuk: Pembina yang mengautomasikan aliran kerja

Perkara yang akan anda bina: Ejen yang memanggil alatan dan mengembalikan skema JSON

Konsep utama: QueryPipeline, spesifikasi alatan, skema Pydantic, panggilan fungsi

Mengapa ia hebat: Menjambatan S&J dengan tindakan sebenar (carian, CRUD, API)

from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))

Hasil: Corak sedia pengeluaran untuk pengekstrakan dan tindakan berstruktur.

4) Membina Gedung Vektor Pengeluaran (Postgres, Pinecone, Weaviate)

Terbaik untuk: Pasukan yang merancang untuk menskala

Perkara yang akan anda bina: Storan vektor tahan lama dengan penapis dan carian hibrid

Konsep utama: Penyesuai VectorStoreIndex, BM25+pembenaman hibrid, metadata

Mengapa ia hebat: Mengajar ketekunan, penghijrahan dan kawalan kos

Petua:

Gunakan Postgres/pgvector untuk penggunaan yang ringkas dan berpatutan.

Pinecone/Weaviate untuk skala terurus; tala ef_construction, ef_search.

Tambahkan perolehan hibrid untuk mengendalikan istilah dan akronim yang jarang berlaku.

5) Perancangan Pertanyaan dan Penaakulan Berbilang Langkah Dengan Agen

Terbaik untuk: Soalan kompleks dan carian berbilang set data

Perkara yang akan anda bina: Perancang yang menguraikan pertanyaan menjadi sub‑pertanyaan

Konsep utama: ReActAgent, SubQuestionQueryEngine, penghalaan

Mengapa ia hebat: Melangkaui “peroleh kemudian jawab” kepada “berfikir kemudian cari.”

Corak:

from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Kebolehcerapan dan Penilaian: Pengesanan, Berasas dan Penanda Aras

Terbaik untuk: Sesiapa sahaja yang menghasilkan aplikasi sebenar

Perkara yang akan anda bina: Gelung maklum balas untuk mengesan regresi dan halusinasi

Konsep utama: Penilaian LlamaIndex, QA bergred, semakan petikan, pengesanan

Mengapa ia hebat: Mengajar anda untuk mengukur perkara yang penting sebelum menskala

Senarai semak:

Log semua gesaan/respons dengan kesan.

Gunakan set data QA bergred untuk ujian regresi.

Jejaki asas dan liputan petikan.

7) RAG untuk Data Multimodal (Imej, Jadual, Markdown)

Terbaik untuk: Dokumen dengan carta, tangkapan skrin dan jadual

Perkara yang akan anda bina: Saluran paip yang mengekstrak teks daripada imej dan penaakulan melalui jadual

Konsep utama: OCR + penghuraian reka letak, pengepalan jadual, model multimodal

Mengapa ia hebat: Dokumen dunia sebenar adalah tidak kemas; tutorial ini menunjukkan kepada anda cara menjinakkannya.

8) Berbilang Penyewa dan Pengasingan Perolehan

Terbaik untuk: Pembina SaaS

Perkara yang akan anda bina: Perkhidmatan RAG di mana data setiap pelanggan diasingkan

Konsep utama: Ruang nama, pengawal metadata, indeks setiap penyewa, RBAC

Mengapa ia hebat: Keselamatan dan privasi mengikut reka bentuk; laluan peningkatan yang bersih.

9) Pengekstrakan Berstruktur pada Skala (Invois, Log, Kontrak)

Terbaik untuk: Operasi, kewangan, aliran kerja undang-undang

Perkara yang akan anda bina: Output JSON deterministik dengan pengesahan skema

Konsep utama: Skema Pydantic, percubaan semula, pengesahan tambahan alatan

Mengapa ia hebat: Mengurangkan semakan manual dan menjadikan output LLM boleh dipercayai.

10) Corak Pengeluaran Hujung ke Hujung: Daripada Buku Nota kepada CI/CD

Terbaik untuk: Pasukan yang beralih kepada prod

Perkara yang akan anda bina: Saluran paip penuh dengan pengambilan data, kerja pengindeksan, penilaian dan get pelepasan

Konsep utama: Pekerja latar belakang, pengindeksan semula berjadual, bendera ciri

Mengapa ia hebat: Menunjukkan cara menghantar secara berterusan dengan yakin.

Memilih Tutorial LlamaIndex yang Betul untuk Matlamat Anda

Gunakan penghala pantas ini untuk memilih langkah anda yang seterusnya:

“Saya memerlukan keputusan hari ini.” Mulakan dengan permulaan pantas (Tutorial #1), kemudian tambahkan penyusunan semula (Tutorial #2).

“Saya mahukan tindakan, bukan sekadar jawapan.” Lompat ke panggilan fungsi dan agen (Tutorial #3 dan #5).

“Kami mempunyai keperluan skala dan pematuhan.” Corak storan + berbilang penyewa (Tutorial #4 dan #8).

“Bagaimanakah kita mempercayai jawapan itu?” Penilaian dan pengesanan (Tutorial #6).

“Dokumen kami banyak visual.” RAG multimodal (Tutorial #7).

“Kami memerlukan data berstruktur.” Gunakan skema dan pengesah (Tutorial #9).

Selaman Dalam: Amalan Terbaik Yang Akan Anda Lihat Merentasi Tutorial LlamaIndex Teratas

1) Pengepalan ialah Keputusan Produk

Tolak ansur: Cebisan yang lebih besar = lebih banyak konteks tetapi kos token yang lebih tinggi; cebisan yang lebih kecil = perolehan yang lebih tinggi tetapi makna yang berpecah-belah.

Lalai yang baik: 512–1024 token dengan ~10–20% pertindihan.

Metadata penting: Kekalkan sumber, halaman, bahagian, tajuk.

2) Kualiti Perolehan Mengatasi Saiz Model

Penyusunan semula: Tambahkan pengekod silang atau penyusun semula pembenaman untuk MRR yang lebih baik.

Carian hibrid: Gabungkan BM25 untuk istilah yang jarang berlaku dengan pembenaman untuk semantik.

Penapis: Sempitkan mengikut jenis dokumen, tarikh atau penyewa untuk meningkatkan ketepatan.

3) Nilaikan Awal, Nilaikan Sentiasa

QA bergred: Bina set kecil pasangan soalan–jawapan dengan petikan.

Metrik: Ketepatan jawapan, asas, kependaman dan kos setiap pertanyaan.

A/B dengan selamat: Bayangan gunakan pengepalan atau perolehan baharu sebelum memotong.

4) Jadikan Tindakan Kelas Pertama

Output berstruktur: Gunakan skema untuk tugas pengekstrakan.

Alatan: Balut API (carian, kalendar, DB) sebagai fungsi untuk dipanggil oleh agen.

Rel panduan: Sahkan output, laksanakan percubaan semula, log ralat alatan.

5) Kebersihan Kos dan Kependaman

Benamkan cache: Nyahduplikasikan teks dan gunakan semula vektor merentasi binaan.

Operasi kelompok: Indeks secara pukal; strim jawapan untuk meningkatkan UX.

Konteks yang lebih bijak: Jangan terlebih isi gesaan—top‑k + susun semula sahaja.

Pelan Pembelajaran 7 Hari Menggunakan Tutorial LlamaIndex Terbaik

Hari 1: Permulaan pantas (Tutorial #1). Bina sembang melalui PDF 20 halaman. Hantar CLI.

Hari 2: Tingkatkan perolehan (Tutorial #2). Tambahkan penyusun semula + carian hibrid.

Hari 3: Tambahkan panggilan fungsi (Tutorial #3). Cipta alatan untuk Soalan Lazim dalam API anda.

Hari 4: Beralih ke gedung vektor sebenar (Tutorial #4). Gunakan pgvector secara tempatan.

Hari 5: Perkenalkan perancang (Tutorial #5). Halakan soalan merentasi dua indeks.

Hari 6: Tambahkan penilaian (Tutorial #6). Cipta set ujian 30 soalan dan garis dasar.

Hari 7: Lulus pengeluaran (Tutorial #10). Kerja latar belakang, kebolehcerapan, CI.

Contoh Projek: "Renjer Dokumen" Dengan LlamaIndex

Matlamat: Pembantu dalaman selamat yang menjawab soalan tentang dokumen proses dan membuka tiket.

Tindanan: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.

Langkah:

Ambil eksport Confluence dan PDF (kekalkan metadata + ACL).

Cebisan pada 768 token; indeks ke pgvector.

Tambahkan perolehan hibrid dan penyusun semula.

Cipta alatan: create_jira_ticket, lookup_oncall, fetch_policy.

Tambahkan penilaian dengan 50 soalan yang dipilih susun; ukur asas.

Gunakan dengan UI penstriman dan pratonton petikan.

Hasil: Jawapan pantas yang dipetik; automasi tugas satu‑klik; ketepatan yang boleh diukur.

Kesilapan Lazim Yang Tutorial Ini Bantu Anda Elakkan

Melangkau penilaian: Jika anda tidak menguji, anda akan menghantar regresi.

Mengabaikan metadata: Anda akan kehilangan atribusi sumber dan kuasa penghalaan.

Cebisan bersaiz besar: Token kembung meningkatkan kos tanpa jawapan yang lebih baik.

Alatan yang kurang dinyatakan: Agen memerlukan input yang jelas dan output deterministik.

Tiada pengasingan: RAG berbilang penyewa mesti menghalang kebocoran merentas pelanggan.

Alatan Yang Melengkapkan Tutorial LlamaIndex

Gedung vektor: pgvector, Pinecone, Weaviate, Qdrant

Penyusun semula: Cohere Rerank, FlagEmbedding, Voyage rerank

Pencebis: Pencebis semantik, pencebis sedar jadual

Penilaian: QA gaya Ragas, penilaian LlamaIndex, penggred rubrik tersuai

UI: Streamlit, Next.js, soket web FastAPI untuk token penstriman

Ngomong-ngomong, jika anda suka belajar dengan melakukan di dalam penyemak imbas anda, perlu diingatkan bahawa Sider.ai membolehkan anda berbual dengan kod, dokumen dan halaman web bersebelahan. Anda boleh menampal coretan daripada tutorial LlamaIndex, menjalankan gesaan dan membuat lelaran dengan lebih pantas—berguna untuk menguji gesaan RAG dan mengekstrak output berstruktur semasa anda mengikuti.

Perkara Yang Perlu Dicari: Mencari Tutorial LlamaIndex Terkini

“tutorial LlamaIndex terbaik 2025”

“LlamaIndex permulaan pantas RAG pdf”

“Contoh LlamaIndex SubQuestionQueryEngine”

“Tutorial asas penilaian LlamaIndex”

“Panduan LlamaIndex pgvector Pinecone”

“Contoh panggilan fungsi agen LlamaIndex”

Cari kod terkini menggunakan Settings.llm, Settings.embed_model, VectorStoreIndex dan as_query_engine—ini ialah idiom semasa.

Perkara Utama

Tutorial LlamaIndex terbaik membantu anda menghantar hasil, bukan sekadar coretan kod.

Mulakan dengan sembang melalui dokumen, kemudian lapiskan dalam kualiti perolehan, alatan dan penilaian.

Gunakan gedung vektor sebenar, tambahkan perancang untuk soalan kompleks dan uji tanpa henti.

Pilihan seni bina kecil—pengepalan, penyusunan semula, penapis—mengubah hasil lebih daripada menukar model.

Pembelajaran dipercepatkan apabila anda mengikuti pelan berstruktur dan membina sesuatu yang sebenar.

Perkara Seterusnya

Pilih satu tutorial daripada tiga teratas dan bina aplikasi minimum hari ini.

Tambahkan penilaian sebelum anda menskalakan pengguna.

Rancang penghijrahan pengeluaran anda: storan, pengesahan, kebolehcerapan dan CI.

Lawati semula tutorial lanjutan (agen, multimodal, berbilang penyewa) apabila skop anda berkembang.

Soalan Lazim

S1:Apakah tutorial LlamaIndex terbaik untuk pemula? Mulakan dengan permulaan pantas yang membina sembang melalui PDF anda menggunakan VectorStoreIndex dan SimpleDirectoryReader. Kemudian tambahkan tutorial tentang pengepalan, metadata dan penyusunan semula untuk meningkatkan kualiti perolehan.

S2:Bagaimanakah cara saya membina aplikasi RAG pengeluaran dengan LlamaIndex? Ikuti tutorial yang meliputi gedung vektor (pgvector, Pinecone), perolehan hibrid dan penilaian dengan QA bergred. Tambahkan pengesanan, output berstruktur dan CI/CD untuk beralih daripada buku nota kepada pengeluaran.

S3:Tutorial LlamaIndex manakah yang mengajar agen dan penggunaan alatan? Cari panduan menggunakan agen gaya ReAct, QueryPipeline dan panggilan fungsi dengan skema Pydantic. Tutorial ini menunjukkan cara menghalakan pertanyaan, memanggil API dan mengembalikan JSON berstruktur.

S4:Bagaimanakah saya boleh menilai ketepatan RAG LlamaIndex? Gunakan tutorial penilaian yang memperkenalkan semakan asas, liputan petikan dan set data QA bergred. Jejaki ketepatan, kependaman dan kos untuk menangkap regresi sebelum menggunakan.

S5:Adakah terdapat tutorial LlamaIndex untuk dokumen multimodal? Ya, cari tutorial yang menggabungkan OCR dan penghuraian reka letak untuk imej dan jadual, kemudian indeks teks yang diekstrak dengan metadata. Ia menunjukkan cara mengendalikan carta, tangkapan skrin dan PDF kompleks dalam RAG.