What are the best LlamaIndex tutorials for beginners?

Start with a quickstart that builds chat over your PDFs using VectorStoreIndex and SimpleDirectoryReader. Then add a tutorial on chunking, metadata, and reranking to boost retrieval quality.

How do I build a production RAG app with LlamaIndex?

Follow tutorials that cover vector stores (pgvector, Pinecone), hybrid retrieval, and evaluation with graded QA. Add tracing, structured outputs, and CI/CD to move from notebooks to production.

Which LlamaIndex tutorial teaches agents and tool use?

Look for guides using ReAct-style agents, QueryPipeline, and function calling with Pydantic schemas. These tutorials show how to route queries, call APIs, and return structured JSON.

How can I evaluate LlamaIndex RAG accuracy?

Use evaluation tutorials that introduce groundedness checks, citation coverage, and graded QA datasets. Track correctness, latency, and cost to catch regressions before deploying.

Are there LlamaIndex tutorials for multimodal documents?

Yes, seek tutorials that combine OCR and layout parsing for images and tables, then index the extracted text with metadata. They show how to handle charts, screenshots, and complex PDFs in RAG.

10 Tutorial LlamaIndex Terbaik untuk Menguasai RAG di Tahun 2025

Jika Anda pernah mendengar bahwa Retrieval-Augmented Generation (RAG) dapat membuat aplikasi LLM Anda lebih pintar, Anda benar. Cara tercepat untuk mengirimkan asisten AI seperti pencarian yang andal saat ini adalah dengan mempelajari LlamaIndex dengan baik—dan tutorial LlamaIndex terbaik dapat memangkas kurva belajar Anda dari hitungan bulan menjadi hari.

Dalam panduan ini, kami memilihkan tutorial LlamaIndex terbaik untuk setiap tingkatan—mulai dari yang bisa langsung di- hingga tingkat produksi. Anda akan menemukan panduan video, buku catatan langsung, dan resep lanjutan untuk data multi-, ekstraksi terstruktur, agen, dan evaluasi.

Kami juga akan memetakan setiap tutorial ke keterampilan atau hasil yang Anda inginkan: membangun obrolan di atas dokumen Anda, menskalakan , menambahkan alat, melakukan jawaban, atau memverifikasi hasil.

Pada akhirnya, Anda akan tahu tutorial LlamaIndex mana yang harus dimulai, mana yang harus diikuti selanjutnya, dan bagaimana menggabungkannya menjadi produk nyata.

Mengapa Tutorial LlamaIndex Penting Saat Ini

RAG adalah bentuk waktu kini dari aplikasi AI. LLM berhalusinasi; RAG mendasarkan jawaban pada data Anda.

LlamaIndex adalah tumpukan RAG yang paling kohesif. Ini membungkus pengindeksan, pengambilan, perencanaan kueri, observabilitas, dan evaluasi ke dalam modul-modul yang dapat dikomposisikan yang bekerja dengan baik dengan LangChain, OpenAI, Anthropic, dan LLM sumber terbuka.

Tutorial adalah jalur cepat Anda. Tutorial LlamaIndex terbaik menunjukkan tidak hanya kode, tetapi juga keputusan arsitektur: , , , dan .

Jika tujuan Anda adalah: “Mengobrol dengan dokumen saya dan jangan berhalusinasi,” daftar ini akan membawa Anda ke sana.

Bagaimana Kami Memilih Tutorial LlamaIndex Terbaik

Berorientasi pada hasil: Anda harus mengirimkan sesuatu yang bermanfaat setelah setiap tutorial.

Terbaru untuk tahun 2025: Mencerminkan API LlamaIndex saat ini (misalnya, VectorStoreIndex, Settings, QueryPipeline, ReActAgent).

Sadar produksi: Menunjukkan evaluasi, penelusuran, dan iterasi—lebih dari sekadar .

Luas + mendalam: Dari hingga agen, multimodal, dan ekstraksi terstruktur.

10 Tutorial LlamaIndex Terbaik (Pilihan Sendiri)

Di bawah ini adalah jalur yang dikurasi. Mulailah dari level Anda; lompat jika diperlukan.

1) 15 Menit: Mengobrol dengan PDF Anda

Terbaik untuk: Pemula mutlak dan manajer produk

Apa yang akan Anda bangun: Unggah PDF, indeks, ajukan pertanyaan, dapatkan sitasi

Konsep utama: SimpleDirectoryReader, VectorStoreIndex, Settings,

Mengapa ini bagus: Kode minimal, momen maksimal

Contoh kerangka:

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)

Apa yang akan Anda pelajari selanjutnya: Ukuran , , dan mengapa penting.

2) Dasar-Dasar RAG Dengan , Metadata, dan

Terbaik untuk: Pemula → menengah

Apa yang akan Anda bangun: Pengambil yang lebih pintar dengan kualitas konteks yang lebih baik

Konsep utama: SentenceSplitter, filter metadata, komponen rerank

Mengapa ini bagus: Menunjukkan bagaimana beberapa kenop secara drastis mengurangi halusinasi

Coba:

from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)

Hasil: Jendela konteks berkualitas lebih tinggi untuk dokumen panjang.

3) LlamaIndex + OpenAI Function Calling (Penggunaan Alat & Output Terstruktur)

Terbaik untuk: Pembuat yang mengotomatiskan alur kerja

Apa yang akan Anda bangun: Agen yang memanggil alat dan mengembalikan skema JSON

Konsep utama: QueryPipeline, spesifikasi alat, skema Pydantic,

Mengapa ini bagus: Menjembatani Tanya Jawab dengan tindakan nyata (pencarian, CRUD, API)

from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))

Hasil: Pola siap produksi untuk ekstraksi dan tindakan terstruktur.

4) Membangun Produksi (Postgres, Pinecone, Weaviate)

Terbaik untuk: Tim yang berencana untuk melakukan penskalaan

Apa yang akan Anda bangun: Penyimpanan vektor yang tahan lama dengan filter dan pencarian hibrida

Konsep utama: Adaptor VectorStoreIndex, hibrida BM25+, metadata

Mengapa ini bagus: Mengajarkan persistensi, migrasi, dan pengendalian biaya

Tips:

Gunakan Postgres/pgvector untuk penerapan yang sederhana dan terjangkau.

Pinecone/Weaviate untuk skala terkelola; sesuaikan ef_construction, ef_search.

Tambahkan pengambilan hibrida untuk menangani istilah dan akronim yang jarang.

5) Perencanaan Kueri dan Penalaran Multi-Langkah Dengan Agen

Terbaik untuk: Pertanyaan kompleks dan pencarian multi-

Apa yang akan Anda bangun: Perencana yang menguraikan kueri menjadi sub-kueri

Konsep utama: ReActAgent, SubQuestionQueryEngine,

Mengapa ini bagus: Bergerak melampaui “ambil lalu jawab” menjadi “berpikir lalu mencari.”

Pola:

from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Observabilitas dan Evaluasi: Penelusuran, Landasan, dan Tolok Ukur

Terbaik untuk: Siapa pun yang mengirimkan aplikasi nyata

Apa yang akan Anda bangun: Lingkaran umpan balik untuk mendeteksi regresi dan halusinasi

Konsep utama: Evaluasi LlamaIndex, QA bergradasi, pemeriksaan sitasi, penelusuran

Mengapa ini bagus: Mengajari Anda untuk mengukur apa yang penting sebelum melakukan penskalaan

Daftar periksa:

Catat semua /respons dengan penelusuran.

Gunakan QA bergradasi untuk pengujian regresi.

Lacak landasan dan cakupan sitasi.

7) RAG untuk Data Multimodal (Gambar, Tabel, Markdown)

Terbaik untuk: Dokumen dengan bagan, tangkapan layar, dan tabel

Apa yang akan Anda bangun: yang mengekstrak teks dari gambar dan bernalar di atas tabel

Konsep utama: OCR + penguraian tata letak, tabel, model multimodal

Mengapa ini bagus: Dokumen dunia nyata berantakan; tutorial ini menunjukkan cara menjinakkannya.

8) Multi- dan Isolasi Pengambilan

Terbaik untuk: Pembuat SaaS

Apa yang akan Anda bangun: Layanan RAG tempat data setiap pelanggan diisolasi

Konsep utama: Ruang nama, penjaga metadata, indeks per-, RBAC

Mengapa ini bagus: Keamanan dan privasi berdasarkan desain; jalur peningkatan yang bersih.

9) Ekstraksi Terstruktur dalam Skala Besar (Faktur, Log, Kontrak)

Terbaik untuk: Operasi, keuangan, alur kerja hukum

Apa yang akan Anda bangun: Output JSON deterministik dengan validasi skema

Konsep utama: Skema Pydantic, percobaan ulang, validasi yang ditambah alat

Mengapa ini bagus: Mengurangi peninjauan manual dan membuat output LLM menjadi andal.

10) Pola Produksi Ujung-ke-Ujung: Dari Buku Catatan ke CI/CD

Terbaik untuk: Tim yang pindah ke produksi

Apa yang akan Anda bangun: lengkap dengan penyerapan data, pekerjaan pengindeksan, evaluasi, dan gerbang rilis

Konsep utama: Pekerja latar belakang, penjadwalan pengindeksan ulang,

Mengapa ini bagus: Menunjukkan cara mengirimkan secara berkelanjutan dengan percaya diri.

Memilih Tutorial LlamaIndex yang Tepat untuk Tujuan Anda

Gunakan cepat ini untuk memilih langkah Anda selanjutnya:

“Saya membutuhkan hasil hari ini.” Mulailah dengan (Tutorial #1), lalu tambahkan (Tutorial #2).

“Saya ingin tindakan, bukan hanya jawaban.” Lompat ke dan agen (Tutorial #3 dan #5).

“Kami memiliki kebutuhan skala dan kepatuhan.” Pola penyimpanan + multi- (Tutorial #4 dan #8).

“Bagaimana kami mempercayai jawaban?” Evaluasi dan penelusuran (Tutorial #6).

“Dokumen kami sangat visual.” RAG Multimodal (Tutorial #7).

“Kami membutuhkan data terstruktur.” Gunakan skema dan validator (Tutorial #9).

Pendalaman: Praktik Terbaik yang Akan Anda Lihat di Seluruh Tutorial LlamaIndex Teratas

1) Adalah Keputusan Produk

Trade‑off: yang lebih besar = lebih banyak konteks tetapi biaya token lebih tinggi; yang lebih kecil = lebih tinggi tetapi makna terfragmentasi.

Default yang baik: 512–1024 token dengan ~10–20% tumpang tindih.

Metadata penting: Pertahankan sumber, halaman, bagian, judul.

2) Kualitas Pengambilan Mengalahkan Ukuran Model

Reranking: Tambahkan atau untuk MRR yang lebih baik.

Pencarian hibrida: Gabungkan BM25 untuk istilah langka dengan untuk semantik.

Filter: Sempitkan berdasarkan jenis dokumen, tanggal, atau untuk meningkatkan presisi.

3) Evaluasi Dini, Evaluasi Selalu

QA Bergradasi: Bangun serangkaian kecil pasangan pertanyaan–jawaban dengan sitasi.

Metrik: Kebenaran jawaban, landasan, latensi, dan biaya per kueri.

A/B dengan aman: Sebarkan atau pengambil baru sebelum beralih.

4) Jadikan Tindakan Kelas Utama

Output terstruktur: Gunakan skema untuk tugas ekstraksi.

Alat: Bungkus API (pencarian, kalender, DB) sebagai fungsi untuk dipanggil oleh agen.

Guardrail: Validasi output, terapkan percobaan ulang, catat kesalahan alat.

5) Kebersihan Biaya dan Latensi

Cache embedding: Hilangkan duplikasi teks dan gunakan kembali vektor di seluruh .

Operasi batch: Indeks secara massal; jawaban untuk meningkatkan UX.

Konteks yang lebih cerdas: Jangan terlalu memenuhi — + sebagai gantinya.

Rencana Pembelajaran 7 Hari Menggunakan Tutorial LlamaIndex Terbaik

Hari 1: (Tutorial #1). Bangun obrolan di atas PDF 20 halaman. Kirimkan CLI.

Hari 2: Tingkatkan pengambilan (Tutorial #2). Tambahkan + pencarian hibrida.

Hari 3: Tambahkan (Tutorial #3). Buat alat untuk FAQ di API Anda.

Hari 4: Pindah ke nyata (Tutorial #4). Gunakan pgvector secara lokal.

Hari 5: Perkenalkan perencana (Tutorial #5). Rute pertanyaan di dua indeks.

Hari 6: Tambahkan evaluasi (Tutorial #6). Buat set pengujian 30 pertanyaan dan garis dasar.

Hari 7: Lulus produksi (Tutorial #10). Pekerjaan latar belakang, observabilitas, CI.

Contoh Proyek: "Concierge Dokumen" Dengan LlamaIndex

Tujuan: Asisten internal yang aman yang menjawab pertanyaan tentang dokumen proses dan membuka tiket.

Tumpukan: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.

Langkah:

Serap ekspor Confluence dan PDF (simpan metadata + ACL).

pada 768 token; indeks ke pgvector.

Tambahkan pengambilan hibrida dan .

Buat alat: create_jira_ticket, lookup_oncall, fetch_policy.

Tambahkan evaluasi dengan 50 pertanyaan yang dikurasi; ukur landasan.

Sebarkan dengan UI dan pratinjau sitasi.

Hasil: Jawaban cepat yang dikutip; otomatisasi tugas sekali klik; akurasi terukur.

Kesalahan Umum Yang Dibantu Dihindari Oleh Tutorial Ini

Melewatkan evaluasi: Jika Anda tidak menguji, Anda akan mengirimkan regresi.

Mengabaikan metadata: Anda akan kehilangan atribusi sumber dan kekuatan .

Chunk yang terlalu besar: Pembengkakan token meningkatkan biaya tanpa jawaban yang lebih baik.

Alat yang kurang spesifik: Agen membutuhkan input yang jelas dan output deterministik.

Tidak ada isolasi: RAG multi- harus mencegah kebocoran lintas pelanggan.

Alat Yang Melengkapi Tutorial LlamaIndex

Vector store: pgvector, Pinecone, Weaviate, Qdrant

Reranker: Cohere Rerank, FlagEmbedding, Voyage rerank

Chunker: Pemisah semantik, pemisah sadar tabel

Evaluasi: QA gaya Ragas, evaluasi LlamaIndex, rubrik khusus

UI: Streamlit, Next.js, FastAPI untuk token

Omong-omong, jika Anda suka belajar dengan melakukan di dalam Anda, perlu dicatat bahwa Sider.ai memungkinkan Anda mengobrol dengan kode, dokumen, dan halaman web secara berdampingan. Anda dapat menempelkan cuplikan dari tutorial LlamaIndex, menjalankan , dan melakukan iterasi lebih cepat—berguna untuk menguji RAG dan mengekstrak output terstruktur saat Anda mengikuti.

Apa yang Harus Dicari: Menemukan Tutorial LlamaIndex Terbaru

“tutorial LlamaIndex terbaik 2025”

“LlamaIndex RAG pdf”

“Contoh LlamaIndex SubQuestionQueryEngine”

“Tutorial landasan evaluasi LlamaIndex”

“Panduan LlamaIndex pgvector Pinecone”

“Contoh agen LlamaIndex”

Cari kode terbaru menggunakan Settings.llm, Settings.embed_model, VectorStoreIndex, dan as_query_engine—ini adalah idiom saat ini.

Poin-Poin Penting

Tutorial LlamaIndex terbaik membantu Anda mengirimkan hasil, bukan hanya cuplikan kode.

Mulailah dengan obrolan di atas dokumen, lalu lapisi dengan kualitas pengambilan, alat, dan evaluasi.

Gunakan nyata, tambahkan perencana untuk pertanyaan kompleks, dan uji tanpa henti.

Pilihan arsitektur kecil—, , filter—mengubah hasil lebih dari menukar model.

Pembelajaran dipercepat ketika Anda mengikuti rencana terstruktur dan membangun sesuatu yang nyata.

Apa Selanjutnya

Pilih satu tutorial dari tiga teratas dan bangun aplikasi minimal hari ini.

Tambahkan evaluasi sebelum Anda menskalakan pengguna.

Rencanakan migrasi produksi Anda: penyimpanan, otentikasi, observabilitas, dan CI.

Kunjungi kembali tutorial lanjutan (agen, multimodal, multi-) seiring pertumbuhan cakupan Anda.

FAQ

Q1:Apa tutorial LlamaIndex terbaik untuk pemula? Mulailah dengan yang membangun obrolan di atas PDF Anda menggunakan VectorStoreIndex dan SimpleDirectoryReader. Kemudian tambahkan tutorial tentang , metadata, dan untuk meningkatkan kualitas pengambilan.

Q2:Bagaimana cara membangun aplikasi RAG produksi dengan LlamaIndex? Ikuti tutorial yang mencakup (pgvector, Pinecone), pengambilan hibrida, dan evaluasi dengan QA bergradasi. Tambahkan penelusuran, output terstruktur, dan CI/CD untuk berpindah dari buku catatan ke produksi.

Q3:Tutorial LlamaIndex mana yang mengajarkan agen dan penggunaan alat? Cari panduan menggunakan agen gaya ReAct, QueryPipeline, dan dengan skema Pydantic. Tutorial ini menunjukkan cara merutekan kueri, memanggil API, dan mengembalikan JSON terstruktur.

Q4:Bagaimana cara mengevaluasi akurasi RAG LlamaIndex? Gunakan tutorial evaluasi yang memperkenalkan pemeriksaan landasan, cakupan sitasi, dan QA bergradasi. Lacak kebenaran, latensi, dan biaya untuk menangkap regresi sebelum menerapkan.

Q5:Apakah ada tutorial LlamaIndex untuk dokumen multimodal? Ya, cari tutorial yang menggabungkan OCR dan penguraian tata letak untuk gambar dan tabel, lalu indeks teks yang diekstraksi dengan metadata. Mereka menunjukkan cara menangani bagan, tangkapan layar, dan PDF kompleks di RAG.