10 Tutorial LlamaIndex Terbaik untuk Menguasai RAG pada Tahun 2025
Jika anda pernah mendengar bahawa Retrieval-Augmented Generation (RAG) boleh menjadikan aplikasi LLM anda lebih bijak, anda betul. Cara terpantas untuk menghasilkan pembantu AI seperti carian yang boleh dipercayai hari ini adalah dengan mempelajari LlamaIndex dengan baik—dan tutorial LlamaIndex terbaik boleh memendekkan keluk pembelajaran anda daripada berbulan-bulan kepada beberapa hari.
Dalam panduan ini, kami memilih sendiri tutorial LlamaIndex terbaik untuk setiap peringkat—daripada permulaan pantas salin-tampal kepada saluran paip gred pengeluaran. Anda akan menemui panduan video, buku nota praktikal dan resipi lanjutan untuk data berbilang penyewa, pengekstrakan berstruktur, agen dan penilaian.
Kami juga akan memetakan setiap tutorial kepada kemahiran atau hasil yang anda inginkan: membina sembang melalui dokumen anda, menskalakan pembenaman, menambah alatan, menstrim jawapan atau mengesahkan hasil.
Menjelang akhir panduan ini, anda akan tahu tutorial LlamaIndex mana untuk dimulakan, tutorial mana yang perlu diikuti seterusnya dan cara menggabungkannya menjadi produk sebenar.
Mengapa Tutorial LlamaIndex Penting Sekarang
- RAG ialah masa kini aplikasi AI. LLM berhalusinasi; RAG mendasarkan jawapan dalam data anda.
- LlamaIndex ialah tindanan RAG yang paling padu. Ia membungkus pengindeksan, perolehan, perancangan pertanyaan, kebolehcerapan dan penilaian ke dalam modul boleh gubah yang berfungsi dengan baik dengan LangChain, OpenAI, Anthropic dan LLM sumber terbuka.
- Tutorial ialah laluan pantas anda. Tutorial LlamaIndex terbaik menunjukkan bukan sahaja kod, tetapi juga keputusan seni bina: pengepalan, penyusunan semula, penimbalan dan rel panduan.
Jika matlamat anda ialah: “Berbual dengan dokumen saya dan jangan berhalusinasi,” senarai ini akan membawa anda ke sana.
Cara Kami Memilih Tutorial LlamaIndex Terbaik
- Berorientasikan hasil: Anda sepatutnya menghasilkan sesuatu yang berguna selepas setiap tutorial.
- Terkini untuk 2025: Mencerminkan API LlamaIndex semasa (cth.,
VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
- Menyedari pengeluaran: Menunjukkan penilaian, pengesanan dan lelaran—melangkaui hello world.
- Keluasan + kedalaman: Daripada permulaan pantas kepada agen, multimodal dan pengekstrakan berstruktur.
10 Tutorial LlamaIndex Terbaik (Dipilih Sendiri)
Di bawah ialah laluan yang dipilih susun. Mulakan pada tahap anda; lompat di mana perlu.
1) Permulaan Pantas 15 Minit: Berbual Melalui PDF Anda
- Terbaik untuk: Mereka yang baru bermula dan pengurus produk
- Perkara yang akan anda bina: Muat naik PDF, indeks, tanya soalan, dapatkan petikan
- Konsep utama:
SimpleDirectoryReader, VectorStoreIndex, Settings, pembenaman
- Mengapa ia hebat: Kod minimum, momen aha! maksimum
Contoh rangka:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- Perkara yang akan anda pelajari seterusnya: Saiz cebisan, top‑k dan sebab penyusunan semula penting.
2) Asas RAG Dengan Pengepalan, Metadata dan Penyusunan Semula
- Terbaik untuk: Pemula → pertengahan
- Perkara yang akan anda bina: Pengambilan yang lebih bijak dengan kualiti konteks yang lebih baik
- Konsep utama:
SentenceSplitter, penapis metadata, komponen rerank
- Mengapa ia hebat: Menunjukkan cara beberapa tombol mengurangkan halusinasi secara drastik
Cuba:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- Hasil: Tetingkap konteks berkualiti tinggi untuk dokumen panjang.
3) LlamaIndex + Panggilan Fungsi OpenAI (Penggunaan Alat & Output Berstruktur)
- Terbaik untuk: Pembina yang mengautomasikan aliran kerja
- Perkara yang akan anda bina: Ejen yang memanggil alatan dan mengembalikan skema JSON
- Konsep utama:
QueryPipeline, spesifikasi alatan, skema Pydantic, panggilan fungsi
- Mengapa ia hebat: Menjambatan S&J dengan tindakan sebenar (carian, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- Hasil: Corak sedia pengeluaran untuk pengekstrakan dan tindakan berstruktur.
4) Membina Gedung Vektor Pengeluaran (Postgres, Pinecone, Weaviate)
- Terbaik untuk: Pasukan yang merancang untuk menskala
- Perkara yang akan anda bina: Storan vektor tahan lama dengan penapis dan carian hibrid
- Konsep utama: Penyesuai
VectorStoreIndex, BM25+pembenaman hibrid, metadata
- Mengapa ia hebat: Mengajar ketekunan, penghijrahan dan kawalan kos
Petua:
- Gunakan Postgres/pgvector untuk penggunaan yang ringkas dan berpatutan.
- Pinecone/Weaviate untuk skala terurus; tala
ef_construction, ef_search.
- Tambahkan perolehan hibrid untuk mengendalikan istilah dan akronim yang jarang berlaku.
5) Perancangan Pertanyaan dan Penaakulan Berbilang Langkah Dengan Agen
- Terbaik untuk: Soalan kompleks dan carian berbilang set data
- Perkara yang akan anda bina: Perancang yang menguraikan pertanyaan menjadi sub‑pertanyaan
- Konsep utama:
ReActAgent, SubQuestionQueryEngine, penghalaan
- Mengapa ia hebat: Melangkaui “peroleh kemudian jawab” kepada “berfikir kemudian cari.”
Corak:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) Kebolehcerapan dan Penilaian: Pengesanan, Berasas dan Penanda Aras
- Terbaik untuk: Sesiapa sahaja yang menghasilkan aplikasi sebenar
- Perkara yang akan anda bina: Gelung maklum balas untuk mengesan regresi dan halusinasi
- Konsep utama: Penilaian LlamaIndex, QA bergred, semakan petikan, pengesanan
- Mengapa ia hebat: Mengajar anda untuk mengukur perkara yang penting sebelum menskala
Senarai semak:
- Log semua gesaan/respons dengan kesan.
- Gunakan set data QA bergred untuk ujian regresi.
- Jejaki asas dan liputan petikan.
7) RAG untuk Data Multimodal (Imej, Jadual, Markdown)
- Terbaik untuk: Dokumen dengan carta, tangkapan skrin dan jadual
- Perkara yang akan anda bina: Saluran paip yang mengekstrak teks daripada imej dan penaakulan melalui jadual
- Konsep utama: OCR + penghuraian reka letak, pengepalan jadual, model multimodal
- Mengapa ia hebat: Dokumen dunia sebenar adalah tidak kemas; tutorial ini menunjukkan kepada anda cara menjinakkannya.
8) Berbilang Penyewa dan Pengasingan Perolehan
- Terbaik untuk: Pembina SaaS
- Perkara yang akan anda bina: Perkhidmatan RAG di mana data setiap pelanggan diasingkan
- Konsep utama: Ruang nama, pengawal metadata, indeks setiap penyewa, RBAC
- Mengapa ia hebat: Keselamatan dan privasi mengikut reka bentuk; laluan peningkatan yang bersih.
9) Pengekstrakan Berstruktur pada Skala (Invois, Log, Kontrak)
- Terbaik untuk: Operasi, kewangan, aliran kerja undang-undang
- Perkara yang akan anda bina: Output JSON deterministik dengan pengesahan skema
- Konsep utama: Skema Pydantic, percubaan semula, pengesahan tambahan alatan
- Mengapa ia hebat: Mengurangkan semakan manual dan menjadikan output LLM boleh dipercayai.
10) Corak Pengeluaran Hujung ke Hujung: Daripada Buku Nota kepada CI/CD
- Terbaik untuk: Pasukan yang beralih kepada prod
- Perkara yang akan anda bina: Saluran paip penuh dengan pengambilan data, kerja pengindeksan, penilaian dan get pelepasan
- Konsep utama: Pekerja latar belakang, pengindeksan semula berjadual, bendera ciri
- Mengapa ia hebat: Menunjukkan cara menghantar secara berterusan dengan yakin.
Memilih Tutorial LlamaIndex yang Betul untuk Matlamat Anda
Gunakan penghala pantas ini untuk memilih langkah anda yang seterusnya:
- “Saya memerlukan keputusan hari ini.” Mulakan dengan permulaan pantas (Tutorial #1), kemudian tambahkan penyusunan semula (Tutorial #2).
- “Saya mahukan tindakan, bukan sekadar jawapan.” Lompat ke panggilan fungsi dan agen (Tutorial #3 dan #5).
- “Kami mempunyai keperluan skala dan pematuhan.” Corak storan + berbilang penyewa (Tutorial #4 dan #8).
- “Bagaimanakah kita mempercayai jawapan itu?” Penilaian dan pengesanan (Tutorial #6).
- “Dokumen kami banyak visual.” RAG multimodal (Tutorial #7).
- “Kami memerlukan data berstruktur.” Gunakan skema dan pengesah (Tutorial #9).
Selaman Dalam: Amalan Terbaik Yang Akan Anda Lihat Merentasi Tutorial LlamaIndex Teratas
1) Pengepalan ialah Keputusan Produk
- Tolak ansur: Cebisan yang lebih besar = lebih banyak konteks tetapi kos token yang lebih tinggi; cebisan yang lebih kecil = perolehan yang lebih tinggi tetapi makna yang berpecah-belah.
- Lalai yang baik: 512–1024 token dengan ~10–20% pertindihan.
- Metadata penting: Kekalkan sumber, halaman, bahagian, tajuk.
2) Kualiti Perolehan Mengatasi Saiz Model
- Penyusunan semula: Tambahkan pengekod silang atau penyusun semula pembenaman untuk MRR yang lebih baik.
- Carian hibrid: Gabungkan BM25 untuk istilah yang jarang berlaku dengan pembenaman untuk semantik.
- Penapis: Sempitkan mengikut jenis dokumen, tarikh atau penyewa untuk meningkatkan ketepatan.
3) Nilaikan Awal, Nilaikan Sentiasa
- QA bergred: Bina set kecil pasangan soalan–jawapan dengan petikan.
- Metrik: Ketepatan jawapan, asas, kependaman dan kos setiap pertanyaan.
- A/B dengan selamat: Bayangan gunakan pengepalan atau perolehan baharu sebelum memotong.
4) Jadikan Tindakan Kelas Pertama
- Output berstruktur: Gunakan skema untuk tugas pengekstrakan.
- Alatan: Balut API (carian, kalendar, DB) sebagai fungsi untuk dipanggil oleh agen.
- Rel panduan: Sahkan output, laksanakan percubaan semula, log ralat alatan.
5) Kebersihan Kos dan Kependaman
- Benamkan cache: Nyahduplikasikan teks dan gunakan semula vektor merentasi binaan.
- Operasi kelompok: Indeks secara pukal; strim jawapan untuk meningkatkan UX.
- Konteks yang lebih bijak: Jangan terlebih isi gesaan—top‑k + susun semula sahaja.
Pelan Pembelajaran 7 Hari Menggunakan Tutorial LlamaIndex Terbaik
- Hari 1: Permulaan pantas (Tutorial #1). Bina sembang melalui PDF 20 halaman. Hantar CLI.
- Hari 2: Tingkatkan perolehan (Tutorial #2). Tambahkan penyusun semula + carian hibrid.
- Hari 3: Tambahkan panggilan fungsi (Tutorial #3). Cipta alatan untuk Soalan Lazim dalam API anda.
- Hari 4: Beralih ke gedung vektor sebenar (Tutorial #4). Gunakan pgvector secara tempatan.
- Hari 5: Perkenalkan perancang (Tutorial #5). Halakan soalan merentasi dua indeks.
- Hari 6: Tambahkan penilaian (Tutorial #6). Cipta set ujian 30 soalan dan garis dasar.
- Hari 7: Lulus pengeluaran (Tutorial #10). Kerja latar belakang, kebolehcerapan, CI.
Contoh Projek: "Renjer Dokumen" Dengan LlamaIndex
- Matlamat: Pembantu dalaman selamat yang menjawab soalan tentang dokumen proses dan membuka tiket.
- Tindanan: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
- Ambil eksport Confluence dan PDF (kekalkan metadata + ACL).
- Cebisan pada 768 token; indeks ke pgvector.
- Tambahkan perolehan hibrid dan penyusun semula.
- Cipta alatan:
create_jira_ticket, lookup_oncall, fetch_policy.
- Tambahkan penilaian dengan 50 soalan yang dipilih susun; ukur asas.
- Gunakan dengan UI penstriman dan pratonton petikan.
- Hasil: Jawapan pantas yang dipetik; automasi tugas satu‑klik; ketepatan yang boleh diukur.
Kesilapan Lazim Yang Tutorial Ini Bantu Anda Elakkan
- Melangkau penilaian: Jika anda tidak menguji, anda akan menghantar regresi.
- Mengabaikan metadata: Anda akan kehilangan atribusi sumber dan kuasa penghalaan.
- Cebisan bersaiz besar: Token kembung meningkatkan kos tanpa jawapan yang lebih baik.
- Alatan yang kurang dinyatakan: Agen memerlukan input yang jelas dan output deterministik.
- Tiada pengasingan: RAG berbilang penyewa mesti menghalang kebocoran merentas pelanggan.
Alatan Yang Melengkapkan Tutorial LlamaIndex
- Gedung vektor: pgvector, Pinecone, Weaviate, Qdrant
- Penyusun semula: Cohere Rerank, FlagEmbedding, Voyage rerank
- Pencebis: Pencebis semantik, pencebis sedar jadual
- Penilaian: QA gaya Ragas, penilaian LlamaIndex, penggred rubrik tersuai
- UI: Streamlit, Next.js, soket web FastAPI untuk token penstriman
Ngomong-ngomong, jika anda suka belajar dengan melakukan di dalam penyemak imbas anda, perlu diingatkan bahawa Sider.ai membolehkan anda berbual dengan kod, dokumen dan halaman web bersebelahan. Anda boleh menampal coretan daripada tutorial LlamaIndex, menjalankan gesaan dan membuat lelaran dengan lebih pantas—berguna untuk menguji gesaan RAG dan mengekstrak output berstruktur semasa anda mengikuti. Perkara Yang Perlu Dicari: Mencari Tutorial LlamaIndex Terkini
- “tutorial LlamaIndex terbaik 2025”
- “LlamaIndex permulaan pantas RAG pdf”
- “Contoh LlamaIndex SubQuestionQueryEngine”
- “Tutorial asas penilaian LlamaIndex”
- “Panduan LlamaIndex pgvector Pinecone”
- “Contoh panggilan fungsi agen LlamaIndex”
Cari kod terkini menggunakan Settings.llm, Settings.embed_model, VectorStoreIndex dan as_query_engine—ini ialah idiom semasa.
Perkara Utama
- Tutorial LlamaIndex terbaik membantu anda menghantar hasil, bukan sekadar coretan kod.
- Mulakan dengan sembang melalui dokumen, kemudian lapiskan dalam kualiti perolehan, alatan dan penilaian.
- Gunakan gedung vektor sebenar, tambahkan perancang untuk soalan kompleks dan uji tanpa henti.
- Pilihan seni bina kecil—pengepalan, penyusunan semula, penapis—mengubah hasil lebih daripada menukar model.
- Pembelajaran dipercepatkan apabila anda mengikuti pelan berstruktur dan membina sesuatu yang sebenar.
Perkara Seterusnya
- Pilih satu tutorial daripada tiga teratas dan bina aplikasi minimum hari ini.
- Tambahkan penilaian sebelum anda menskalakan pengguna.
- Rancang penghijrahan pengeluaran anda: storan, pengesahan, kebolehcerapan dan CI.
- Lawati semula tutorial lanjutan (agen, multimodal, berbilang penyewa) apabila skop anda berkembang.
Soalan Lazim
S1:Apakah tutorial LlamaIndex terbaik untuk pemula?
Mulakan dengan permulaan pantas yang membina sembang melalui PDF anda menggunakan VectorStoreIndex dan SimpleDirectoryReader. Kemudian tambahkan tutorial tentang pengepalan, metadata dan penyusunan semula untuk meningkatkan kualiti perolehan.
S2:Bagaimanakah cara saya membina aplikasi RAG pengeluaran dengan LlamaIndex?
Ikuti tutorial yang meliputi gedung vektor (pgvector, Pinecone), perolehan hibrid dan penilaian dengan QA bergred. Tambahkan pengesanan, output berstruktur dan CI/CD untuk beralih daripada buku nota kepada pengeluaran.
S3:Tutorial LlamaIndex manakah yang mengajar agen dan penggunaan alatan?
Cari panduan menggunakan agen gaya ReAct, QueryPipeline dan panggilan fungsi dengan skema Pydantic. Tutorial ini menunjukkan cara menghalakan pertanyaan, memanggil API dan mengembalikan JSON berstruktur.
S4:Bagaimanakah saya boleh menilai ketepatan RAG LlamaIndex?
Gunakan tutorial penilaian yang memperkenalkan semakan asas, liputan petikan dan set data QA bergred. Jejaki ketepatan, kependaman dan kos untuk menangkap regresi sebelum menggunakan.
S5:Adakah terdapat tutorial LlamaIndex untuk dokumen multimodal?
Ya, cari tutorial yang menggabungkan OCR dan penghuraian reka letak untuk imej dan jadual, kemudian indeks teks yang diekstrak dengan metadata. Ia menunjukkan cara mengendalikan carta, tangkapan skrin dan PDF kompleks dalam RAG.