Sider.ai
  • Chat
  • Wisebase
  • Peralatan
  • Perpanjangan
  • Klien
  • Harga
Unduh sekarang
Gabung

Belajar lebih cepat, berpikir lebih dalam, dan tumbuh lebih cerdas dengan Sider.

Produk
Aplikasi
  • Ekstensi
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Alat
  • Pembuat WebNew
  • AI SlidesNew
  • Penulis Esai AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Generator Gambar AI
  • Generator Otak Italia
  • Penghapus Latar Belakang
  • Pengubah Latar Belakang
  • Penghapus Foto
  • Penghapus Teks
  • Inpaint
  • Peningkat Gambar
  • Buat
  • Penerjemah AI
  • Penerjemah Gambar
  • Penerjemah PDF
Sider
  • Hubungi Kami
  • Pusat Bantuan
  • Unduh
  • Harga
  • Rencana Pendidikan
  • Apa yang Baru
  • Blog
  • Komunitas
  • Mitra
  • Afiliasi
  • Undang
©2026 Semua Hak Dilindungi
Syarat Penggunaan
Kebijakan Privasi
  • Halaman Beranda
  • Blog
  • Alat AI
  • 10 Tutorial LlamaIndex Terbaik untuk Menguasai RAG di Tahun 2025

10 Tutorial LlamaIndex Terbaik untuk Menguasai RAG di Tahun 2025

Diperbarui pada 23 Sep 2025

9 menit


10 Tutorial LlamaIndex Terbaik untuk Menguasai RAG di Tahun 2025

Jika Anda pernah mendengar bahwa Retrieval-Augmented Generation (RAG) dapat membuat aplikasi LLM Anda lebih pintar, Anda benar. Cara tercepat untuk mengirimkan asisten AI seperti pencarian yang andal saat ini adalah dengan mempelajari LlamaIndex dengan baik—dan tutorial LlamaIndex terbaik dapat memangkas kurva belajar Anda dari hitungan bulan menjadi hari.
Dalam panduan ini, kami memilihkan tutorial LlamaIndex terbaik untuk setiap tingkatan—mulai dari yang bisa langsung di- hingga tingkat produksi. Anda akan menemukan panduan video, buku catatan langsung, dan resep lanjutan untuk data multi-, ekstraksi terstruktur, agen, dan evaluasi.
Kami juga akan memetakan setiap tutorial ke keterampilan atau hasil yang Anda inginkan: membangun obrolan di atas dokumen Anda, menskalakan , menambahkan alat, melakukan jawaban, atau memverifikasi hasil.
Pada akhirnya, Anda akan tahu tutorial LlamaIndex mana yang harus dimulai, mana yang harus diikuti selanjutnya, dan bagaimana menggabungkannya menjadi produk nyata.

Mengapa Tutorial LlamaIndex Penting Saat Ini

  • RAG adalah bentuk waktu kini dari aplikasi AI. LLM berhalusinasi; RAG mendasarkan jawaban pada data Anda.
  • LlamaIndex adalah tumpukan RAG yang paling kohesif. Ini membungkus pengindeksan, pengambilan, perencanaan kueri, observabilitas, dan evaluasi ke dalam modul-modul yang dapat dikomposisikan yang bekerja dengan baik dengan LangChain, OpenAI, Anthropic, dan LLM sumber terbuka.
  • Tutorial adalah jalur cepat Anda. Tutorial LlamaIndex terbaik menunjukkan tidak hanya kode, tetapi juga keputusan arsitektur: , , , dan .
Jika tujuan Anda adalah: “Mengobrol dengan dokumen saya dan jangan berhalusinasi,” daftar ini akan membawa Anda ke sana.

Bagaimana Kami Memilih Tutorial LlamaIndex Terbaik

  • Berorientasi pada hasil: Anda harus mengirimkan sesuatu yang bermanfaat setelah setiap tutorial.
  • Terbaru untuk tahun 2025: Mencerminkan API LlamaIndex saat ini (misalnya, VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
  • Sadar produksi: Menunjukkan evaluasi, penelusuran, dan iterasi—lebih dari sekadar .
  • Luas + mendalam: Dari hingga agen, multimodal, dan ekstraksi terstruktur.

10 Tutorial LlamaIndex Terbaik (Pilihan Sendiri)

Di bawah ini adalah jalur yang dikurasi. Mulailah dari level Anda; lompat jika diperlukan.

1) 15 Menit: Mengobrol dengan PDF Anda

  • Terbaik untuk: Pemula mutlak dan manajer produk
  • Apa yang akan Anda bangun: Unggah PDF, indeks, ajukan pertanyaan, dapatkan sitasi
  • Konsep utama: SimpleDirectoryReader, VectorStoreIndex, Settings,
  • Mengapa ini bagus: Kode minimal, momen maksimal
Contoh kerangka:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
  • Apa yang akan Anda pelajari selanjutnya: Ukuran , , dan mengapa penting.

2) Dasar-Dasar RAG Dengan , Metadata, dan

  • Terbaik untuk: Pemula → menengah
  • Apa yang akan Anda bangun: Pengambil yang lebih pintar dengan kualitas konteks yang lebih baik
  • Konsep utama: SentenceSplitter, filter metadata, komponen rerank
  • Mengapa ini bagus: Menunjukkan bagaimana beberapa kenop secara drastis mengurangi halusinasi
Coba:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
  • Hasil: Jendela konteks berkualitas lebih tinggi untuk dokumen panjang.

3) LlamaIndex + OpenAI Function Calling (Penggunaan Alat & Output Terstruktur)

  • Terbaik untuk: Pembuat yang mengotomatiskan alur kerja
  • Apa yang akan Anda bangun: Agen yang memanggil alat dan mengembalikan skema JSON
  • Konsep utama: QueryPipeline, spesifikasi alat, skema Pydantic,
  • Mengapa ini bagus: Menjembatani Tanya Jawab dengan tindakan nyata (pencarian, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
  • Hasil: Pola siap produksi untuk ekstraksi dan tindakan terstruktur.

4) Membangun Produksi (Postgres, Pinecone, Weaviate)

  • Terbaik untuk: Tim yang berencana untuk melakukan penskalaan
  • Apa yang akan Anda bangun: Penyimpanan vektor yang tahan lama dengan filter dan pencarian hibrida
  • Konsep utama: Adaptor VectorStoreIndex, hibrida BM25+, metadata
  • Mengapa ini bagus: Mengajarkan persistensi, migrasi, dan pengendalian biaya
Tips:
  • Gunakan Postgres/pgvector untuk penerapan yang sederhana dan terjangkau.
  • Pinecone/Weaviate untuk skala terkelola; sesuaikan ef_construction, ef_search.
  • Tambahkan pengambilan hibrida untuk menangani istilah dan akronim yang jarang.

5) Perencanaan Kueri dan Penalaran Multi-Langkah Dengan Agen

  • Terbaik untuk: Pertanyaan kompleks dan pencarian multi-
  • Apa yang akan Anda bangun: Perencana yang menguraikan kueri menjadi sub-kueri
  • Konsep utama: ReActAgent, SubQuestionQueryEngine,
  • Mengapa ini bagus: Bergerak melampaui “ambil lalu jawab” menjadi “berpikir lalu mencari.”
Pola:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Observabilitas dan Evaluasi: Penelusuran, Landasan, dan Tolok Ukur

  • Terbaik untuk: Siapa pun yang mengirimkan aplikasi nyata
  • Apa yang akan Anda bangun: Lingkaran umpan balik untuk mendeteksi regresi dan halusinasi
  • Konsep utama: Evaluasi LlamaIndex, QA bergradasi, pemeriksaan sitasi, penelusuran
  • Mengapa ini bagus: Mengajari Anda untuk mengukur apa yang penting sebelum melakukan penskalaan
Daftar periksa:
  • Catat semua /respons dengan penelusuran.
  • Gunakan QA bergradasi untuk pengujian regresi.
  • Lacak landasan dan cakupan sitasi.

7) RAG untuk Data Multimodal (Gambar, Tabel, Markdown)

  • Terbaik untuk: Dokumen dengan bagan, tangkapan layar, dan tabel
  • Apa yang akan Anda bangun: yang mengekstrak teks dari gambar dan bernalar di atas tabel
  • Konsep utama: OCR + penguraian tata letak, tabel, model multimodal
  • Mengapa ini bagus: Dokumen dunia nyata berantakan; tutorial ini menunjukkan cara menjinakkannya.

8) Multi- dan Isolasi Pengambilan

  • Terbaik untuk: Pembuat SaaS
  • Apa yang akan Anda bangun: Layanan RAG tempat data setiap pelanggan diisolasi
  • Konsep utama: Ruang nama, penjaga metadata, indeks per-, RBAC
  • Mengapa ini bagus: Keamanan dan privasi berdasarkan desain; jalur peningkatan yang bersih.

9) Ekstraksi Terstruktur dalam Skala Besar (Faktur, Log, Kontrak)

  • Terbaik untuk: Operasi, keuangan, alur kerja hukum
  • Apa yang akan Anda bangun: Output JSON deterministik dengan validasi skema
  • Konsep utama: Skema Pydantic, percobaan ulang, validasi yang ditambah alat
  • Mengapa ini bagus: Mengurangi peninjauan manual dan membuat output LLM menjadi andal.

10) Pola Produksi Ujung-ke-Ujung: Dari Buku Catatan ke CI/CD

  • Terbaik untuk: Tim yang pindah ke produksi
  • Apa yang akan Anda bangun: lengkap dengan penyerapan data, pekerjaan pengindeksan, evaluasi, dan gerbang rilis
  • Konsep utama: Pekerja latar belakang, penjadwalan pengindeksan ulang,
  • Mengapa ini bagus: Menunjukkan cara mengirimkan secara berkelanjutan dengan percaya diri.

Memilih Tutorial LlamaIndex yang Tepat untuk Tujuan Anda

Gunakan cepat ini untuk memilih langkah Anda selanjutnya:
  • “Saya membutuhkan hasil hari ini.” Mulailah dengan (Tutorial #1), lalu tambahkan (Tutorial #2).
  • “Saya ingin tindakan, bukan hanya jawaban.” Lompat ke dan agen (Tutorial #3 dan #5).
  • “Kami memiliki kebutuhan skala dan kepatuhan.” Pola penyimpanan + multi- (Tutorial #4 dan #8).
  • “Bagaimana kami mempercayai jawaban?” Evaluasi dan penelusuran (Tutorial #6).
  • “Dokumen kami sangat visual.” RAG Multimodal (Tutorial #7).
  • “Kami membutuhkan data terstruktur.” Gunakan skema dan validator (Tutorial #9).

Pendalaman: Praktik Terbaik yang Akan Anda Lihat di Seluruh Tutorial LlamaIndex Teratas

1) Adalah Keputusan Produk

  • <i>Trade‑off</i>: yang lebih besar = lebih banyak konteks tetapi biaya token lebih tinggi; yang lebih kecil = lebih tinggi tetapi makna terfragmentasi.
  • <i>Default</i> yang baik: 512–1024 token dengan ~10–20% tumpang tindih.
  • Metadata penting: Pertahankan sumber, halaman, bagian, judul.

2) Kualitas Pengambilan Mengalahkan Ukuran Model

  • <i>Reranking</i>: Tambahkan atau untuk MRR yang lebih baik.
  • Pencarian hibrida: Gabungkan BM25 untuk istilah langka dengan untuk semantik.
  • Filter: Sempitkan berdasarkan jenis dokumen, tanggal, atau untuk meningkatkan presisi.

3) Evaluasi Dini, Evaluasi Selalu

  • QA Bergradasi: Bangun serangkaian kecil pasangan pertanyaan–jawaban dengan sitasi.
  • Metrik: Kebenaran jawaban, landasan, latensi, dan biaya per kueri.
  • A/B dengan aman: Sebarkan atau pengambil baru sebelum beralih.

4) Jadikan Tindakan Kelas Utama

  • Output terstruktur: Gunakan skema untuk tugas ekstraksi.
  • Alat: Bungkus API (pencarian, kalender, DB) sebagai fungsi untuk dipanggil oleh agen.
  • <i>Guardrail</i>: Validasi output, terapkan percobaan ulang, catat kesalahan alat.

5) Kebersihan Biaya dan Latensi

  • Cache <i>embedding</i>: Hilangkan duplikasi teks dan gunakan kembali vektor di seluruh .
  • Operasi batch: Indeks secara massal; jawaban untuk meningkatkan UX.
  • Konteks yang lebih cerdas: Jangan terlalu memenuhi — + sebagai gantinya.

Rencana Pembelajaran 7 Hari Menggunakan Tutorial LlamaIndex Terbaik

  • Hari 1: (Tutorial #1). Bangun obrolan di atas PDF 20 halaman. Kirimkan CLI.
  • Hari 2: Tingkatkan pengambilan (Tutorial #2). Tambahkan + pencarian hibrida.
  • Hari 3: Tambahkan (Tutorial #3). Buat alat untuk FAQ di API Anda.
  • Hari 4: Pindah ke nyata (Tutorial #4). Gunakan pgvector secara lokal.
  • Hari 5: Perkenalkan perencana (Tutorial #5). Rute pertanyaan di dua indeks.
  • Hari 6: Tambahkan evaluasi (Tutorial #6). Buat set pengujian 30 pertanyaan dan garis dasar.
  • Hari 7: Lulus produksi (Tutorial #10). Pekerjaan latar belakang, observabilitas, CI.

Contoh Proyek: "Concierge Dokumen" Dengan LlamaIndex

  • Tujuan: Asisten internal yang aman yang menjawab pertanyaan tentang dokumen proses dan membuka tiket.
  • Tumpukan: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
  • Langkah:
  1. Serap ekspor Confluence dan PDF (simpan metadata + ACL).
  1. pada 768 token; indeks ke pgvector.
  1. Tambahkan pengambilan hibrida dan .
  1. Buat alat: create_jira_ticket, lookup_oncall, fetch_policy.
  1. Tambahkan evaluasi dengan 50 pertanyaan yang dikurasi; ukur landasan.
  1. Sebarkan dengan UI dan pratinjau sitasi.
  • Hasil: Jawaban cepat yang dikutip; otomatisasi tugas sekali klik; akurasi terukur.

Kesalahan Umum Yang Dibantu Dihindari Oleh Tutorial Ini

  • Melewatkan evaluasi: Jika Anda tidak menguji, Anda akan mengirimkan regresi.
  • Mengabaikan metadata: Anda akan kehilangan atribusi sumber dan kekuatan .
  • <i>Chunk</i> yang terlalu besar: Pembengkakan token meningkatkan biaya tanpa jawaban yang lebih baik.
  • Alat yang kurang spesifik: Agen membutuhkan input yang jelas dan output deterministik.
  • Tidak ada isolasi: RAG multi- harus mencegah kebocoran lintas pelanggan.

Alat Yang Melengkapi Tutorial LlamaIndex

  • <i>Vector store</i>: pgvector, Pinecone, Weaviate, Qdrant
  • <i>Reranker</i>: Cohere Rerank, FlagEmbedding, Voyage rerank
  • <i>Chunker</i>: Pemisah semantik, pemisah sadar tabel
  • Evaluasi: QA gaya Ragas, evaluasi LlamaIndex, rubrik khusus
  • UI: Streamlit, Next.js, FastAPI untuk token
Omong-omong, jika Anda suka belajar dengan melakukan di dalam Anda, perlu dicatat bahwa Sider.ai memungkinkan Anda mengobrol dengan kode, dokumen, dan halaman web secara berdampingan. Anda dapat menempelkan cuplikan dari tutorial LlamaIndex, menjalankan , dan melakukan iterasi lebih cepat—berguna untuk menguji RAG dan mengekstrak output terstruktur saat Anda mengikuti.

Apa yang Harus Dicari: Menemukan Tutorial LlamaIndex Terbaru

  • “tutorial LlamaIndex terbaik 2025”
  • “LlamaIndex RAG pdf”
  • “Contoh LlamaIndex SubQuestionQueryEngine”
  • “Tutorial landasan evaluasi LlamaIndex”
  • “Panduan LlamaIndex pgvector Pinecone”
  • “Contoh agen LlamaIndex”
Cari kode terbaru menggunakan Settings.llm, Settings.embed_model, VectorStoreIndex, dan as_query_engine—ini adalah idiom saat ini.

Poin-Poin Penting

  • Tutorial LlamaIndex terbaik membantu Anda mengirimkan hasil, bukan hanya cuplikan kode.
  • Mulailah dengan obrolan di atas dokumen, lalu lapisi dengan kualitas pengambilan, alat, dan evaluasi.
  • Gunakan nyata, tambahkan perencana untuk pertanyaan kompleks, dan uji tanpa henti.
  • Pilihan arsitektur kecil—, , filter—mengubah hasil lebih dari menukar model.
  • Pembelajaran dipercepat ketika Anda mengikuti rencana terstruktur dan membangun sesuatu yang nyata.

Apa Selanjutnya

  • Pilih satu tutorial dari tiga teratas dan bangun aplikasi minimal hari ini.
  • Tambahkan evaluasi sebelum Anda menskalakan pengguna.
  • Rencanakan migrasi produksi Anda: penyimpanan, otentikasi, observabilitas, dan CI.
  • Kunjungi kembali tutorial lanjutan (agen, multimodal, multi-) seiring pertumbuhan cakupan Anda.

FAQ

Q1:Apa tutorial LlamaIndex terbaik untuk pemula? Mulailah dengan yang membangun obrolan di atas PDF Anda menggunakan VectorStoreIndex dan SimpleDirectoryReader. Kemudian tambahkan tutorial tentang , metadata, dan untuk meningkatkan kualitas pengambilan.
Q2:Bagaimana cara membangun aplikasi RAG produksi dengan LlamaIndex? Ikuti tutorial yang mencakup (pgvector, Pinecone), pengambilan hibrida, dan evaluasi dengan QA bergradasi. Tambahkan penelusuran, output terstruktur, dan CI/CD untuk berpindah dari buku catatan ke produksi.
Q3:Tutorial LlamaIndex mana yang mengajarkan agen dan penggunaan alat? Cari panduan menggunakan agen gaya ReAct, QueryPipeline, dan dengan skema Pydantic. Tutorial ini menunjukkan cara merutekan kueri, memanggil API, dan mengembalikan JSON terstruktur.
Q4:Bagaimana cara mengevaluasi akurasi RAG LlamaIndex? Gunakan tutorial evaluasi yang memperkenalkan pemeriksaan landasan, cakupan sitasi, dan QA bergradasi. Lacak kebenaran, latensi, dan biaya untuk menangkap regresi sebelum menerapkan.
Q5:Apakah ada tutorial LlamaIndex untuk dokumen multimodal? Ya, cari tutorial yang menggabungkan OCR dan penguraian tata letak untuk gambar dan tabel, lalu indeks teks yang diekstraksi dengan metadata. Mereka menunjukkan cara menangani bagan, tangkapan layar, dan PDF kompleks di RAG.

Artikel Terbaru
Cara Menguasai ChatPDF: Mendapatkan Wawasan Lebih Cepat dari Dokumen Padat

Cara Menguasai ChatPDF: Mendapatkan Wawasan Lebih Cepat dari Dokumen Padat

Alternatif Terbaik X Auto-Translation untuk Dokumen Cepat dan Akurat

Alternatif Terbaik X Auto-Translation untuk Dokumen Cepat dan Akurat

Terjemahan AI Samsung Tidak Tersedia di Iran? Solusi Praktis

Terjemahan AI Samsung Tidak Tersedia di Iran? Solusi Praktis

Alat Terjemahan Persia: Panduan Praktis untuk Pekerjaan yang Lebih Cepat dan Akurat

Alat Terjemahan Persia: Panduan Praktis untuk Pekerjaan yang Lebih Cepat dan Akurat

Alternatif Terbaik Grok untuk Riset Mendalam dengan Referensi

Alternatif Terbaik Grok untuk Riset Mendalam dengan Referensi

15 Fitur Terbaik dari AI Image Generator yang Benar-Benar Akan Anda Gunakan

15 Fitur Terbaik dari AI Image Generator yang Benar-Benar Akan Anda Gunakan