What are the best LlamaIndex tutorials for beginners?

Start with a quickstart that builds chat over your PDFs using VectorStoreIndex and SimpleDirectoryReader. Then add a tutorial on chunking, metadata, and reranking to boost retrieval quality.

How do I build a production RAG app with LlamaIndex?

Follow tutorials that cover vector stores (pgvector, Pinecone), hybrid retrieval, and evaluation with graded QA. Add tracing, structured outputs, and CI/CD to move from notebooks to production.

Which LlamaIndex tutorial teaches agents and tool use?

Look for guides using ReAct-style agents, QueryPipeline, and function calling with Pydantic schemas. These tutorials show how to route queries, call APIs, and return structured JSON.

How can I evaluate LlamaIndex RAG accuracy?

Use evaluation tutorials that introduce groundedness checks, citation coverage, and graded QA datasets. Track correctness, latency, and cost to catch regressions before deploying.

Are there LlamaIndex tutorials for multimodal documents?

Yes, seek tutorials that combine OCR and layout parsing for images and tables, then index the extracted text with metadata. They show how to handle charts, screenshots, and complex PDFs in RAG.

10 geriausių LlamaIndex mokymų, skirtų įvaldyti RAG 2025 metais

Jei girdėjote, kad Retrieval-Augmented Generation (RAG) gali padaryti jūsų LLM programas išmanesnes, tai tiesa. Greičiausias būdas šiandien sukurti patikimą, paieškos tipo AI asistentą – gerai išmokti LlamaIndex, o geriausi LlamaIndex mokymai gali sutrumpinti jūsų mokymosi laiką nuo mėnesių iki dienų.

Šiame vadove parinkome geriausius LlamaIndex mokymus visiems lygiams – nuo greitų kopijavimo-pradžios pamokų iki gamybos lygio sprendimų. Rasite vaizdo įrašų peržiūras, praktinius užrašų knygelius ir pažangias receptūras daugiafunkciniams duomenims, struktūruotam išgavimui, agentams ir vertinimui.

Taip pat susiesime kiekvieną mokymą su įgūdžiais ar rezultatais, kurie jums svarbūs: pokalbių kūrimas su dokumentais, įterpinių mastelio didinimas, įrankių pridėjimas, atsakymų srautinimas ar rezultatų patikra.

Vadovo pabaigoje žinosite, nuo kurio LlamaIndex mokymo pradėti, kuriuos toliau sekti ir kaip juos derinti į tikrą produktą.

Kodėl LlamaIndex mokymai svarbūs būtent dabar

RAG yra dabartis AI programoms. LLM gali klaidžioti; RAG pagrindžia atsakymus jūsų duomenyse.

LlamaIndex yra labiausiai integruotas RAG paketas. Jis apjungia indeksavimą, paiešką, užklausų planavimą, stebėjimą ir vertinimą į modulius, kurie puikiai veikia su LangChain, OpenAI, Anthropic ir atvirojo kodo LLM.

Mokymai yra jūsų greitas kelias. Geriausi LlamaIndex mokymai demonstruoja ne tik kodą, bet ir architektūrinius sprendimus: duomenų skaidymą, perrikiavimą, talpyklą ir saugumo priemones.

Jei jūsų tikslas yra: „Pokalbis su mano dokumentais be klaidų“, šis sąrašas jums padės.

Kaip parinkome geriausius LlamaIndex mokymus

Rezultatais pagrįsti: Po kiekvieno mokymo turėtumėte sukurti ką nors naudingo.

Atnaujinti 2025 metams: Atspindi dabartines LlamaIndex API (pvz., VectorStoreIndex, Settings, QueryPipeline, ReActAgent).

Gamybai pritaikyti: Rodo vertinimą, sekimą ir iteraciją – ne tik „hello world“.

Įvairiapusiškumas ir gilumas: Nuo greitų pradžių iki agentų, multimodalių ir struktūruoto išgavimų.

10 geriausių LlamaIndex mokymų (atsirinkti)

Žemiau pateikiamas atrinktas kelias. Pradėkite nuo savo lygio; pereikite ten, kur reikia.

1) 15 minučių greita pradžia: pokalbis su PDF dokumentais

Geriausia skirti: visiškai pradedantiesiems ir produktų vadovams

Ką sukursite: įkelsite PDF, indeksuosite, užduosite klausimus, gausite citatas

Pagrindinės sąvokos: SimpleDirectoryReader, VectorStoreIndex, Settings, įterpiniai

Kodėl tai puiku: minimalus kodas, maksimalus „aha!“ momentas

Pavyzdinis šablonas:

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)

Ką išmoksite toliau: duomenų gabalų dydis, top-k reikšmė ir kodėl svarbus perrikiavimas.

2) RAG pagrindai su duomenų gabalais, metaduomenimis ir perrikiavimu

Geriausia skirti: nuo pradedančiųjų iki vidutinio lygio

Ką sukursite: išmanesnį paieškos variklį su geresnės kokybės kontekstu

Pagrindinės sąvokos: SentenceSplitter, metaduomenų filtrai, rerank komponentai

Kodėl tai puiku: rodo, kaip keletas parametrų žymiai sumažina klaidas

Išbandykite:

from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# pridėkite metaduomenis, pvz., šaltinį, puslapį, skyrių įkėlimo metu
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)

Rezultatas: aukštesnės kokybės konteksto langai ilgoms dokumentų dalims.

3) LlamaIndex + OpenAI funkcijų kvietimas (įrankių naudojimas ir struktūruotas išvestis)

Geriausia skirti: kūrėjams, automatizuojantiems darbo eigas

Ką sukursite: agentą, kuris kviečia įrankius ir grąžina JSON schemas

Pagrindinės sąvokos: QueryPipeline, įrankių specifikacija, Pydantic schemos, funkcijų kvietimas

Kodėl tai puiku: sujungia klausimus-atsakymus su tikromis operacijomis (paieška, CRUD, API)

from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# įrašykite į savo sistemą
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))

Rezultatas: gamybai paruošti modeliai struktūruotam išgavimui ir veiksmams.

4) Gamybinio vektorinio saugyklos kūrimas (Postgres, Pinecone, Weaviate)

Geriausia skirti: komandoms, planuojančioms augimą

Ką sukursite: patvarią vektorinę saugyklą su filtrais ir hibridine paieška

Pagrindinės sąvokos: VectorStoreIndex adapteriai, hibridinis BM25+embedding, metaduomenys

Kodėl tai puiku: moko duomenų išsaugojimo, migracijų ir kaštų valdymo

Patarimai:

Naudokite Postgres/pgvector paprastam ir nebrangiam diegimui.

Pinecone/Weaviate – valdomam masteliui; reguliuokite ef_construction, ef_search parametrus.

Pridėkite hibridinę paiešką, kad apdorotumėte retus terminus ir santrumpas.

5) Užklausų planavimas ir daugiapakopis mąstymas su agentais

Geriausia skirti: sudėtingiems klausimams ir daugiaduomenių paieškai

Ką sukursite: planuotoją, kuris skaidys užklausą į sub-užklausas

Pagrindinės sąvokos: ReActAgent, SubQuestionQueryEngine, maršrutizavimas

Kodėl tai puiku: pereina nuo „rasti ir atsakyti“ prie „pagalvoti ir ieškoti“.

Šablonas:

from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# tarkime, turite kelis indeksus
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Stebėjimas ir vertinimas: sekimas, pagrįstumas ir etalonai

Geriausia skirti: visiems, kurie diegia realias programas

Ką sukursite: atsiliepimų ciklus regresijoms ir klaidoms aptikti

Pagrindinės sąvokos: LlamaIndex vertinimai, įvertinta QA, citatų patikra, sekimas

Kodėl tai puiku: moko matuoti svarbiausius dalykus prieš plečiant

Kontrolinis sąrašas:

Registruokite visus užklausimus/atsakymus su sekimais.

Naudokite įvertintus QA duomenų rinkinius regresijos testavimui.

Sekite pagrįstumą ir citatų aprėptį.

7) RAG multimodaliniams duomenims (vaizdai, lentelės, Markdown)

Geriausia skirti: dokumentams su diagramomis, ekrano kopijomis ir lentelėmis

Ką sukursite: srautus, kurie ištraukia tekstą iš vaizdų ir analizuoja lenteles

Pagrindinės sąvokos: OCR + išdėstymo analizė, lentelių skaidymas, multimodaliniai modeliai

Kodėl tai puiku: realūs dokumentai dažnai netvarkingi; šis mokymas parodo, kaip juos tvarkyti.

8) Daugiaklientinė aplinka ir paieškos izoliacija

Geriausia skirti: SaaS kūrėjams

Ką sukursite: RAG paslaugą, kur kiekvieno kliento duomenys izoliuoti

Pagrindinės sąvokos: vardų erdvės, metaduomenų apsaugos, klientų indeksai, RBAC

Kodėl tai puiku: saugumas ir privatumas pagal dizainą; aiškūs atnaujinimo keliai.

9) Struktūruotas išgavimas masteliu (sąskaitos, žurnalai, sutartys)

Geriausia skirti: operacijų, finansų, teisės procesams

Ką sukursite: deterministinius JSON išvestis su schemų patikra

Pagrindinės sąvokos: Pydantic schemos, pakartotiniai bandymai, įrankių papildoma patikra

Kodėl tai puiku: sumažina rankinį peržiūrėjimą ir užtikrina patikimą LLM išvestį.

10) Pilnas gamybos modelis: nuo užrašų knygelių iki CI/CD

Geriausia skirti: komandoms, pereinančioms į gamybą

Ką sukursite: pilną srautą su duomenų įkėlimu, indeksavimo darbais, vertinimu ir leidimų kontrolėmis

Pagrindinės sąvokos: foniniai darbai, suplanuotas perindeksavimas, funkcijų žymos

Kodėl tai puiku: parodo, kaip nuolat patikimai diegti produktą.

Kaip pasirinkti tinkamą LlamaIndex mokymą savo tikslui

Naudokite šį greitą gidą, kad pasirinktumėte kitą žingsnį:

„Man reikia rezultatų šiandien.“ Pradėkite nuo greitos pradžios (Mokymas #1), tada pridėkite perrikiavimą (Mokymas #2).

„Noriu veiksmų, ne tik atsakymų.“ Pereikite prie funkcijų kvietimo ir agentų (Mokymai #3 ir #5).

„Turime mastelio ir atitikties reikalavimų.“ Saugykla + daugiaklientiniai modeliai (Mokymai #4 ir #8).

„Kaip pasitikėti atsakymais?“ Vertinimai ir sekimas (Mokymas #6).

„Mūsų dokumentai daugiausia vizualiniai.“ Multimodalinė RAG (Mokymas #7).

„Reikia struktūruotų duomenų.“ Naudokite schemas ir validatorių (Mokymas #9).

Gilus žvilgsnis: geriausios praktikos, kurias rasite geriausiuose LlamaIndex mokymuose

1) Duomenų gabalų skaidymas yra produkto sprendimas

Kompromisas: didesni gabalai = daugiau konteksto, bet didesnės sąnaudos; mažesni gabalai = geresnis atgaminimas, bet prarandama prasmė.

Geri numatyti parametrai: 512–1024 žetonai su ~10–20 % persidengimu.

Metaduomenys svarbūs: išsaugokite šaltinį, puslapį, skyrių, antraštes.

2) Paieškos kokybė svarbesnė už modelio dydį

Perrikiavimas: pridėkite kryžminį koduotoją arba įterpinių perrikiuotoją geresniam MRR.

Hibridinė paieška: derinkite BM25 retoms sąvokoms su įterpiniais semantikai.

Filtrai: siaurinkite pagal dokumento tipą, datą ar klientą, kad pagerintumėte tikslumą.

3) Vertinkite anksti, vertinkite nuolat

Įvertinta QA: sukurkite nedidelį klausimų-atsakymų rinkinį su citatomis.

Metrikos: atsakymų teisingumas, pagrįstumas, vėlavimas ir kaina už užklausą.

Saugus A/B testavimas: išbandykite naujus duomenų gabalų skaidymo ar paieškos variklius šešėlyje prieš perjungiant.

4) Veiksmai turi būti pirmojo lygio

Struktūruota išvestis: naudokite schemas išgavimui.

Įrankiai: apvyniokite API (paieška, kalendorius, DB) kaip funkcijas agentams kvietimui.

Saugumo priemonės: tikrinkite išvestis, įgyvendinkite pakartotinius bandymus, registruokite įrankių klaidas.

5) Sąnaudų ir vėlavimo higiena

Talpinkite įterpinius: pašalinkite dublikatus ir pakartotinai naudokite vektorius per kūrimą.

Partijos operacijos: indeksuokite masiškai; srautiniai atsakymai gerina naudotojo patirtį.

Išmanesnis kontekstas: neperkraukite užklausos – naudokite top-k + perrikiavimą.

7 dienų mokymosi planas naudojant geriausius LlamaIndex mokymus

1 diena: Greita pradžia (Mokymas #1). Sukurkite pokalbį su 20 puslapių PDF. Išleiskite CLI.

2 diena: Pagerinkite paiešką (Mokymas #2). Pridėkite perrikiavimą ir hibridinę paiešką.

3 diena: Pridėkite funkcijų kvietimą (Mokymas #3). Sukurkite įrankį DUK API.

4 diena: Pereikite prie tikros vektorinės saugyklos (Mokymas #4). Vietiniam naudojimui pgvector.

5 diena: Įdiekite planuotoją (Mokymas #5). Maršrutizuokite klausimus per du indeksus.

6 diena: Pridėkite vertinimą (Mokymas #6). Sukurkite 30 klausimų testų rinkinį ir bazinį lygį.

7 diena: Gamybinis etapas (Mokymas #10). Foniniai darbai, stebėjimas, CI.

Pavyzdinis projektas: „Docs Concierge“ su LlamaIndex

Tikslas: saugus vidinis asistentas, atsakantis į klausimus apie procesų dokumentus ir atidarantis užduotis.

Technologijos: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.

Žingsniai:

Įkelkite Confluence eksportus ir PDF (išsaugokite metaduomenis ir ACL).

Skaidykite po 768 žetonus; indeksuokite į pgvector.

Pridėkite hibridinę paiešką ir perrikiavimą.

Sukurkite įrankius: create_jira_ticket, lookup_oncall, fetch_policy.

Pridėkite vertinimą su 50 atrinktų klausimų; matuokite pagrįstumą.

Diegkite su srautinio perdavimo vartotojo sąsaja ir citatų peržiūromis.

Rezultatas: greiti, cituojami atsakymai; vieno spustelėjimo užduočių automatizavimas; matuojamas tikslumas.

Dažnos klaidos, kurių šie mokymai padeda išvengti

Vertinimo praleidimas: jei netestuosite, pristatysite regresijas.

Metaduomenų ignoravimas: prarasite šaltinio priskyrimą ir maršrutizavimo galimybes.

Per dideli duomenų gabalai: žetonų perpildymas didina kainą be geresnių atsakymų.

Neaiškūs įrankių aprašymai: agentams reikia aiškių įėjimų ir deterministinių išėjimų.

Izoliacijos nebuvimas: daugiaklientinė RAG turi užkirsti kelią duomenų nutekėjimui tarp klientų.

Įrankiai, papildantys LlamaIndex mokymus

Vektorinės saugyklos: pgvector, Pinecone, Weaviate, Qdrant

Perrikiuotojai: Cohere Rerank, FlagEmbedding, Voyage rerank

Duomenų gabalų skaidytojai: semantiniai skaidytojai, lentelių skaidytojai

Vertinimai: Ragas tipo QA, LlamaIndex vertinimai, individualūs vertinimo kriterijai

Vartotojo sąsaja: Streamlit, Next.js, FastAPI websockets srautiniams žetonams

Beje, jei jums patinka mokytis praktiškai naršyklėje, verta žinoti, kad Sider.ai leidžia jums kalbėtis su kodu, dokumentais ir tinklalapiais šalia vienas kito. Galite įklijuoti fragmentus iš LlamaIndex mokymų, vykdyti užklausas ir greičiau tobulėti – patogu testuoti RAG užklausas ir išgauti struktūruotas išvestis, kol sekate pamokas.

Ko ieškoti: kaip rasti atnaujintus LlamaIndex mokymus

„geriausi LlamaIndex mokymai 2025“

„LlamaIndex greita pradžia RAG pdf“

„LlamaIndex SubQuestionQueryEngine pavyzdys“

„LlamaIndex vertinimas pagrįstumas mokymas“

„LlamaIndex pgvector Pinecone vadovas“

„LlamaIndex agentai funkcijų kvietimo pavyzdys“

Ieškokite naujausio kodo su Settings.llm, Settings.embed_model, VectorStoreIndex ir as_query_engine – tai dabartinės frazės.

Svarbiausios išvados

Geriausi LlamaIndex mokymai padeda pristatyti rezultatus, ne tik kodo fragmentus.

Pradėkite nuo pokalbių su dokumentais, tada pridėkite paieškos kokybę, įrankius ir vertinimą.

Naudokite tikrą vektorinę saugyklą, pridėkite planuotojus sudėtingiems klausimams ir nuolat testuokite.

Maži architektūriniai sprendimai – duomenų gabalų skaidymas, perrikiavimas, filtrai – daro didesnį poveikį nei modelių keitimas.

Mokymasis pagreitėja, kai laikotės struktūrizuoto plano ir kuriate tikrą produktą.

Kas toliau

Pasirinkite vieną mokymą iš pirmųjų trijų ir šiandien sukurkite minimalų programėlę.

Pridėkite vertinimą prieš plečiant naudotojus.

Planuokite gamybos migraciją: saugyklą, autentifikaciją, stebėjimą ir CI.

Grįžkite prie pažangių mokymų (agentų, multimodalinių, daugiaklientinių), kai augs jūsų apimtis.

DUK

K1: Kokie yra geriausi LlamaIndex mokymai pradedantiesiems? Pradėkite nuo greitos pradžios, kuri sukuria pokalbį su jūsų PDF naudojant VectorStoreIndex ir SimpleDirectoryReader. Tada pridėkite mokymą apie duomenų gabalų skaidymą, metaduomenis ir perrikiavimą, kad pagerintumėte paieškos kokybę.

K2: Kaip sukurti gamybinę RAG programą su LlamaIndex? Sekite mokymus, apimančius vektorinę saugyklą (pgvector, Pinecone), hibridinę paiešką ir vertinimą su įvertinta QA. Pridėkite sekimą, struktūruotas išvestis ir CI/CD, kad pereitumėte nuo užrašų knygelių prie gamybos.

K3: Kuris LlamaIndex mokymas moko apie agentus ir įrankių naudojimą? Ieškokite vadovų, naudojančių ReAct tipo agentus, QueryPipeline ir funkcijų kvietimą su Pydantic schemomis. Šie mokymai parodo, kaip maršrutuoti užklausas, kviesti API ir grąžinti struktūruotą JSON.

K4: Kaip įvertinti LlamaIndex RAG tikslumą? Naudokite vertinimo mokymus, kurie pristato pagrįstumo patikras, citatų aprėptį ir įvertintus QA duomenų rinkinius. Sekite teisingumą, vėlavimą ir kainą, kad aptiktumėte regresijas prieš diegiant.

K5: Ar yra LlamaIndex mokymų multimodaliniams dokumentams? Taip, ieškokite mokymų, kurie derina OCR ir išdėstymo analizę vaizdams bei lentelėms, tada indeksuoja išgautą tekstą su metaduomenimis. Jie parodo, kaip tvarkyti diagramas, ekrano kopijas ir sudėtingus PDF RAG aplinkoje.