10 labākie LlamaIndex mācību materiāli, lai apgūtu RAG 2025. gadā
Ja esi dzirdējis, ka Retrieval-Augmented Generation (RAG) var padarīt tavas LLM lietotnes gudrākas, tad tas ir pareizi. Ātrākais veids, kā šodien izveidot uzticamu, meklēšanai līdzīgu AI palīgu, ir labi apgūt LlamaIndex — un labākie LlamaIndex mācību materiāli var saīsināt tavu mācīšanās laiku no mēnešiem līdz dienām.
Šajā ceļvedī mēs rūpīgi atlasām labākos LlamaIndex mācību materiālus katram līmenim — no ātrajiem kopēšanas un ielīmēšanas sākumiem līdz ražošanas līmeņa risinājumiem. Atradīsi video demonstrācijas, praktiskos piezīmju blokus un progresīvas receptes daudzlietotāju datiem, strukturētai informācijas izguvei, aģentiem un novērtēšanai.
Mēs arī sasaistīsim katru mācību materiālu ar prasmēm vai rezultātiem, kas tev svarīgi: tērzēšana pār taviem dokumentiem, iegulšanu mērogošana, rīku pievienošana, atbilžu straumēšana vai rezultātu pārbaude.
Beigās tu zināsi, ar kuru LlamaIndex mācību materiālu sākt, kuri jāseko nākamie un kā tos apvienot reāla produkta izveidei.
Kāpēc LlamaIndex mācību materiāli ir svarīgi tieši tagad
- RAG ir mākslīgā intelekta lietotņu tagadne. LLM mēdz radīt halucinācijas; RAG balsta atbildes tavos datos.
- LlamaIndex ir visaptverošākā RAG platforma. Tā apvieno indeksēšanu, izgūšanu, vaicājumu plānošanu, novērošanu un novērtēšanu modulāros komponentos, kas labi sadarbojas ar LangChain, OpenAI, Anthropic un atvērtā koda LLM.
- Mācību materiāli ir tavs ātrākais ceļš. Labākie LlamaIndex mācību materiāli demonstrē ne tikai kodu, bet arī arhitektūras lēmumus: dokumentu sadalīšanu, pārrangēšanu, kešošanu un drošības mehānismus.
Ja tavs mērķis ir: “Tērzēt ar saviem dokumentiem un izvairīties no halucinācijām,” šis saraksts tev palīdzēs to sasniegt.
Kā mēs atlasījām labākos LlamaIndex mācību materiālus
- Rezultātorientēti: Pēc katra materiāla tu vari izveidot kaut ko lietderīgu.
- Atjaunināti 2025. gadam: Atspoguļo aktuālās LlamaIndex API (piemēram,
VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
- Ražošanas līmeņa apzināti: Parāda novērtēšanu, izsekošanu un iterāciju — vairāk nekā vienkārša “hello world”.
- Platums + dziļums: No ātrajiem sākumiem līdz aģentiem, multimodālām iespējām un strukturētai informācijas izguvei.
10 labākie LlamaIndex mācību materiāli (rūpīgi atlasīti)
Zemāk ir rūpīgi izveidota mācību secība. Sāc no sava līmeņa; pārej tur, kur nepieciešams.
1) 15 minūšu ātrais sākums: tērzēšana pār PDF
- Vislabāk piemērots: pilnīgiem iesācējiem un produktu vadītājiem
- Ko tu izveidosi: Augšupielādēsi PDF, indeksēsi, uzdosi jautājumus, saņemsi atsauces
- Galvenās koncepcijas:
SimpleDirectoryReader, VectorStoreIndex, Settings, iegulšanas modeļi
- Kāpēc tas ir lieliski: Minimāls kods, maksimāls “aha!” moments
Piemēra skelets:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- Ko tu apgūsi tālāk: dokumentu sadalīšanas lielumu, top‑k un kāpēc pārrangēšana ir svarīga.
2) RAG pamati ar dokumentu sadalīšanu, metadatiem un pārrangēšanu
- Vislabāk piemērots: iesācējiem līdz vidējam līmenim
- Ko tu izveidosi: gudrāku izgūšanas mehānismu ar labāku konteksta kvalitāti
- Galvenās koncepcijas:
SentenceSplitter, metadatu filtri, rerank komponenti
- Kāpēc tas ir lieliski: Parāda, kā daži parametri ievērojami samazina halucinācijas
Pamēģini:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# pievieno metadatus, piemēram, avotu, lapu, sadaļu
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- Rezultāts: kvalitatīvāks konteksts garākiem dokumentiem.
3) LlamaIndex + OpenAI funkciju izsaukšana (rīku izmantošana un strukturēts izvads)
- Vislabāk piemērots: izstrādātājiem, kas automatizē darba plūsmas
- Ko tu izveidosi: aģentu, kas izsauc rīkus un atgriež JSON shēmas
- Galvenās koncepcijas:
QueryPipeline, rīku specifikācija, Pydantic shēmas, funkciju izsaukšana
- Kāpēc tas ir lieliski: savieno jautājumu un atbilžu sistēmu ar reālām darbībām (meklēšana, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# ieraksti savā sistēmā
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- Rezultāts: ražošanas līmeņa modeļi strukturētai informācijas izguvei un darbībām.
4) Ražošanas vektoru veikala izveide (Postgres, Pinecone, Weaviate)
- Vislabāk piemērots: komandām, kas plāno mērogošanu
- Ko tu izveidosi: noturīgu vektoru glabātuvi ar filtriem un hibrīdu meklēšanu
- Galvenās koncepcijas:
VectorStoreIndex adapteri, hibrīds BM25+iegulšana, metadati
- Kāpēc tas ir lieliski: māca datu saglabāšanu, migrācijas un izmaksu kontroli
Padomi:
- Izmanto Postgres/pgvector vienkāršām un pieejamām izvietojumam.
- Pinecone/Weaviate pārvaldītai mērogošanai; noregulē
ef_construction, ef_search.
- Pievieno hibrīdu izgūšanu, lai apstrādātu retus terminus un saīsinājumus.
5) Vaicājumu plānošana un daudzpakāpju domāšana ar aģentiem
- Vislabāk piemērots: sarežģītiem jautājumiem un meklēšanai vairākos datu kopumos
- Ko tu izveidosi: plānotāju, kas sadala vaicājumu apakšvaicājumos
- Galvenās koncepcijas:
ReActAgent, SubQuestionQueryEngine, maršrutēšana
- Kāpēc tas ir lieliski: pāriet no “izgūst un tad atbild” uz “domā un tad meklē.”
Paraugs:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# pieņemsim, ka tev ir vairāki indeksi
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) Novērošana un novērtēšana: izsekošana, pamatotība un etaloni
- Vislabāk piemērots: ikvienam, kas izvieto reālas lietotnes
- Ko tu izveidosi: atgriezeniskās saites cilpas regresiju un halucināciju atklāšanai
- Galvenās koncepcijas: LlamaIndex novērtējumi, vērtētie QA, atsauču pārbaudes, izsekošana
- Kāpēc tas ir lieliski: māca mērīt svarīgo pirms mērogošanas
Kontrolsaraksts:
- Reģistrē visas komandas/atbildes ar izsekošanu.
- Izmanto vērtētos QA datu kopumus regresijas testēšanai.
- Izseko pamatotību un atsauču pārklājumu.
7) RAG multimodāliem datiem (attēli, tabulas, Markdown)
- Vislabāk piemērots: dokumentiem ar diagrammām, ekrānuzņēmumiem un tabulām
- Ko tu izveidosi: cauruļvadus, kas izvelk tekstu no attēliem un analizē tabulas
- Galvenās koncepcijas: OCR + izkārtojuma analīze, tabulu sadalīšana, multimodālie modeļi
- Kāpēc tas ir lieliski: reālie dokumenti ir haotiski; šis materiāls rāda, kā tos sakārtot.
8) Daudzlietotāju un izgūšanas izolācija
- Vislabāk piemērots: SaaS izstrādātājiem
- Ko tu izveidosi: RAG pakalpojumu, kur katra klienta dati ir izolēti
- Galvenās koncepcijas: nosaukumu telpas, metadatu aizsargi, daudzlietotāju indeksi, RBAC
- Kāpēc tas ir lieliski: drošība un privātums pēc dizaina; tīras jaunināšanas iespējas.
9) Strukturēta informācijas izguve mērogā (rēķini, žurnāli, līgumi)
- Vislabāk piemērots: operācijām, finanšu un juridiskām darba plūsmām
- Ko tu izveidosi: deterministiskus JSON izvades ar shēmu validāciju
- Galvenās koncepcijas: Pydantic shēmas, atkārtotas mēģināšanas, rīku papildināta validācija
- Kāpēc tas ir lieliski: samazina manuālu pārbaudi un padara LLM izvadi uzticamu.
10) No sākuma līdz ražošanai: no piezīmju blokiem līdz CI/CD
- Vislabāk piemērots: komandām, kas pāriet uz ražošanu
- Ko tu izveidosi: pilnu cauruļvadu ar datu uzņemšanu, indeksēšanas darbiem, novērtēšanu un izlaiduma kontrolēm
- Galvenās koncepcijas: fonā darbojošies darbinieki, plānotā pārrindošana, funkciju karogi
- Kāpēc tas ir lieliski: rāda, kā pārvietoties nepārtraukti ar pārliecību.
Kā izvēlēties pareizo LlamaIndex mācību materiālu savam mērķim
Izmanto šo ātro maršrutētāju, lai izvēlētos nākamo soli:
- “Man vajadzīgi rezultāti jau šodien.” Sāc ar ātro sākumu (1. mācību materiāls), pēc tam pievieno pārrangēšanu (2. mācību materiāls).
- “Es gribu darbības, ne tikai atbildes.” Pārej pie funkciju izsaukšanas un aģentiem (3. un 5. mācību materiāls).
- “Mums ir vajadzīga mērogošana un atbilstība.” Uzglabāšana + daudzlietotāju modeļi (4. un 8. mācību materiāls).
- “Kā mēs uzticamies atbildēm?” Novērtēšana un izsekošana (6. mācību materiāls).
- “Mūsu dokumenti ir vizuāli bagāti.” Multimodāls RAG (7. mācību materiāls).
- “Mums vajadzīgi strukturēti dati.” Izmanto shēmas un validētājus (9. mācību materiāls).
Dziļāka izpēte: labākās prakses, ko redzēsi labākajos LlamaIndex mācību materiālos
1) Dokumentu sadalīšana ir produkta lēmums
- Kompromiss: lielāki fragmenti = vairāk konteksta, bet augstākas izmaksas; mazāki fragmenti = labāka atgūšana, bet daļējs nozīmes zudums.
- Labi noklusējumi: 512–1024 tokeni ar ~10–20% pārklājumu.
- Metadati ir svarīgi: saglabā avotu, lapu, sadaļu, virsrakstus.
2) Izgūšanas kvalitāte pārspēj modeļa izmēru
- Pārrangēšana: pievieno krustenisko kodētāju vai iegulšanas pārrangētāju labākam MRR.
- Hibrīda meklēšana: apvieno BM25 retu terminu un iegulšanu semantikai.
- Filtri: sašaurini pēc dokumentu veida, datuma vai klienta, lai uzlabotu precizitāti.
3) Novērtē agri, novērtē vienmēr
- Vērtēts QA: izveido nelielu jautājumu un atbilžu kopu ar atsaucēm.
- Metrikas: atbilžu pareizība, pamatotība, latentums un izmaksas uz vaicājumu.
- A/B droši: pirms pilnas pārejas izmēģini jauno dokumentu sadalīšanu vai izgūšanas mehānismus.
4) Darbības padari par pirmšķirīgām
- Strukturēts izvads: izmanto shēmas izguves uzdevumiem.
- Rīki: ietver API (meklēšana, kalendārs, DB) kā funkcijas aģentiem.
- Drošības mehānismi: validē izvades, īsteno atkārtotas mēģināšanas, reģistrē rīku kļūdas.
5) Izmaksu un latentuma higiēna
- Kešo iegulšanas: dublē tekstu un atkārtoti izmanto vektorus būvēšanas laikā.
- Partiju apstrāde: indeksē masveidā; straumē atbildes, lai uzlabotu lietotāja pieredzi.
- Gudrāks konteksts: nepārslogo promptu — izmanto top-k un pārrangēšanu.
7 dienu mācību plāns ar labākajiem LlamaIndex mācību materiāliem
- 1. diena: ātrais sākums (1. mācību materiāls). Izveido tērzēšanu pār 20 lapu PDF. Izvieto CLI.
- 2. diena: uzlabo izgūšanu (2. mācību materiāls). Pievieno pārrangētāju un hibrīdu meklēšanu.
- 3. diena: pievieno funkciju izsaukšanu (3. mācību materiāls). Izveido rīku FAQ API.
- 4. diena: pārej uz īstu vektoru veikalu (4. mācību materiāls). Izmanto pgvector lokāli.
- 5. diena: iepazīstini plānotāju (5. mācību materiāls). Maršrutē jautājumus starp diviem indeksiem.
- 6. diena: pievieno novērtēšanu (6. mācību materiāls). Izveido 30 jautājumu testu un bāzes līmeni.
- 7. diena: ražošanas kārta (10. mācību materiāls). Fonā darbojošie darbi, novērošana, CI.
Piemēra projekts: "Docs Concierge" ar LlamaIndex
- Mērķis: drošs iekšējais asistents, kas atbild uz jautājumiem par procesa dokumentiem un atver biļetes.
- Tehnoloģiju komplekts: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
- Uzņem Confluence eksportus un PDF (saglabā metadatus un piekļuves tiesības).
- Sadala 768 tokenos; indeksē pgvector.
- Pievieno hibrīdu izgūšanu un pārrangētāju.
- Izveido rīkus:
create_jira_ticket, lookup_oncall, fetch_policy.
- Pievieno novērtēšanu ar 50 atlasītiem jautājumiem; mēra pamatotību.
- Izvieto ar atbilžu straumēšanas UI un atsauču priekšskatījumiem.
- Rezultāts: ātras, ar atsaucēm pamatotas atbildes; vienas klikšķa uzdevumu automatizācija; mērāma precizitāte.
Biežas kļūdas, no kurām šie materiāli palīdz izvairīties
- Novērtēšanas izlaišana: ja netestē, tiks izlaistas regresijas.
- Metadatu ignorēšana: zaudēsi avotu atribūciju un maršrutēšanas spēju.
- Pārāk lieli fragmenti: tokenu pārmērība palielina izmaksas bez labākām atbildēm.
- Rīku nepietiekama specifikācija: aģentiem vajag skaidrus ievades un determinētas izvades datus.
- Izolācijas trūkums: daudzlietotāju RAG jāsamazina datu noplūde starp klientiem.
Rīki, kas papildina LlamaIndex mācību materiālus
- Vektoru veikali: pgvector, Pinecone, Weaviate, Qdrant
- Pārrangētāji: Cohere Rerank, FlagEmbedding, Voyage rerank
- Fragmentētāji: semantiskie sadalītāji, tabulām pielāgoti sadalītāji
- Novērtējumi: Ragas stila QA, LlamaIndex novērtējumi, pielāgoti rubrikas vērtētāji
- Lietotāja saskarne: Streamlit, Next.js, FastAPI websockets atbilžu straumēšanai
Starp citu, ja tev patīk mācīties praktiski pārlūkprogrammā, ir vērts zināt, ka Sider.ai ļauj tērzēt ar kodu, dokumentiem un tīmekļa lapām blakus. Vari ielīmēt fragmentus no LlamaIndex mācību materiāliem, izpildīt komandas un ātrāk iterēt — ērti, lai testētu RAG promptus un izvilktu strukturētus datus, kamēr seko līdzi. Ko meklēt: aktuāli LlamaIndex mācību materiāli
- “best LlamaIndex tutorials 2025”
- “LlamaIndex quickstart RAG pdf”
- “LlamaIndex SubQuestionQueryEngine example”
- “LlamaIndex evaluation groundedness tutorial”
- “LlamaIndex pgvector Pinecone guide”
- “LlamaIndex agents function calling example”
Meklē nesenu kodu ar Settings.llm, Settings.embed_model, VectorStoreIndex un as_query_engine — tie ir aktuāli izteicieni.
Galvenās atziņas
- Labākie LlamaIndex mācību materiāli palīdz sasniegt rezultātus, ne tikai parāda koda fragmentus.
- Sāc ar tērzēšanu pār dokumentiem, pēc tam uzlabo izgūšanas kvalitāti, pievieno rīkus un novērtēšanu.
- Izmanto īstu vektoru veikalu, pievieno plānotājus sarežģītiem jautājumiem un testē bez apstājas.
- Mazie arhitektūras lēmumi — dokumentu sadalīšana, pārrangēšana, filtri — ietekmē rezultātus vairāk nekā modeļu maiņa.
- Mācīšanās paātrinās, ja seko strukturētam plānam un būvē kaut ko reālu.
Kas tālāk
- Izvēlies vienu no pirmajiem trim materiāliem un šodien izveido minimālu lietotni.
- Pievieno novērtēšanu pirms lietotāju skaita palielināšanas.
- Plāno ražošanas migrāciju: glabāšana, autentifikācija, novērošana un CI.
- Atkārtoti apmeklē progresīvos materiālus (aģenti, multimodāls, daudzlietotāji) pēc vajadzības.
BUJ
J1: Kādi ir labākie LlamaIndex mācību materiāli iesācējiem?
Sāc ar ātro sākumu, kas izveido tērzēšanu pār PDF, izmantojot VectorStoreIndex un SimpleDirectoryReader. Pēc tam pievieno materiālu par dokumentu sadalīšanu, metadatiem un pārrangēšanu, lai uzlabotu izgūšanu.
J2: Kā izveidot ražošanas RAG lietotni ar LlamaIndex?
Seiko materiālus, kas aptver vektoru veikalus (pgvector, Pinecone), hibrīdu izgūšanu un novērtēšanu ar vērtēto QA. Pievieno izsekošanu, strukturētus izvades datus un CI/CD, lai pārietu no piezīmju blokiem uz ražošanu.
J3: Kurš LlamaIndex materiāls māca par aģentiem un rīku izmantošanu?
Meklē rokasgrāmatas ar ReAct stila aģentiem, QueryPipeline un funkciju izsaukšanu ar Pydantic shēmām. Šie materiāli rāda, kā maršrutēt vaicājumus, izsaukt API un atgriezt strukturētus JSON.
J4: Kā novērtēt LlamaIndex RAG precizitāti?
Izmanto novērtēšanas materiālus, kas iepazīstina ar pamatotības pārbaudēm, atsauču pārklājumu un vērtēto QA datu kopām. Izseko pareizību, latentumu un izmaksas, lai atklātu regresijas pirms izvietošanas.
J5: Vai ir LlamaIndex materiāli multimodāliem dokumentiem?
Jā, meklē materiālus, kas apvieno OCR un izkārtojuma analīzi attēliem un tabulām, pēc tam indeksē izvilkto tekstu ar metadatiem. Tie rāda, kā apstrādāt diagrammas, ekrānuzņēmumus un sarežģītus PDF RAG.