10 geriausių LlamaIndex mokymų, skirtų įvaldyti RAG 2025 metais
Jei girdėjote, kad Retrieval-Augmented Generation (RAG) gali padaryti jūsų LLM programas išmanesnes, tai tiesa. Greičiausias būdas šiandien sukurti patikimą, paieškos tipo AI asistentą – gerai išmokti LlamaIndex, o geriausi LlamaIndex mokymai gali sutrumpinti jūsų mokymosi laiką nuo mėnesių iki dienų.
Šiame vadove parinkome geriausius LlamaIndex mokymus visiems lygiams – nuo greitų kopijavimo-pradžios pamokų iki gamybos lygio sprendimų. Rasite vaizdo įrašų peržiūras, praktinius užrašų knygelius ir pažangias receptūras daugiafunkciniams duomenims, struktūruotam išgavimui, agentams ir vertinimui.
Taip pat susiesime kiekvieną mokymą su įgūdžiais ar rezultatais, kurie jums svarbūs: pokalbių kūrimas su dokumentais, įterpinių mastelio didinimas, įrankių pridėjimas, atsakymų srautinimas ar rezultatų patikra.
Vadovo pabaigoje žinosite, nuo kurio LlamaIndex mokymo pradėti, kuriuos toliau sekti ir kaip juos derinti į tikrą produktą.
Kodėl LlamaIndex mokymai svarbūs būtent dabar
- RAG yra dabartis AI programoms. LLM gali klaidžioti; RAG pagrindžia atsakymus jūsų duomenyse.
- LlamaIndex yra labiausiai integruotas RAG paketas. Jis apjungia indeksavimą, paiešką, užklausų planavimą, stebėjimą ir vertinimą į modulius, kurie puikiai veikia su LangChain, OpenAI, Anthropic ir atvirojo kodo LLM.
- Mokymai yra jūsų greitas kelias. Geriausi LlamaIndex mokymai demonstruoja ne tik kodą, bet ir architektūrinius sprendimus: duomenų skaidymą, perrikiavimą, talpyklą ir saugumo priemones.
Jei jūsų tikslas yra: „Pokalbis su mano dokumentais be klaidų“, šis sąrašas jums padės.
Kaip parinkome geriausius LlamaIndex mokymus
- Rezultatais pagrįsti: Po kiekvieno mokymo turėtumėte sukurti ką nors naudingo.
- Atnaujinti 2025 metams: Atspindi dabartines LlamaIndex API (pvz.,
VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
- Gamybai pritaikyti: Rodo vertinimą, sekimą ir iteraciją – ne tik „hello world“.
- Įvairiapusiškumas ir gilumas: Nuo greitų pradžių iki agentų, multimodalių ir struktūruoto išgavimų.
10 geriausių LlamaIndex mokymų (atsirinkti)
Žemiau pateikiamas atrinktas kelias. Pradėkite nuo savo lygio; pereikite ten, kur reikia.
1) 15 minučių greita pradžia: pokalbis su PDF dokumentais
- Geriausia skirti: visiškai pradedantiesiems ir produktų vadovams
- Ką sukursite: įkelsite PDF, indeksuosite, užduosite klausimus, gausite citatas
- Pagrindinės sąvokos:
SimpleDirectoryReader, VectorStoreIndex, Settings, įterpiniai
- Kodėl tai puiku: minimalus kodas, maksimalus „aha!“ momentas
Pavyzdinis šablonas:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- Ką išmoksite toliau: duomenų gabalų dydis, top-k reikšmė ir kodėl svarbus perrikiavimas.
2) RAG pagrindai su duomenų gabalais, metaduomenimis ir perrikiavimu
- Geriausia skirti: nuo pradedančiųjų iki vidutinio lygio
- Ką sukursite: išmanesnį paieškos variklį su geresnės kokybės kontekstu
- Pagrindinės sąvokos:
SentenceSplitter, metaduomenų filtrai, rerank komponentai
- Kodėl tai puiku: rodo, kaip keletas parametrų žymiai sumažina klaidas
Išbandykite:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# pridėkite metaduomenis, pvz., šaltinį, puslapį, skyrių įkėlimo metu
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- Rezultatas: aukštesnės kokybės konteksto langai ilgoms dokumentų dalims.
3) LlamaIndex + OpenAI funkcijų kvietimas (įrankių naudojimas ir struktūruotas išvestis)
- Geriausia skirti: kūrėjams, automatizuojantiems darbo eigas
- Ką sukursite: agentą, kuris kviečia įrankius ir grąžina JSON schemas
- Pagrindinės sąvokos:
QueryPipeline, įrankių specifikacija, Pydantic schemos, funkcijų kvietimas
- Kodėl tai puiku: sujungia klausimus-atsakymus su tikromis operacijomis (paieška, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# įrašykite į savo sistemą
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- Rezultatas: gamybai paruošti modeliai struktūruotam išgavimui ir veiksmams.
4) Gamybinio vektorinio saugyklos kūrimas (Postgres, Pinecone, Weaviate)
- Geriausia skirti: komandoms, planuojančioms augimą
- Ką sukursite: patvarią vektorinę saugyklą su filtrais ir hibridine paieška
- Pagrindinės sąvokos:
VectorStoreIndex adapteriai, hibridinis BM25+embedding, metaduomenys
- Kodėl tai puiku: moko duomenų išsaugojimo, migracijų ir kaštų valdymo
Patarimai:
- Naudokite Postgres/pgvector paprastam ir nebrangiam diegimui.
- Pinecone/Weaviate – valdomam masteliui; reguliuokite
ef_construction, ef_search parametrus.
- Pridėkite hibridinę paiešką, kad apdorotumėte retus terminus ir santrumpas.
5) Užklausų planavimas ir daugiapakopis mąstymas su agentais
- Geriausia skirti: sudėtingiems klausimams ir daugiaduomenių paieškai
- Ką sukursite: planuotoją, kuris skaidys užklausą į sub-užklausas
- Pagrindinės sąvokos:
ReActAgent, SubQuestionQueryEngine, maršrutizavimas
- Kodėl tai puiku: pereina nuo „rasti ir atsakyti“ prie „pagalvoti ir ieškoti“.
Šablonas:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# tarkime, turite kelis indeksus
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) Stebėjimas ir vertinimas: sekimas, pagrįstumas ir etalonai
- Geriausia skirti: visiems, kurie diegia realias programas
- Ką sukursite: atsiliepimų ciklus regresijoms ir klaidoms aptikti
- Pagrindinės sąvokos: LlamaIndex vertinimai, įvertinta QA, citatų patikra, sekimas
- Kodėl tai puiku: moko matuoti svarbiausius dalykus prieš plečiant
Kontrolinis sąrašas:
- Registruokite visus užklausimus/atsakymus su sekimais.
- Naudokite įvertintus QA duomenų rinkinius regresijos testavimui.
- Sekite pagrįstumą ir citatų aprėptį.
7) RAG multimodaliniams duomenims (vaizdai, lentelės, Markdown)
- Geriausia skirti: dokumentams su diagramomis, ekrano kopijomis ir lentelėmis
- Ką sukursite: srautus, kurie ištraukia tekstą iš vaizdų ir analizuoja lenteles
- Pagrindinės sąvokos: OCR + išdėstymo analizė, lentelių skaidymas, multimodaliniai modeliai
- Kodėl tai puiku: realūs dokumentai dažnai netvarkingi; šis mokymas parodo, kaip juos tvarkyti.
8) Daugiaklientinė aplinka ir paieškos izoliacija
- Geriausia skirti: SaaS kūrėjams
- Ką sukursite: RAG paslaugą, kur kiekvieno kliento duomenys izoliuoti
- Pagrindinės sąvokos: vardų erdvės, metaduomenų apsaugos, klientų indeksai, RBAC
- Kodėl tai puiku: saugumas ir privatumas pagal dizainą; aiškūs atnaujinimo keliai.
9) Struktūruotas išgavimas masteliu (sąskaitos, žurnalai, sutartys)
- Geriausia skirti: operacijų, finansų, teisės procesams
- Ką sukursite: deterministinius JSON išvestis su schemų patikra
- Pagrindinės sąvokos: Pydantic schemos, pakartotiniai bandymai, įrankių papildoma patikra
- Kodėl tai puiku: sumažina rankinį peržiūrėjimą ir užtikrina patikimą LLM išvestį.
10) Pilnas gamybos modelis: nuo užrašų knygelių iki CI/CD
- Geriausia skirti: komandoms, pereinančioms į gamybą
- Ką sukursite: pilną srautą su duomenų įkėlimu, indeksavimo darbais, vertinimu ir leidimų kontrolėmis
- Pagrindinės sąvokos: foniniai darbai, suplanuotas perindeksavimas, funkcijų žymos
- Kodėl tai puiku: parodo, kaip nuolat patikimai diegti produktą.
Kaip pasirinkti tinkamą LlamaIndex mokymą savo tikslui
Naudokite šį greitą gidą, kad pasirinktumėte kitą žingsnį:
- „Man reikia rezultatų šiandien.“ Pradėkite nuo greitos pradžios (Mokymas #1), tada pridėkite perrikiavimą (Mokymas #2).
- „Noriu veiksmų, ne tik atsakymų.“ Pereikite prie funkcijų kvietimo ir agentų (Mokymai #3 ir #5).
- „Turime mastelio ir atitikties reikalavimų.“ Saugykla + daugiaklientiniai modeliai (Mokymai #4 ir #8).
- „Kaip pasitikėti atsakymais?“ Vertinimai ir sekimas (Mokymas #6).
- „Mūsų dokumentai daugiausia vizualiniai.“ Multimodalinė RAG (Mokymas #7).
- „Reikia struktūruotų duomenų.“ Naudokite schemas ir validatorių (Mokymas #9).
Gilus žvilgsnis: geriausios praktikos, kurias rasite geriausiuose LlamaIndex mokymuose
1) Duomenų gabalų skaidymas yra produkto sprendimas
- Kompromisas: didesni gabalai = daugiau konteksto, bet didesnės sąnaudos; mažesni gabalai = geresnis atgaminimas, bet prarandama prasmė.
- Geri numatyti parametrai: 512–1024 žetonai su ~10–20 % persidengimu.
- Metaduomenys svarbūs: išsaugokite šaltinį, puslapį, skyrių, antraštes.
2) Paieškos kokybė svarbesnė už modelio dydį
- Perrikiavimas: pridėkite kryžminį koduotoją arba įterpinių perrikiuotoją geresniam MRR.
- Hibridinė paieška: derinkite BM25 retoms sąvokoms su įterpiniais semantikai.
- Filtrai: siaurinkite pagal dokumento tipą, datą ar klientą, kad pagerintumėte tikslumą.
3) Vertinkite anksti, vertinkite nuolat
- Įvertinta QA: sukurkite nedidelį klausimų-atsakymų rinkinį su citatomis.
- Metrikos: atsakymų teisingumas, pagrįstumas, vėlavimas ir kaina už užklausą.
- Saugus A/B testavimas: išbandykite naujus duomenų gabalų skaidymo ar paieškos variklius šešėlyje prieš perjungiant.
4) Veiksmai turi būti pirmojo lygio
- Struktūruota išvestis: naudokite schemas išgavimui.
- Įrankiai: apvyniokite API (paieška, kalendorius, DB) kaip funkcijas agentams kvietimui.
- Saugumo priemonės: tikrinkite išvestis, įgyvendinkite pakartotinius bandymus, registruokite įrankių klaidas.
5) Sąnaudų ir vėlavimo higiena
- Talpinkite įterpinius: pašalinkite dublikatus ir pakartotinai naudokite vektorius per kūrimą.
- Partijos operacijos: indeksuokite masiškai; srautiniai atsakymai gerina naudotojo patirtį.
- Išmanesnis kontekstas: neperkraukite užklausos – naudokite top-k + perrikiavimą.
7 dienų mokymosi planas naudojant geriausius LlamaIndex mokymus
- 1 diena: Greita pradžia (Mokymas #1). Sukurkite pokalbį su 20 puslapių PDF. Išleiskite CLI.
- 2 diena: Pagerinkite paiešką (Mokymas #2). Pridėkite perrikiavimą ir hibridinę paiešką.
- 3 diena: Pridėkite funkcijų kvietimą (Mokymas #3). Sukurkite įrankį DUK API.
- 4 diena: Pereikite prie tikros vektorinės saugyklos (Mokymas #4). Vietiniam naudojimui pgvector.
- 5 diena: Įdiekite planuotoją (Mokymas #5). Maršrutizuokite klausimus per du indeksus.
- 6 diena: Pridėkite vertinimą (Mokymas #6). Sukurkite 30 klausimų testų rinkinį ir bazinį lygį.
- 7 diena: Gamybinis etapas (Mokymas #10). Foniniai darbai, stebėjimas, CI.
Pavyzdinis projektas: „Docs Concierge“ su LlamaIndex
- Tikslas: saugus vidinis asistentas, atsakantis į klausimus apie procesų dokumentus ir atidarantis užduotis.
- Technologijos: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
- Įkelkite Confluence eksportus ir PDF (išsaugokite metaduomenis ir ACL).
- Skaidykite po 768 žetonus; indeksuokite į pgvector.
- Pridėkite hibridinę paiešką ir perrikiavimą.
- Sukurkite įrankius:
create_jira_ticket, lookup_oncall, fetch_policy.
- Pridėkite vertinimą su 50 atrinktų klausimų; matuokite pagrįstumą.
- Diegkite su srautinio perdavimo vartotojo sąsaja ir citatų peržiūromis.
- Rezultatas: greiti, cituojami atsakymai; vieno spustelėjimo užduočių automatizavimas; matuojamas tikslumas.
Dažnos klaidos, kurių šie mokymai padeda išvengti
- Vertinimo praleidimas: jei netestuosite, pristatysite regresijas.
- Metaduomenų ignoravimas: prarasite šaltinio priskyrimą ir maršrutizavimo galimybes.
- Per dideli duomenų gabalai: žetonų perpildymas didina kainą be geresnių atsakymų.
- Neaiškūs įrankių aprašymai: agentams reikia aiškių įėjimų ir deterministinių išėjimų.
- Izoliacijos nebuvimas: daugiaklientinė RAG turi užkirsti kelią duomenų nutekėjimui tarp klientų.
Įrankiai, papildantys LlamaIndex mokymus
- Vektorinės saugyklos: pgvector, Pinecone, Weaviate, Qdrant
- Perrikiuotojai: Cohere Rerank, FlagEmbedding, Voyage rerank
- Duomenų gabalų skaidytojai: semantiniai skaidytojai, lentelių skaidytojai
- Vertinimai: Ragas tipo QA, LlamaIndex vertinimai, individualūs vertinimo kriterijai
- Vartotojo sąsaja: Streamlit, Next.js, FastAPI websockets srautiniams žetonams
Beje, jei jums patinka mokytis praktiškai naršyklėje, verta žinoti, kad Sider.ai leidžia jums kalbėtis su kodu, dokumentais ir tinklalapiais šalia vienas kito. Galite įklijuoti fragmentus iš LlamaIndex mokymų, vykdyti užklausas ir greičiau tobulėti – patogu testuoti RAG užklausas ir išgauti struktūruotas išvestis, kol sekate pamokas. Ko ieškoti: kaip rasti atnaujintus LlamaIndex mokymus
- „geriausi LlamaIndex mokymai 2025“
- „LlamaIndex greita pradžia RAG pdf“
- „LlamaIndex SubQuestionQueryEngine pavyzdys“
- „LlamaIndex vertinimas pagrįstumas mokymas“
- „LlamaIndex pgvector Pinecone vadovas“
- „LlamaIndex agentai funkcijų kvietimo pavyzdys“
Ieškokite naujausio kodo su Settings.llm, Settings.embed_model, VectorStoreIndex ir as_query_engine – tai dabartinės frazės.
Svarbiausios išvados
- Geriausi LlamaIndex mokymai padeda pristatyti rezultatus, ne tik kodo fragmentus.
- Pradėkite nuo pokalbių su dokumentais, tada pridėkite paieškos kokybę, įrankius ir vertinimą.
- Naudokite tikrą vektorinę saugyklą, pridėkite planuotojus sudėtingiems klausimams ir nuolat testuokite.
- Maži architektūriniai sprendimai – duomenų gabalų skaidymas, perrikiavimas, filtrai – daro didesnį poveikį nei modelių keitimas.
- Mokymasis pagreitėja, kai laikotės struktūrizuoto plano ir kuriate tikrą produktą.
Kas toliau
- Pasirinkite vieną mokymą iš pirmųjų trijų ir šiandien sukurkite minimalų programėlę.
- Pridėkite vertinimą prieš plečiant naudotojus.
- Planuokite gamybos migraciją: saugyklą, autentifikaciją, stebėjimą ir CI.
- Grįžkite prie pažangių mokymų (agentų, multimodalinių, daugiaklientinių), kai augs jūsų apimtis.
DUK
K1: Kokie yra geriausi LlamaIndex mokymai pradedantiesiems?
Pradėkite nuo greitos pradžios, kuri sukuria pokalbį su jūsų PDF naudojant VectorStoreIndex ir SimpleDirectoryReader. Tada pridėkite mokymą apie duomenų gabalų skaidymą, metaduomenis ir perrikiavimą, kad pagerintumėte paieškos kokybę.
K2: Kaip sukurti gamybinę RAG programą su LlamaIndex?
Sekite mokymus, apimančius vektorinę saugyklą (pgvector, Pinecone), hibridinę paiešką ir vertinimą su įvertinta QA. Pridėkite sekimą, struktūruotas išvestis ir CI/CD, kad pereitumėte nuo užrašų knygelių prie gamybos.
K3: Kuris LlamaIndex mokymas moko apie agentus ir įrankių naudojimą?
Ieškokite vadovų, naudojančių ReAct tipo agentus, QueryPipeline ir funkcijų kvietimą su Pydantic schemomis. Šie mokymai parodo, kaip maršrutuoti užklausas, kviesti API ir grąžinti struktūruotą JSON.
K4: Kaip įvertinti LlamaIndex RAG tikslumą?
Naudokite vertinimo mokymus, kurie pristato pagrįstumo patikras, citatų aprėptį ir įvertintus QA duomenų rinkinius. Sekite teisingumą, vėlavimą ir kainą, kad aptiktumėte regresijas prieš diegiant.
K5: Ar yra LlamaIndex mokymų multimodaliniams dokumentams?
Taip, ieškokite mokymų, kurie derina OCR ir išdėstymo analizę vaizdams bei lentelėms, tada indeksuoja išgautą tekstą su metaduomenimis. Jie parodo, kaip tvarkyti diagramas, ekrano kopijas ir sudėtingus PDF RAG aplinkoje.