10 nejlepších tutoriálů LlamaIndex pro zvládnutí RAG v roce 2025
Pokud jste slyšeli, že Retrieval-Augmented Generation (RAG) může vaše aplikace LLM učinit chytřejšími, máte pravdu. Nejrychlejší způsob, jak dnes dodat spolehlivého asistenta AI podobného vyhledávání, je dobře se naučit LlamaIndex – a nejlepší tutoriály LlamaIndex mohou zkrátit vaši křivku učení z měsíců na dny.
V této příručce ručně vybíráme nejlepší tutoriály LlamaIndex pro každou úroveň – od rychlých startů typu copy-paste až po produkční pipeline. Najdete zde videonávody, praktické notebooky a pokročilé recepty pro multi-tenant data, strukturovanou extrakci, agenty a vyhodnocování.
Také zmapujeme každý tutoriál na dovednost nebo výsledek, na kterém vám záleží: vytváření chatu nad vašimi dokumenty, škálování embeddingů, přidávání nástrojů, streamování odpovědí nebo ověřování výsledků.
Na konci budete vědět, se kterým tutoriálem LlamaIndex začít, které sledovat dál a jak je zkombinovat do skutečného produktu.
Proč na tutoriálech LlamaIndex právě teď záleží
- RAG je přítomný čas aplikací AI. LLM halucinují; RAG zakládá odpovědi na vašich datech.
- LlamaIndex je nejucelenější RAG stack. Zabaluje indexování, vyhledávání, plánování dotazů, pozorovatelnost a vyhodnocování do složitelných modulů, které si dobře rozumí s LangChain, OpenAI, Anthropic a open-source LLM.
- Tutoriály jsou vaší rychlou cestou. Nejlepší tutoriály LlamaIndex demonstrují nejen kód, ale i architektonická rozhodnutí: chunking, reranking, caching a guardrails.
Pokud je vaším cílem: „Chatovat s mými dokumenty a nehalucinovat,“ tento seznam vás tam dostane.
Jak jsme vybírali nejlepší tutoriály LlamaIndex
- Orientace na výsledek: Po každém tutoriálu byste měli dodat něco užitečného.
- Aktuální pro rok 2025: Odrážejí aktuální API LlamaIndex (např.
VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
- Vědomí produkčního prostředí: Ukazuje vyhodnocování, trasování a iterace – nad rámec hello world.
- Šíře + hloubka: Od rychlých startů po agenty, multimodalitu a strukturovanou extrakci.
10 nejlepších tutoriálů LlamaIndex (ručně vybraných)
Níže je uveden kurátorský postup. Začněte na své úrovni; skákejte tam, kde je potřeba.
1) 15minutový rychlý start: Chat nad vašimi PDF
- Nejlepší pro: Absolutní začátečníky a produktové manažery
- Co vytvoříte: Nahrajete PDF, indexujete, ptáte se a získáte citace
- Klíčové koncepty:
SimpleDirectoryReader, VectorStoreIndex, Settings, embeddingy
- Proč je to skvělé: Minimální kód, maximální aha! moment
Příklad kostry:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- Co se naučíte dál: Velikost chunku, top‑k a proč záleží na rerankingu.
2) Základy RAG s chunkingem, metadaty a rerankingem
- Nejlepší pro: Začátečníky → středně pokročilé
- Co vytvoříte: Chytřejší retriever s lepší kvalitou kontextu
- Klíčové koncepty:
SentenceSplitter, filtry metadat, rerank komponenty
- Proč je to skvělé: Ukazuje, jak několik knoflíků drasticky snižuje halucinace
Zkuste:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- Výsledek: Kontextová okna vyšší kvality pro dlouhé dokumenty.
3) LlamaIndex + OpenAI Function Calling (využití nástrojů a strukturovaný výstup)
- Nejlepší pro: Tvůrce automatizující pracovní postupy
- Co vytvoříte: Agent, který volá nástroje a vrací schémata JSON
- Klíčové koncepty:
QueryPipeline, specifikace nástrojů, schémata Pydantic, function calling
- Proč je to skvělé: Přemosťuje Q&A se skutečnými akcemi (vyhledávání, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- Výsledek: Produkční vzory pro strukturovanou extrakci a akce.
4) Vytvoření produkčního Vector Store (Postgres, Pinecone, Weaviate)
- Nejlepší pro: Týmy plánující škálování
- Co vytvoříte: Odolné vektorové úložiště s filtry a hybridním vyhledáváním
- Klíčové koncepty:
VectorStoreIndex adaptéry, hybridní BM25+embeddingy, metadata
- Proč je to skvělé: Učí perzistenci, migraci a kontrolu nákladů
Tipy:
- Použijte Postgres/pgvector pro jednoduché a cenově dostupné nasazení.
- Pinecone/Weaviate pro spravované škálování; nalaďte
ef_construction, ef_search.
- Přidejte hybridní vyhledávání pro zpracování vzácných termínů a zkratek.
5) Plánování dotazů a vícestupňové usuzování s agenty
- Nejlepší pro: Složité otázky a vyhledávání ve více datasetech
- Co vytvoříte: Plánovač, který rozloží dotaz na poddotazy
- Klíčové koncepty:
ReActAgent, SubQuestionQueryEngine, směrování
- Proč je to skvělé: Posouvá se za hranice „vyhledat a pak odpovědět“ k „přemýšlet a pak hledat“.
Vzor:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) Pozorovatelnost a vyhodnocování: Trasování, ukotvenost a benchmarky
- Nejlepší pro: Každého, kdo dodává skutečné aplikace
- Co vytvoříte: Zpětnovazební smyčky pro detekci regresí a halucinací
- Klíčové koncepty: LlamaIndex evals, graded QA, kontroly citací, trasování
- Proč je to skvělé: Naučí vás měřit to, na čem záleží, než začnete škálovat
Kontrolní seznam:
- Logujte všechny prompty/odpovědi s trasováním.
- Použijte graded QA datasety pro regresní testování.
- Sledujte ukotvenost a pokrytí citacemi.
7) RAG pro multimodální data (obrázky, tabulky, Markdown)
- Nejlepší pro: Dokumenty s grafy, screenshoty a tabulkami
- Co vytvoříte: Pipeline, které extrahují text z obrázků a usuzují nad tabulkami
- Klíčové koncepty: OCR + analýza rozvržení, chunking tabulek, multimodální modely
- Proč je to skvělé: Skutečné dokumenty jsou chaotické; tento tutoriál vám ukáže, jak je zkrotit.
8) Multi‑Tenant a izolace vyhledávání
- Nejlepší pro: Tvůrce SaaS
- Co vytvoříte: RAG službu, kde jsou data každého zákazníka izolována
- Klíčové koncepty: Jmenné prostory, metadata guards, indexy pro jednotlivé tenanty, RBAC
- Proč je to skvělé: Zabezpečení a soukromí již od návrhu; čisté cesty upgradu.
9) Strukturovaná extrakce ve velkém měřítku (faktury, protokoly, smlouvy)
- Nejlepší pro: Provoz, finance, právní pracovní postupy
- Co vytvoříte: Deterministické výstupy JSON s validací schématu
- Klíčové koncepty: Schémata Pydantic, opakování, validace rozšířená o nástroje
- Proč je to skvělé: Snižuje ruční kontrolu a činí výstup LLM spolehlivým.
10) End‑to‑End produkční vzor: Od notebooků po CI/CD
- Nejlepší pro: Týmy přecházející do produkce
- Co vytvoříte: Kompletní pipeline s příjmem dat, indexovacími úlohami, vyhodnocováním a uvolňovacími branami
- Klíčové koncepty: Pracovníci na pozadí, plánované re‑indexování, feature flags
- Proč je to skvělé: Ukazuje, jak dodávat nepřetržitě s jistotou.
Výběr správného tutoriálu LlamaIndex pro váš cíl
Použijte tento rychlý router k výběru dalšího kroku:
- „Potřebuji výsledky dnes.“ Začněte s rychlým startem (Tutoriál #1), poté přidejte reranking (Tutoriál #2).
- „Chci akce, nejen odpovědi.“ Přejděte na function calling a agenty (Tutoriál #3 a #5).
- „Máme potřeby škálování a shody.“ Úložiště + multi‑tenant vzory (Tutoriál #4 a #8).
- „Jak můžeme odpovědím věřit?“ Evals a trasování (Tutoriál #6).
- „Naše dokumenty jsou vizuálně náročné.“ Multimodální RAG (Tutoriál #7).
- „Potřebujeme strukturovaná data.“ Použijte schémata a validátory (Tutoriál #9).
Hluboký ponor: Osvědčené postupy, které uvidíte v nejlepších tutoriálech LlamaIndex
1) Chunking je rozhodnutí o produktu
- Kompromis: Větší chunky = více kontextu, ale vyšší náklady na tokeny; menší chunky = vyšší recall, ale fragmentovaný význam.
- Dobré výchozí hodnoty: 512–1024 tokenů s ~10–20% překrytím.
- Na metadatech záleží: Zachovejte zdroj, stránku, sekci, nadpisy.
2) Kvalita vyhledávání překonává velikost modelu
- Reranking: Přidejte cross‑encoder nebo embedding reranker pro lepší MRR.
- Hybridní vyhledávání: Zkombinujte BM25 pro vzácné termíny s embeddingy pro sémantiku.
- Filtry: Zužte podle typu dokumentu, data nebo tenanta, abyste zlepšili přesnost.
3) Vyhodnocujte brzy, vyhodnocujte vždy
- Graded QA: Vytvořte malou sadu párů otázka–odpověď s citacemi.
- Metriky: Správnost odpovědi, ukotvenost, latence a náklady na dotaz.
- A/B bezpečně: Shadow nasazení nového chunkingu nebo retrieverů před přepnutím.
4) Udělejte z akcí prvořadé
- Strukturovaný výstup: Použijte schémata pro extrakční úlohy.
- Nástroje: Zabalte API (vyhledávání, kalendář, DB) jako funkce pro agenty k volání.
- Guardrails: Validujte výstupy, implementujte opakování, logujte chyby nástrojů.
5) Hygiena nákladů a latence
- Cache embeddingy: Deduplikujte text a znovu použijte vektory napříč buildy.
- Dávkové operace: Indexujte hromadně; streamujte odpovědi pro zlepšení UX.
- Chytřejší kontext: Nepřeplňujte prompt—top‑k + rerank místo toho.
7denní plán učení pomocí nejlepších tutoriálů LlamaIndex
- Den 1: Rychlý start (Tutoriál #1). Vytvořte chat nad 20stránkovým PDF. Dodejte CLI.
- Den 2: Zlepšete vyhledávání (Tutoriál #2). Přidejte reranker + hybridní vyhledávání.
- Den 3: Přidejte function calling (Tutoriál #3). Vytvořte nástroj pro FAQ ve vašem API.
- Den 4: Přejděte na skutečný vector store (Tutoriál #4). Použijte pgvector lokálně.
- Den 5: Představte plánovač (Tutoriál #5). Směrujte otázky mezi dvěma indexy.
- Den 6: Přidejte vyhodnocování (Tutoriál #6). Vytvořte testovací sadu 30 otázek a baseline.
- Den 7: Produkční průchod (Tutoriál #10). Úlohy na pozadí, pozorovatelnost, CI.
Příklad projektu: „Docs Concierge“ s LlamaIndex
- Cíl: Zabezpečený interní asistent, který odpovídá na otázky týkající se procesních dokumentů a otevírá tickety.
- Stack: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
- Ingestujte exporty Confluence a PDF (zachovejte metadata + ACL).
- Chunkujte na 768 tokenů; indexujte do pgvector.
- Přidejte hybridní vyhledávání a reranker.
- Vytvořte nástroje:
create_jira_ticket, lookup_oncall, fetch_policy.
- Přidejte vyhodnocování s 50 kurátorskými otázkami; změřte ukotvenost.
- Nasaďte se streamovacím UI a náhledy citací.
- Výsledek: Rychlé, citované odpovědi; automatizace úloh jedním kliknutím; měřitelná přesnost.
Běžné chyby, kterým vám tyto tutoriály pomohou se vyhnout
- Přeskočení vyhodnocování: Pokud netestujete, dodáte regrese.
- Ignorování metadat: Ztratíte atribuci zdroje a směrovací sílu.
- Příliš velké chunky: Token bloat zvyšuje náklady bez lepších odpovědí.
- Nedostatečná specifikace nástrojů: Agenti potřebují jasné vstupy a deterministické výstupy.
- Žádná izolace: Multi‑tenant RAG musí zabránit úniku mezi zákazníky.
Nástroje, které doplňují tutoriály LlamaIndex
- Vector stores: pgvector, Pinecone, Weaviate, Qdrant
- Rerankers: Cohere Rerank, FlagEmbedding, Voyage rerank
- Chunkers: Sémantické splittery, splittery s ohledem na tabulky
- Evals: Ragas-style QA, LlamaIndex evals, custom rubric graders
- UI: Streamlit, Next.js, FastAPI websockets pro streamování tokenů
Mimochodem, pokud se rádi učíte prakticky ve svém prohlížeči, stojí za zmínku, že Sider.ai vám umožňuje chatovat s kódem, dokumenty a webovými stránkami vedle sebe. Můžete vkládat úryvky z tutoriálů LlamaIndex, procházet prompty a iterovat rychleji – což se hodí pro testování RAG promptů a extrahování strukturovaných výstupů, zatímco postupujete podle návodu. Co hledat: Hledání aktuálních tutoriálů LlamaIndex
- „nejlepší tutoriály LlamaIndex 2025“
- „LlamaIndex quickstart RAG pdf“
- „LlamaIndex SubQuestionQueryEngine example“
- „LlamaIndex evaluation groundedness tutorial“
- „LlamaIndex pgvector Pinecone guide“
- „LlamaIndex agents function calling example“
Hledejte nedávný kód používající Settings.llm, Settings.embed_model, VectorStoreIndex a as_query_engine—to jsou aktuální idiomy.
Klíčové poznatky
- Nejlepší tutoriály LlamaIndex vám pomohou dodat výsledky, nejen úryvky kódu.
- Začněte s chatem nad dokumenty, poté přidejte kvalitu vyhledávání, nástroje a vyhodnocování.
- Použijte skutečný vector store, přidejte plánovače pro složité otázky a neúnavně testujte.
- Malé architektonické volby – chunking, reranking, filtry – mění výsledky více než výměna modelů.
- Učení se zrychluje, když se řídíte strukturovaným plánem a vytváříte něco skutečného.
Co bude dál
- Vyberte si jeden tutoriál z prvních tří a vytvořte si minimální aplikaci ještě dnes.
- Přidejte vyhodnocování, než začnete škálovat uživatele.
- Naplánujte si produkční migraci: úložiště, ověřování, pozorovatelnost a CI.
- Vraťte se k pokročilým tutoriálům (agenti, multimodalita, multi‑tenant), jak se váš rozsah bude rozšiřovat.
FAQ
Q1:Jaké jsou nejlepší tutoriály LlamaIndex pro začátečníky?
Začněte rychlým startem, který vytvoří chat nad vašimi PDF pomocí VectorStoreIndex a SimpleDirectoryReader. Poté přidejte tutoriál o chunkingu, metadatech a rerankingu, abyste zvýšili kvalitu vyhledávání.
Q2:Jak vytvořím produkční RAG aplikaci s LlamaIndex?
Sledujte tutoriály, které pokrývají vector stores (pgvector, Pinecone), hybridní vyhledávání a vyhodnocování s graded QA. Přidejte trasování, strukturované výstupy a CI/CD, abyste se posunuli od notebooků k produkci.
Q3:Který tutoriál LlamaIndex učí agenty a používání nástrojů?
Hledejte průvodce používající agenty ve stylu ReAct, QueryPipeline a function calling se schématy Pydantic. Tyto tutoriály ukazují, jak směrovat dotazy, volat API a vracet strukturovaný JSON.
Q4:Jak mohu vyhodnotit přesnost LlamaIndex RAG?
Použijte vyhodnocovací tutoriály, které představují kontroly ukotvenosti, pokrytí citacemi a graded QA datasety. Sledujte správnost, latenci a náklady, abyste zachytili regrese před nasazením.
Q5:Existují tutoriály LlamaIndex pro multimodální dokumenty?
Ano, hledejte tutoriály, které kombinují OCR a analýzu rozvržení pro obrázky a tabulky, a poté indexujte extrahovaný text s metadaty. Ukazují, jak zpracovávat grafy, screenshoty a složité PDF v RAG.