What are the best LlamaIndex tutorials for beginners?

Start with a quickstart that builds chat over your PDFs using VectorStoreIndex and SimpleDirectoryReader. Then add a tutorial on chunking, metadata, and reranking to boost retrieval quality.

How do I build a production RAG app with LlamaIndex?

Follow tutorials that cover vector stores (pgvector, Pinecone), hybrid retrieval, and evaluation with graded QA. Add tracing, structured outputs, and CI/CD to move from notebooks to production.

Which LlamaIndex tutorial teaches agents and tool use?

Look for guides using ReAct-style agents, QueryPipeline, and function calling with Pydantic schemas. These tutorials show how to route queries, call APIs, and return structured JSON.

How can I evaluate LlamaIndex RAG accuracy?

Use evaluation tutorials that introduce groundedness checks, citation coverage, and graded QA datasets. Track correctness, latency, and cost to catch regressions before deploying.

Are there LlamaIndex tutorials for multimodal documents?

Yes, seek tutorials that combine OCR and layout parsing for images and tables, then index the extracted text with metadata. They show how to handle charts, screenshots, and complex PDFs in RAG.

10 Millors tutorials de LlamaIndex per dominar RAG el 2025

Si has sentit que la generació augmentada per recuperació (RAG) pot fer que les teves aplicacions LLM siguin més intel·ligents, tens raó. La manera més ràpida de llançar un assistent d'IA fiable, semblant a una cerca, avui dia és aprendre bé LlamaIndex, i els millors tutorials de LlamaIndex poden reduir la teva corba d'aprenentatge de mesos a dies.

En aquesta guia, seleccionem els millors tutorials de LlamaIndex per a cada nivell: des d'inicis ràpids de copiar i enganxar fins a pipelines de qualitat de producció. Hi trobaràs tutorials en vídeo, notebooks pràctics i receptes avançades per a dades multiinquilí, extracció estructurada, agents i avaluació.

També assignarem cada tutorial a l'habilitat o resultat que t'importa: crear xats sobre els teus documents, escalar embeddings, afegir eines, transmetre respostes o verificar resultats.

Al final, sabràs amb quin tutorial de LlamaIndex començar, quins seguir a continuació i com combinar-los en un producte real.

Per què els tutorials de LlamaIndex són importants ara mateix

RAG és el present de les aplicacions d'IA. Els LLM al·lucinen; RAG basa les respostes en les teves dades.

LlamaIndex és la pila RAG més cohesionada. Inclou indexació, recuperació, planificació de consultes, observabilitat i avaluació en mòduls composables que funcionen bé amb LangChain, OpenAI, Anthropic i LLM de codi obert.

Els tutorials són la teva via ràpida. Els millors tutorials de LlamaIndex demostren no només codi, sinó també decisions d'arquitectura: chunking, reranking, caching i guardrails.

Si el teu objectiu és: "Xatejar amb els meus documents i no al·lucinar", aquesta llista t'hi portarà.

Com hem seleccionat els millors tutorials de LlamaIndex

Orientat a resultats: Hauries de llançar alguna cosa útil després de cada tutorial.

Actualitzat per al 2025: Reflecteix les API actuals de LlamaIndex (per exemple, VectorStoreIndex, Settings, QueryPipeline, ReActAgent).

Conscient de la producció: Mostra avaluació, traçabilitat i iteració, més enllà del hola món.

Amplitud + profunditat: Des d'inicis ràpids fins a agents, multimodal i extracció estructurada.

Els 10 millors tutorials de LlamaIndex (seleccionats a mà)

A continuació, hi ha un camí seleccionat. Comença al teu nivell; salta on calgui.

1) L'inici ràpid de 15 minuts: xateja sobre els teus PDF

Ideal per a: Principiants absoluts i gestors de producte

Què construiràs: Carrega PDF, indexa, fes preguntes, obtén cites

Conceptes clau: SimpleDirectoryReader, VectorStoreIndex, Settings, embeddings

Per què és genial: Codi mínim, màxim moment aha!

Esquema d'exemple:

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)

Què aprendràs a continuació: Mida del chunk, top‑k i per què és important el reranking.

2) Fonaments de RAG amb Chunking, Metadades i Reranking

Ideal per a: Principiants → intermedi

Què construiràs: Un recuperador més intel·ligent amb una millor qualitat de context

Conceptes clau: SentenceSplitter, filtres de metadades, components rerank

Per què és genial: Mostra com uns quants botons redueixen dràsticament les al·lucinacions

Prova:

from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)

Resultat: Finestres de context de més qualitat per a documents llargs.

3) LlamaIndex + Funció de crida d'OpenAI (Ús d'eines i sortida estructurada)

Ideal per a: Constructors que automatitzen fluxos de treball

Què construiràs: Un agent que crida eines i retorna esquemes JSON

Conceptes clau: QueryPipeline, especificació d'eines, esquemes Pydantic, funció de crida

Per què és genial: Ponts de preguntes i respostes amb accions reals (cerca, CRUD, API)

from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))

Resultat: Patrons llestos per a la producció per a l'extracció i l'acció estructurades.

4) Construcció d'un magatzem de vectors de producció (Postgres, Pinecone, Weaviate)

Ideal per a: Equips que planifiquen escalar

Què construiràs: Emmagatzematge de vectors durador amb filtres i cerca híbrida

Conceptes clau: Adaptadors VectorStoreIndex, híbrids BM25+embeddings, metadades

Per què és genial: Ensenya persistència, migracions i control de costos

Consells:

Utilitza Postgres/pgvector per a implementacions senzilles i assequibles.

Pinecone/Weaviate per a l'escala gestionada; ajusta ef_construction, ef_search.

Afegeix la recuperació híbrida per gestionar termes rars i acrònims.

5) Planificació de consultes i raonament multi-pas amb agents

Ideal per a: Preguntes complexes i cerca de conjunts de dades múltiples

Què construiràs: Un planificador que descompon una consulta en subconsultes

Conceptes clau: ReActAgent, SubQuestionQueryEngine, enrutament

Per què és genial: Va més enllà de "recuperar i després respondre" a "pensar i després cercar".

Patró:

from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Observabilitat i avaluació: traçabilitat, fonamentació i benchmarks

Ideal per a: Qualsevol que llança aplicacions reals

Què construiràs: Bucles de retroalimentació per detectar regressions i al·lucinacions

Conceptes clau: Avaluacions de LlamaIndex, control de qualitat graduat, comprovacions de cites, traçabilitat

Per què és genial: T'ensenya a mesurar el que importa abans d'escalar

Llista de verificació:

Registra totes les sol·licituds/respostes amb traces.

Utilitza conjunts de dades de control de qualitat graduats per a proves de regressió.

Fes un seguiment de la fonamentació i la cobertura de cites.

7) RAG per a dades multimodals (imatges, taules, Markdown)

Ideal per a: Documents amb gràfics, captures de pantalla i taules

Què construiràs: Pipelines que extreuen text d'imatges i raonen sobre taules

Conceptes clau: OCR + anàlisi de disseny, chunking de taules, models multimodals

Per què és genial: Els documents del món real són desordenats; aquest tutorial et mostra com domar-los.

8) Aïllament multiinquilí i de recuperació

Ideal per a: Constructors de SaaS

Què construiràs: Un servei RAG on les dades de cada client estan aïllades

Conceptes clau: Espais de noms, proteccions de metadades, índexs per inquilí, RBAC

Per què és genial: Seguretat i privadesa per disseny; camins d'actualització nets.

9) Extracció estructurada a escala (factures, registres, contractes)

Ideal per a: Operacions, finances, fluxos de treball legals

Què construiràs: Sortides JSON deterministes amb validació d'esquemes

Conceptes clau: Esquemes Pydantic, intents, validació augmentada per eines

Per què és genial: Redueix la revisió manual i fa que la sortida de LLM sigui fiable.

10) Patró de producció d'extrem a extrem: des de notebooks fins a CI/CD

Ideal per a: Equips que es traslladen a prod

Què construiràs: Un pipeline complet amb ingestió de dades, treballs d'indexació, avaluació i portes d'alliberament

Conceptes clau: Treballadors en segon pla, reindexació programada, feature flags

Per què és genial: Mostra com enviar contínuament amb confiança.

Triar el tutorial de LlamaIndex adequat per al teu objectiu

Utilitza aquest router ràpid per triar el teu proper pas:

"Necessito resultats avui." Comença amb l'inici ràpid (Tutorial #1), després afegeix reranking (Tutorial #2).

"Vull accions, no només respostes." Salta a la funció de crida i als agents (Tutorial #3 i #5).

"Tenim necessitats d'escala i compliment." Patrons d'emmagatzematge + multiinquilí (Tutorial #4 i #8).

"Com confiem en les respostes?" Avaluacions i traçabilitat (Tutorial #6).

"Els nostres documents són molt visuals." RAG multimodal (Tutorial #7).

"Necessitem dades estructurades." Utilitza esquemes i validadors (Tutorial #9).

Anàlisi en profunditat: millors pràctiques que veuràs als millors tutorials de LlamaIndex

1) El chunking és una decisió de producte

Compromís: Chunks més grans = més context però un cost de token més alt; chunks més petits = més record però significat fragmentat.

Bons valors per defecte: 512–1024 tokens amb ~10–20% de superposició.

Les metadades importen: Preserva la font, la pàgina, la secció, els encapçalaments.

2) La qualitat de la recuperació supera la mida del model

Reranking: Afegeix un cross‑encoder o un reranker d'embeddings per a un millor MRR.

Cerca híbrida: Combina BM25 per a termes rars amb embeddings per a la semàntica.

Filtres: Redueix per tipus de document, data o inquilí per millorar la precisió.

3) Avalua aviat, avalua sempre

Control de qualitat graduat: Construeix un petit conjunt de parells pregunta-resposta amb cites.

Mètriques: Correcció de la resposta, fonamentació, latència i cost per consulta.

A/B de manera segura: Implementa nous chunking o recuperadors abans de canviar.

4) Fes que les accions siguin de primera classe

Sortida estructurada: Utilitza esquemes per a tasques d'extracció.

Eines: Inclou API (cerca, calendari, DB) com a funcions perquè els agents les cridin.

Guardrails: Valida les sortides, implementa intents, registra els errors de l'eina.

5) Cost i higiene de la latència

Caché d'embeddings: Deduplica el text i reutilitza els vectors entre les compilacions.

Operacions per lots: Indexa a granel; transmet respostes per millorar l'UX.

Context més intel·ligent: No sobrecarreguis la sol·licitud: top‑k + rerank en comptes d'això.

Un pla d'aprenentatge de 7 dies utilitzant els millors tutorials de LlamaIndex

Dia 1: Inici ràpid (Tutorial #1). Construeix un xat sobre un PDF de 20 pàgines. Envia un CLI.

Dia 2: Millora la recuperació (Tutorial #2). Afegeix reranker + cerca híbrida.

Dia 3: Afegeix la funció de crida (Tutorial #3). Crea una eina per a les preguntes freqüents a la teva API.

Dia 4: Trasllada't a un magatzem de vectors real (Tutorial #4). Utilitza pgvector localment.

Dia 5: Introdueix un planificador (Tutorial #5). Enruta preguntes a través de dos índexs.

Dia 6: Afegeix avaluació (Tutorial #6). Crea un conjunt de proves de 30 preguntes i una línia de base.

Dia 7: Passada de producció (Tutorial #10). Treballs en segon pla, observabilitat, CI.

Projecte d'exemple: "Conserge de documents" amb LlamaIndex

Objectiu: Un assistent intern segur que respon preguntes sobre documents de procés i obre tiquets.

Pila: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.

Passos:

Ingereix exportacions de Confluence i PDF (mantén les metadades + ACL).

Chunk a 768 tokens; indexa a pgvector.

Afegeix recuperació híbrida i un reranker.

Crea eines: create_jira_ticket, lookup_oncall, fetch_policy.

Afegeix avaluació amb 50 preguntes seleccionades; mesura la fonamentació.

Implementa amb IU de transmissió i previsualitzacions de cites.

Resultat: Respostes ràpides i citades; automatització de tasques amb un sol clic; precisió mesurable.

Errors comuns que aquests tutorials t'ajuden a evitar

Ometre l'avaluació: Si no proves, enviaràs regressions.

Ignorar les metadades: Perdràs l'atribució de la font i el poder d'enrutament.

Chunks de mida excessiva: La inflació de tokens augmenta el cost sense millors respostes.

Eines poc especificades: Els agents necessiten entrades clares i sortides deterministes.

Sense aïllament: RAG multiinquilí ha d'evitar les fuites entre clients.

Eines que complementen els tutorials de LlamaIndex

Magatzems de vectors: pgvector, Pinecone, Weaviate, Qdrant

Rerankers: Cohere Rerank, FlagEmbedding, Voyage rerank

Chunkers: Splitters semàntics, splitters conscients de la taula

Avaluacions: Control de qualitat d'estil Ragas, avaluacions de LlamaIndex, qualificadors de rúbrica personalitzats

IU: Streamlit, Next.js, websockets FastAPI per a la transmissió de tokens

Per cert, si t'agrada aprendre fent dins del teu navegador, val la pena assenyalar que Sider.ai et permet xatejar amb codi, documents i pàgines web de costat. Pots enganxar fragments de tutorials de LlamaIndex, executar sol·licituds i iterar més ràpidament, útil per provar sol·licituds de RAG i extreure sortides estructurades mentre segueixes.

Què cal cercar: trobar tutorials actualitzats de LlamaIndex

"millors tutorials de LlamaIndex 2025"

"LlamaIndex quickstart RAG pdf"

"Exemple de LlamaIndex SubQuestionQueryEngine"

"Tutorial d'avaluació de la fonamentació de LlamaIndex"

"Guia de LlamaIndex pgvector Pinecone"

"Exemple de funció de crida d'agents de LlamaIndex"

Busca codi recent que utilitzi Settings.llm, Settings.embed_model, VectorStoreIndex i as_query_engine: aquests són idiomes actuals.

Conclusions clau

Els millors tutorials de LlamaIndex t'ajuden a enviar resultats, no només fragments de codi.

Comença amb el xat sobre documents, després afegeix qualitat de recuperació, eines i avaluació.

Utilitza un magatzem de vectors real, afegeix planificadors per a preguntes complexes i prova sense parar.

Les petites eleccions arquitectòniques (chunking, reranking, filtres) canvien els resultats més que canviar els models.

L'aprenentatge s'accelera quan segueixes un pla estructurat i construeixes alguna cosa real.

Què ve a continuació

Tria un tutorial dels tres primers i construeix una aplicació mínima avui.

Afegeix avaluació abans d'escalar els usuaris.

Planifica la teva migració de producció: emmagatzematge, autenticació, observabilitat i CI.

Revisa els tutorials avançats (agents, multimodal, multiinquilí) a mesura que creix el teu abast.

Preguntes freqüents

P1:Quins són els millors tutorials de LlamaIndex per a principiants? Comença amb un inici ràpid que construeix un xat sobre els teus PDF utilitzant VectorStoreIndex i SimpleDirectoryReader. Després, afegeix un tutorial sobre chunking, metadades i reranking per augmentar la qualitat de la recuperació.

P2:Com construeixo una aplicació RAG de producció amb LlamaIndex? Segueix tutorials que cobreixin magatzems de vectors (pgvector, Pinecone), recuperació híbrida i avaluació amb control de qualitat graduat. Afegeix traçabilitat, sortides estructurades i CI/CD per passar de notebooks a producció.

P3:Quin tutorial de LlamaIndex ensenya agents i ús d'eines? Busca guies que utilitzin agents d'estil ReAct, QueryPipeline i funció de crida amb esquemes Pydantic. Aquests tutorials mostren com enrutar consultes, cridar API i retornar JSON estructurat.

P4:Com puc avaluar la precisió de LlamaIndex RAG? Utilitza tutorials d'avaluació que introdueixin comprovacions de fonamentació, cobertura de cites i conjunts de dades de control de qualitat graduats. Fes un seguiment de la correcció, la latència i el cost per detectar regressions abans d'implementar.

P5:Hi ha tutorials de LlamaIndex per a documents multimodals? Sí, busca tutorials que combinin OCR i anàlisi de disseny per a imatges i taules, després indexa el text extret amb metadades. Mostren com gestionar gràfics, captures de pantalla i PDF complexos a RAG.