Sider.ai
  • Xat
  • Wisebase
  • Eines
  • Extensió
  • Clients
  • Preus
Descarrega ara
iniciar Sessió

Aprèn més ràpid, pensa més profundament i creix més intel·ligent amb Sider.

Productes
Aplicacions
  • Extensions
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Eines
  • Creador de llocs webNew
  • AI SlidesNew
  • Escriptor d'assajos AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Generador d'imatges AI
  • Generador de Brainrot Italià
  • Eliminador de fons
  • Canviador de fons
  • Esborrador de fotos
  • Eliminador de text
  • Repintar
  • Millorador d'imatges
  • Crear
  • Traductor AI
  • Traductor d'imatges
  • Traductor de PDF
Sider
  • Contacta'ns
  • Centre d'ajuda
  • Descarregar
  • Preus
  • Pla d'Educació
  • Què hi ha de nou
  • Blog
  • Comunitat
  • Socis
  • Afiliat
  • Convida
©2026 Tots els drets reservats
Condicions d'ús
Política de privacitat
  • Pàgina d'inici
  • Bloc
  • Eines d'IA
  • 10 millors tutorials de LlamaIndex per dominar RAG el 2025

10 millors tutorials de LlamaIndex per dominar RAG el 2025

Actualitzat el 23 Set. 2025

9 min


10 Millors tutorials de LlamaIndex per dominar RAG el 2025

Si has sentit que la generació augmentada per recuperació (RAG) pot fer que les teves aplicacions LLM siguin més intel·ligents, tens raó. La manera més ràpida de llançar un assistent d'IA fiable, semblant a una cerca, avui dia és aprendre bé LlamaIndex, i els millors tutorials de LlamaIndex poden reduir la teva corba d'aprenentatge de mesos a dies.
En aquesta guia, seleccionem els millors tutorials de LlamaIndex per a cada nivell: des d'inicis ràpids de copiar i enganxar fins a pipelines de qualitat de producció. Hi trobaràs tutorials en vídeo, notebooks pràctics i receptes avançades per a dades multiinquilí, extracció estructurada, agents i avaluació.
També assignarem cada tutorial a l'habilitat o resultat que t'importa: crear xats sobre els teus documents, escalar embeddings, afegir eines, transmetre respostes o verificar resultats.
Al final, sabràs amb quin tutorial de LlamaIndex començar, quins seguir a continuació i com combinar-los en un producte real.

Per què els tutorials de LlamaIndex són importants ara mateix

  • RAG és el present de les aplicacions d'IA. Els LLM al·lucinen; RAG basa les respostes en les teves dades.
  • LlamaIndex és la pila RAG més cohesionada. Inclou indexació, recuperació, planificació de consultes, observabilitat i avaluació en mòduls composables que funcionen bé amb LangChain, OpenAI, Anthropic i LLM de codi obert.
  • Els tutorials són la teva via ràpida. Els millors tutorials de LlamaIndex demostren no només codi, sinó també decisions d'arquitectura: chunking, reranking, caching i guardrails.
Si el teu objectiu és: "Xatejar amb els meus documents i no al·lucinar", aquesta llista t'hi portarà.

Com hem seleccionat els millors tutorials de LlamaIndex

  • Orientat a resultats: Hauries de llançar alguna cosa útil després de cada tutorial.
  • Actualitzat per al 2025: Reflecteix les API actuals de LlamaIndex (per exemple, VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
  • Conscient de la producció: Mostra avaluació, traçabilitat i iteració, més enllà del hola món.
  • Amplitud + profunditat: Des d'inicis ràpids fins a agents, multimodal i extracció estructurada.

Els 10 millors tutorials de LlamaIndex (seleccionats a mà)

A continuació, hi ha un camí seleccionat. Comença al teu nivell; salta on calgui.

1) L'inici ràpid de 15 minuts: xateja sobre els teus PDF

  • Ideal per a: Principiants absoluts i gestors de producte
  • Què construiràs: Carrega PDF, indexa, fes preguntes, obtén cites
  • Conceptes clau: SimpleDirectoryReader, VectorStoreIndex, Settings, embeddings
  • Per què és genial: Codi mínim, màxim moment aha!
Esquema d'exemple:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
  • Què aprendràs a continuació: Mida del chunk, top‑k i per què és important el reranking.

2) Fonaments de RAG amb Chunking, Metadades i Reranking

  • Ideal per a: Principiants → intermedi
  • Què construiràs: Un recuperador més intel·ligent amb una millor qualitat de context
  • Conceptes clau: SentenceSplitter, filtres de metadades, components rerank
  • Per què és genial: Mostra com uns quants botons redueixen dràsticament les al·lucinacions
Prova:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
  • Resultat: Finestres de context de més qualitat per a documents llargs.

3) LlamaIndex + Funció de crida d'OpenAI (Ús d'eines i sortida estructurada)

  • Ideal per a: Constructors que automatitzen fluxos de treball
  • Què construiràs: Un agent que crida eines i retorna esquemes JSON
  • Conceptes clau: QueryPipeline, especificació d'eines, esquemes Pydantic, funció de crida
  • Per què és genial: Ponts de preguntes i respostes amb accions reals (cerca, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
  • Resultat: Patrons llestos per a la producció per a l'extracció i l'acció estructurades.

4) Construcció d'un magatzem de vectors de producció (Postgres, Pinecone, Weaviate)

  • Ideal per a: Equips que planifiquen escalar
  • Què construiràs: Emmagatzematge de vectors durador amb filtres i cerca híbrida
  • Conceptes clau: Adaptadors VectorStoreIndex, híbrids BM25+embeddings, metadades
  • Per què és genial: Ensenya persistència, migracions i control de costos
Consells:
  • Utilitza Postgres/pgvector per a implementacions senzilles i assequibles.
  • Pinecone/Weaviate per a l'escala gestionada; ajusta ef_construction, ef_search.
  • Afegeix la recuperació híbrida per gestionar termes rars i acrònims.

5) Planificació de consultes i raonament multi-pas amb agents

  • Ideal per a: Preguntes complexes i cerca de conjunts de dades múltiples
  • Què construiràs: Un planificador que descompon una consulta en subconsultes
  • Conceptes clau: ReActAgent, SubQuestionQueryEngine, enrutament
  • Per què és genial: Va més enllà de "recuperar i després respondre" a "pensar i després cercar".
Patró:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Observabilitat i avaluació: traçabilitat, fonamentació i benchmarks

  • Ideal per a: Qualsevol que llança aplicacions reals
  • Què construiràs: Bucles de retroalimentació per detectar regressions i al·lucinacions
  • Conceptes clau: Avaluacions de LlamaIndex, control de qualitat graduat, comprovacions de cites, traçabilitat
  • Per què és genial: T'ensenya a mesurar el que importa abans d'escalar
Llista de verificació:
  • Registra totes les sol·licituds/respostes amb traces.
  • Utilitza conjunts de dades de control de qualitat graduats per a proves de regressió.
  • Fes un seguiment de la fonamentació i la cobertura de cites.

7) RAG per a dades multimodals (imatges, taules, Markdown)

  • Ideal per a: Documents amb gràfics, captures de pantalla i taules
  • Què construiràs: Pipelines que extreuen text d'imatges i raonen sobre taules
  • Conceptes clau: OCR + anàlisi de disseny, chunking de taules, models multimodals
  • Per què és genial: Els documents del món real són desordenats; aquest tutorial et mostra com domar-los.

8) Aïllament multiinquilí i de recuperació

  • Ideal per a: Constructors de SaaS
  • Què construiràs: Un servei RAG on les dades de cada client estan aïllades
  • Conceptes clau: Espais de noms, proteccions de metadades, índexs per inquilí, RBAC
  • Per què és genial: Seguretat i privadesa per disseny; camins d'actualització nets.

9) Extracció estructurada a escala (factures, registres, contractes)

  • Ideal per a: Operacions, finances, fluxos de treball legals
  • Què construiràs: Sortides JSON deterministes amb validació d'esquemes
  • Conceptes clau: Esquemes Pydantic, intents, validació augmentada per eines
  • Per què és genial: Redueix la revisió manual i fa que la sortida de LLM sigui fiable.

10) Patró de producció d'extrem a extrem: des de notebooks fins a CI/CD

  • Ideal per a: Equips que es traslladen a prod
  • Què construiràs: Un pipeline complet amb ingestió de dades, treballs d'indexació, avaluació i portes d'alliberament
  • Conceptes clau: Treballadors en segon pla, reindexació programada, feature flags
  • Per què és genial: Mostra com enviar contínuament amb confiança.

Triar el tutorial de LlamaIndex adequat per al teu objectiu

Utilitza aquest router ràpid per triar el teu proper pas:
  • "Necessito resultats avui." Comença amb l'inici ràpid (Tutorial #1), després afegeix reranking (Tutorial #2).
  • "Vull accions, no només respostes." Salta a la funció de crida i als agents (Tutorial #3 i #5).
  • "Tenim necessitats d'escala i compliment." Patrons d'emmagatzematge + multiinquilí (Tutorial #4 i #8).
  • "Com confiem en les respostes?" Avaluacions i traçabilitat (Tutorial #6).
  • "Els nostres documents són molt visuals." RAG multimodal (Tutorial #7).
  • "Necessitem dades estructurades." Utilitza esquemes i validadors (Tutorial #9).

Anàlisi en profunditat: millors pràctiques que veuràs als millors tutorials de LlamaIndex

1) El chunking és una decisió de producte

  • Compromís: Chunks més grans = més context però un cost de token més alt; chunks més petits = més record però significat fragmentat.
  • Bons valors per defecte: 512–1024 tokens amb ~10–20% de superposició.
  • Les metadades importen: Preserva la font, la pàgina, la secció, els encapçalaments.

2) La qualitat de la recuperació supera la mida del model

  • Reranking: Afegeix un cross‑encoder o un reranker d'embeddings per a un millor MRR.
  • Cerca híbrida: Combina BM25 per a termes rars amb embeddings per a la semàntica.
  • Filtres: Redueix per tipus de document, data o inquilí per millorar la precisió.

3) Avalua aviat, avalua sempre

  • Control de qualitat graduat: Construeix un petit conjunt de parells pregunta-resposta amb cites.
  • Mètriques: Correcció de la resposta, fonamentació, latència i cost per consulta.
  • A/B de manera segura: Implementa nous chunking o recuperadors abans de canviar.

4) Fes que les accions siguin de primera classe

  • Sortida estructurada: Utilitza esquemes per a tasques d'extracció.
  • Eines: Inclou API (cerca, calendari, DB) com a funcions perquè els agents les cridin.
  • Guardrails: Valida les sortides, implementa intents, registra els errors de l'eina.

5) Cost i higiene de la latència

  • Caché d'embeddings: Deduplica el text i reutilitza els vectors entre les compilacions.
  • Operacions per lots: Indexa a granel; transmet respostes per millorar l'UX.
  • Context més intel·ligent: No sobrecarreguis la sol·licitud: top‑k + rerank en comptes d'això.

Un pla d'aprenentatge de 7 dies utilitzant els millors tutorials de LlamaIndex

  • Dia 1: Inici ràpid (Tutorial #1). Construeix un xat sobre un PDF de 20 pàgines. Envia un CLI.
  • Dia 2: Millora la recuperació (Tutorial #2). Afegeix reranker + cerca híbrida.
  • Dia 3: Afegeix la funció de crida (Tutorial #3). Crea una eina per a les preguntes freqüents a la teva API.
  • Dia 4: Trasllada't a un magatzem de vectors real (Tutorial #4). Utilitza pgvector localment.
  • Dia 5: Introdueix un planificador (Tutorial #5). Enruta preguntes a través de dos índexs.
  • Dia 6: Afegeix avaluació (Tutorial #6). Crea un conjunt de proves de 30 preguntes i una línia de base.
  • Dia 7: Passada de producció (Tutorial #10). Treballs en segon pla, observabilitat, CI.

Projecte d'exemple: "Conserge de documents" amb LlamaIndex

  • Objectiu: Un assistent intern segur que respon preguntes sobre documents de procés i obre tiquets.
  • Pila: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
  • Passos:
  1. Ingereix exportacions de Confluence i PDF (mantén les metadades + ACL).
  1. Chunk a 768 tokens; indexa a pgvector.
  1. Afegeix recuperació híbrida i un reranker.
  1. Crea eines: create_jira_ticket, lookup_oncall, fetch_policy.
  1. Afegeix avaluació amb 50 preguntes seleccionades; mesura la fonamentació.
  1. Implementa amb IU de transmissió i previsualitzacions de cites.
  • Resultat: Respostes ràpides i citades; automatització de tasques amb un sol clic; precisió mesurable.

Errors comuns que aquests tutorials t'ajuden a evitar

  • Ometre l'avaluació: Si no proves, enviaràs regressions.
  • Ignorar les metadades: Perdràs l'atribució de la font i el poder d'enrutament.
  • Chunks de mida excessiva: La inflació de tokens augmenta el cost sense millors respostes.
  • Eines poc especificades: Els agents necessiten entrades clares i sortides deterministes.
  • Sense aïllament: RAG multiinquilí ha d'evitar les fuites entre clients.

Eines que complementen els tutorials de LlamaIndex

  • Magatzems de vectors: pgvector, Pinecone, Weaviate, Qdrant
  • Rerankers: Cohere Rerank, FlagEmbedding, Voyage rerank
  • Chunkers: Splitters semàntics, splitters conscients de la taula
  • Avaluacions: Control de qualitat d'estil Ragas, avaluacions de LlamaIndex, qualificadors de rúbrica personalitzats
  • IU: Streamlit, Next.js, websockets FastAPI per a la transmissió de tokens
Per cert, si t'agrada aprendre fent dins del teu navegador, val la pena assenyalar que Sider.ai et permet xatejar amb codi, documents i pàgines web de costat. Pots enganxar fragments de tutorials de LlamaIndex, executar sol·licituds i iterar més ràpidament, útil per provar sol·licituds de RAG i extreure sortides estructurades mentre segueixes.

Què cal cercar: trobar tutorials actualitzats de LlamaIndex

  • "millors tutorials de LlamaIndex 2025"
  • "LlamaIndex quickstart RAG pdf"
  • "Exemple de LlamaIndex SubQuestionQueryEngine"
  • "Tutorial d'avaluació de la fonamentació de LlamaIndex"
  • "Guia de LlamaIndex pgvector Pinecone"
  • "Exemple de funció de crida d'agents de LlamaIndex"
Busca codi recent que utilitzi Settings.llm, Settings.embed_model, VectorStoreIndex i as_query_engine: aquests són idiomes actuals.

Conclusions clau

  • Els millors tutorials de LlamaIndex t'ajuden a enviar resultats, no només fragments de codi.
  • Comença amb el xat sobre documents, després afegeix qualitat de recuperació, eines i avaluació.
  • Utilitza un magatzem de vectors real, afegeix planificadors per a preguntes complexes i prova sense parar.
  • Les petites eleccions arquitectòniques (chunking, reranking, filtres) canvien els resultats més que canviar els models.
  • L'aprenentatge s'accelera quan segueixes un pla estructurat i construeixes alguna cosa real.

Què ve a continuació

  • Tria un tutorial dels tres primers i construeix una aplicació mínima avui.
  • Afegeix avaluació abans d'escalar els usuaris.
  • Planifica la teva migració de producció: emmagatzematge, autenticació, observabilitat i CI.
  • Revisa els tutorials avançats (agents, multimodal, multiinquilí) a mesura que creix el teu abast.

Preguntes freqüents

P1:Quins són els millors tutorials de LlamaIndex per a principiants? Comença amb un inici ràpid que construeix un xat sobre els teus PDF utilitzant VectorStoreIndex i SimpleDirectoryReader. Després, afegeix un tutorial sobre chunking, metadades i reranking per augmentar la qualitat de la recuperació.
P2:Com construeixo una aplicació RAG de producció amb LlamaIndex? Segueix tutorials que cobreixin magatzems de vectors (pgvector, Pinecone), recuperació híbrida i avaluació amb control de qualitat graduat. Afegeix traçabilitat, sortides estructurades i CI/CD per passar de notebooks a producció.
P3:Quin tutorial de LlamaIndex ensenya agents i ús d'eines? Busca guies que utilitzin agents d'estil ReAct, QueryPipeline i funció de crida amb esquemes Pydantic. Aquests tutorials mostren com enrutar consultes, cridar API i retornar JSON estructurat.
P4:Com puc avaluar la precisió de LlamaIndex RAG? Utilitza tutorials d'avaluació que introdueixin comprovacions de fonamentació, cobertura de cites i conjunts de dades de control de qualitat graduats. Fes un seguiment de la correcció, la latència i el cost per detectar regressions abans d'implementar.
P5:Hi ha tutorials de LlamaIndex per a documents multimodals? Sí, busca tutorials que combinin OCR i anàlisi de disseny per a imatges i taules, després indexa el text extret amb metadades. Mostren com gestionar gràfics, captures de pantalla i PDF complexos a RAG.

Articles Recents
Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

La millor alternativa a Grok per a una recerca profunda i citada

La millor alternativa a Grok per a una recerca profunda i citada

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs