Sider.ai
  • Chat
  • Wisebase
  • Herramientas
  • Extensión
  • Clientela
  • Precios
Descargar ahora
Acceso

Aprende más rápido, piensa más profundamente y crece de manera más inteligente con Sider.

Productos
Aplicaciones
  • Extensiones
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Herramientas
  • Creador de sitios webNew
  • Presentaciones de IANew
  • Escritor de ensayos AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Generador de imágenes AI
  • Generador de Brainrot Italiano
  • Removedor de fondo
  • Cambiador de fondo
  • Borrador de fotos
  • Removedor de texto
  • Retoque
  • Mejorador de imágenes
  • Crear
  • Traductor AI
  • Traductor de imágenes
  • Traductor de PDF
Sider
  • Contáctanos
  • Centro de ayuda
  • Descargar
  • Precios
  • Plan de Educación
  • Novedades
  • Blog
  • Comunidad
  • Socios
  • Afiliado
  • Invitar
©2026 Todos los derechos reservados
Términos de uso
Política de privacidad
  • Página de inicio
  • Blog
  • Herramientas de IA
  • Los 10 mejores tutoriales de LlamaIndex para dominar RAG en 2025

Los 10 mejores tutoriales de LlamaIndex para dominar RAG en 2025

Actualizado el 23 de sep de 2025

9 min


Los 10 mejores tutoriales de LlamaIndex para dominar RAG en 2025

Si has escuchado que la Generación Aumentada por Recuperación (RAG) puede hacer que tus aplicaciones LLM sean más inteligentes, tienes razón. La forma más rápida de lanzar un asistente de IA confiable, similar a una búsqueda, hoy en día es aprender bien LlamaIndex, y los mejores tutoriales de LlamaIndex pueden reducir tu curva de aprendizaje de meses a días.
En esta guía, seleccionamos los mejores tutoriales de LlamaIndex para cada nivel, desde inicios rápidos de copiar y pegar hasta pipelines de nivel de producción. Encontrarás tutoriales en video, notebooks prácticos y recetas avanzadas para datos multi-tenant, extracción estructurada, agentes y evaluación.
También asignaremos cada tutorial a la habilidad o el resultado que te interesa: construir un chat sobre tus documentos, escalar incrustaciones, agregar herramientas, transmitir respuestas o verificar resultados.
Al final, sabrás con qué tutorial de LlamaIndex comenzar, cuáles seguir a continuación y cómo combinarlos en un producto real.

Por qué los tutoriales de LlamaIndex son importantes ahora mismo

  • RAG es el tiempo presente de las aplicaciones de IA. Los LLM alucinan; RAG basa las respuestas en tus datos.
  • LlamaIndex es la pila RAG más cohesiva. Envuelve la indexación, la recuperación, la planificación de consultas, la observabilidad y la evaluación en módulos componibles que se integran bien con LangChain, OpenAI, Anthropic y LLM de código abierto.
  • Los tutoriales son tu vía rápida. Los mejores tutoriales de LlamaIndex demuestran no solo el código, sino también las decisiones de arquitectura: fragmentación, reranking, almacenamiento en caché y medidas de seguridad.
Si tu objetivo es: “Chatear con mis documentos y no alucinar”, esta lista te llevará allí.

Cómo elegimos los mejores tutoriales de LlamaIndex

  • Orientado a resultados: Debes lanzar algo útil después de cada tutorial.
  • Actualizado para 2025: Refleja las API actuales de LlamaIndex (por ejemplo, VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
  • Conocimiento de la producción: Muestra evaluación, seguimiento e iteración, más allá del hola mundo.
  • Amplitud + profundidad: Desde inicios rápidos hasta agentes, multimodal y extracción estructurada.

Los 10 mejores tutoriales de LlamaIndex (seleccionados a mano)

A continuación, se muestra una ruta seleccionada. Comienza en tu nivel; salta donde sea necesario.

1) El inicio rápido de 15 minutos: chatea sobre tus archivos PDF

  • Ideal para: Principiantes absolutos y gerentes de producto
  • Lo que construirás: Cargar archivos PDF, indexar, hacer preguntas, obtener citas
  • Conceptos clave: SimpleDirectoryReader, VectorStoreIndex, Settings, incrustaciones
  • Por qué es genial: Código mínimo, máximo momento ¡ajá!
Esqueleto de ejemplo:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
  • Lo que aprenderás a continuación: Tamaño del fragmento, top‑k y por qué importa el reranking.

2) Fundamentos de RAG con fragmentación, metadatos y reranking

  • Ideal para: Principiantes → intermedio
  • Lo que construirás: Un recuperador más inteligente con mejor calidad de contexto
  • Conceptos clave: SentenceSplitter, filtros de metadatos, componentes de rerank
  • Por qué es genial: Muestra cómo algunas perillas reducen drásticamente las alucinaciones
Prueba:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
  • Resultado: Ventanas de contexto de mayor calidad para documentos largos.

3) LlamaIndex + Llamadas de función de OpenAI (uso de herramientas y salida estructurada)

  • Ideal para: Constructores que automatizan flujos de trabajo
  • Lo que construirás: Un agente que llama a herramientas y devuelve esquemas JSON
  • Conceptos clave: QueryPipeline, especificación de la herramienta, esquemas Pydantic, llamadas de función
  • Por qué es genial: Une las preguntas y respuestas con acciones reales (búsqueda, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
  • Resultado: Patrones listos para producción para la extracción estructurada y la acción.

4) Construcción de un almacén de vectores de producción (Postgres, Pinecone, Weaviate)

  • Ideal para: Equipos que planean escalar
  • Lo que construirás: Almacenamiento vectorial duradero con filtros y búsqueda híbrida
  • Conceptos clave: Adaptadores VectorStoreIndex, híbrido BM25+incrustaciones, metadatos
  • Por qué es genial: Enseña persistencia, migraciones y control de costos
Consejos:
  • Usa Postgres/pgvector para implementaciones sencillas y asequibles.
  • Pinecone/Weaviate para escala administrada; ajusta ef_construction, ef_search.
  • Agrega recuperación híbrida para manejar términos raros y acrónimos.

5) Planificación de consultas y razonamiento de varios pasos con agentes

  • Ideal para: Preguntas complejas y búsqueda en múltiples conjuntos de datos
  • Lo que construirás: Un planificador que descompone una consulta en subconsultas
  • Conceptos clave: ReActAgent, SubQuestionQueryEngine, enrutamiento
  • Por qué es genial: Va más allá de “recuperar y luego responder” a “pensar y luego buscar”.
Patrón:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) Observabilidad y evaluación: seguimiento, fundamentación y puntos de referencia

  • Ideal para: Cualquiera que envíe aplicaciones reales
  • Lo que construirás: Bucles de retroalimentación para detectar regresiones y alucinaciones
  • Conceptos clave: Evaluaciones de LlamaIndex, control de calidad calificado, verificaciones de citas, seguimiento
  • Por qué es genial: Te enseña a medir lo que importa antes de escalar
Lista de verificación:
  • Registra todas las indicaciones/respuestas con seguimientos.
  • Usa conjuntos de datos de control de calidad calificados para pruebas de regresión.
  • Realiza un seguimiento de la fundamentación y la cobertura de citas.

7) RAG para datos multimodales (imágenes, tablas, Markdown)

  • Ideal para: Documentos con gráficos, capturas de pantalla y tablas
  • Lo que construirás: Pipelines que extraen texto de imágenes y razonan sobre tablas
  • Conceptos clave: OCR + análisis de diseño, fragmentación de tablas, modelos multimodales
  • Por qué es genial: Los documentos del mundo real son confusos; este tutorial te muestra cómo domesticarlos.

8) Aislamiento multi-tenant y de recuperación

  • Ideal para: Constructores de SaaS
  • Lo que construirás: Un servicio RAG donde los datos de cada cliente están aislados
  • Conceptos clave: Espacios de nombres, protecciones de metadatos, índices por inquilino, RBAC
  • Por qué es genial: Seguridad y privacidad por diseño; rutas de actualización limpias.

9) Extracción estructurada a escala (facturas, registros, contratos)

  • Ideal para: Operaciones, finanzas, flujos de trabajo legales
  • Lo que construirás: Salidas JSON deterministas con validación de esquema
  • Conceptos clave: Esquemas Pydantic, reintentos, validación aumentada por herramientas
  • Por qué es genial: Reduce la revisión manual y hace que la salida de LLM sea confiable.

10) Patrón de producción de extremo a extremo: desde notebooks hasta CI/CD

  • Ideal para: Equipos que se mudan a producción
  • Lo que construirás: Un pipeline completo con ingesta de datos, trabajos de indexación, evaluación y puertas de lanzamiento
  • Conceptos clave: Trabajadores en segundo plano, reindexación programada, feature flags
  • Por qué es genial: Muestra cómo enviar continuamente con confianza.

Elegir el tutorial de LlamaIndex adecuado para tu objetivo

Usa este enrutador rápido para elegir tu próximo paso:
  • “Necesito resultados hoy”. Comienza con el inicio rápido (Tutorial #1), luego agrega reranking (Tutorial #2).
  • “Quiero acciones, no solo respuestas”. Salta a las llamadas de función y a los agentes (Tutorial #3 y #5).
  • “Tenemos necesidades de escala y cumplimiento”. Patrones de almacenamiento + multi-tenant (Tutorial #4 y #8).
  • “¿Cómo confiamos en las respuestas?” Evaluaciones y seguimiento (Tutorial #6).
  • “Nuestros documentos son muy visuales”. RAG multimodal (Tutorial #7).
  • “Necesitamos datos estructurados”. Usa esquemas y validadores (Tutorial #9).

Inmersión profunda: las mejores prácticas que verás en los mejores tutoriales de LlamaIndex

1) La fragmentación es una decisión de producto

  • Compromiso: Fragmentos más grandes = más contexto pero mayor costo de token; fragmentos más pequeños = mayor recuperación pero significado fragmentado.
  • Buenos valores predeterminados: 512–1024 tokens con ~10–20% de superposición.
  • Los metadatos importan: Conserva la fuente, la página, la sección, los encabezados.

2) La calidad de la recuperación supera el tamaño del modelo

  • Reranking: Agrega un codificador cruzado o un reranker de incrustación para un mejor MRR.
  • Búsqueda híbrida: Combina BM25 para términos raros con incrustaciones para semántica.
  • Filtros: Reduce por tipo de documento, fecha o inquilino para mejorar la precisión.

3) Evalúa temprano, evalúa siempre

  • Control de calidad calificado: Crea un pequeño conjunto de pares de preguntas y respuestas con citas.
  • Métricas: Corrección de la respuesta, fundamentación, latencia y costo por consulta.
  • A/B de forma segura: Implementa en la sombra una nueva fragmentación o recuperadores antes de cambiar.

4) Haz que las acciones sean de primera clase

  • Salida estructurada: Usa esquemas para tareas de extracción.
  • Herramientas: Envuelve las API (búsqueda, calendario, DB) como funciones para que los agentes las llamen.
  • Medidas de seguridad: Valida las salidas, implementa reintentos, registra los errores de la herramienta.

5) Higiene de costos y latencia

  • Incrustaciones de caché: Desduplica el texto y reutiliza los vectores en todas las compilaciones.
  • Operaciones por lotes: Indexa en masa; transmite respuestas para mejorar la UX.
  • Contexto más inteligente: No sobrecargues la indicación: top‑k + rerank en su lugar.

Un plan de aprendizaje de 7 días usando los mejores tutoriales de LlamaIndex

  • Día 1: Inicio rápido (Tutorial #1). Construye un chat sobre un PDF de 20 páginas. Envía una CLI.
  • Día 2: Mejora la recuperación (Tutorial #2). Agrega reranker + búsqueda híbrida.
  • Día 3: Agrega llamadas de función (Tutorial #3). Crea una herramienta para las preguntas frecuentes en tu API.
  • Día 4: Muévete a un almacén de vectores real (Tutorial #4). Usa pgvector localmente.
  • Día 5: Introduce un planificador (Tutorial #5). Enruta preguntas a través de dos índices.
  • Día 6: Agrega evaluación (Tutorial #6). Crea un conjunto de pruebas de 30 preguntas y una línea de base.
  • Día 7: Pase de producción (Tutorial #10). Trabajos en segundo plano, observabilidad, CI.

Proyecto de ejemplo: "Conserje de documentos" con LlamaIndex

  • Objetivo: Un asistente interno seguro que responde preguntas sobre los documentos del proceso y abre tickets.
  • Pila: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
  • Pasos:
  1. Ingiere exportaciones de Confluence y archivos PDF (conserva los metadatos + ACL).
  1. Fragmenta en 768 tokens; indexa a pgvector.
  1. Agrega recuperación híbrida y un reranker.
  1. Crea herramientas: create_jira_ticket, lookup_oncall, fetch_policy.
  1. Agrega evaluación con 50 preguntas seleccionadas; mide la fundamentación.
  1. Implementa con una interfaz de usuario de transmisión y vistas previas de citas.
  • Resultado: Respuestas rápidas y citadas; automatización de tareas con un solo clic; precisión medible.

Errores comunes que estos tutoriales te ayudan a evitar

  • Omitir la evaluación: Si no pruebas, enviarás regresiones.
  • Ignorar los metadatos: Perderás la atribución de la fuente y el poder de enrutamiento.
  • Fragmentos de gran tamaño: La sobrecarga de tokens aumenta el costo sin mejores respuestas.
  • Herramientas con especificaciones insuficientes: Los agentes necesitan entradas claras y salidas deterministas.
  • Sin aislamiento: RAG multi-tenant debe evitar la fuga entre clientes.

Herramientas que complementan los tutoriales de LlamaIndex

  • Almacenes de vectores: pgvector, Pinecone, Weaviate, Qdrant
  • Rerankers: Cohere Rerank, FlagEmbedding, Voyage rerank
  • Fragmentadores: Divisores semánticos, divisores con reconocimiento de tablas
  • Evaluaciones: Control de calidad al estilo Ragas, evaluaciones de LlamaIndex, calificadores de rúbrica personalizados
  • UI: Streamlit, Next.js, websockets de FastAPI para transmitir tokens
Por cierto, si te gusta aprender haciendo dentro de tu navegador, vale la pena señalar que Sider.ai te permite chatear con código, documentos y páginas web uno al lado del otro. Puedes pegar fragmentos de los tutoriales de LlamaIndex, ejecutar indicaciones e iterar más rápido, lo que es útil para probar las indicaciones de RAG y extraer salidas estructuradas mientras sigues el tutorial.

Qué buscar: encontrar tutoriales actualizados de LlamaIndex

  • “mejores tutoriales de LlamaIndex 2025”
  • “LlamaIndex inicio rápido RAG pdf”
  • “Ejemplo de LlamaIndex SubQuestionQueryEngine”
  • “Tutorial de fundamentación de la evaluación de LlamaIndex”
  • “Guía de LlamaIndex pgvector Pinecone”
  • “Ejemplo de llamada de función de agentes de LlamaIndex”
Busca código reciente que use Settings.llm, Settings.embed_model, VectorStoreIndex y as_query_engine; estos son modismos actuales.

Conclusiones clave

  • Los mejores tutoriales de LlamaIndex te ayudan a enviar resultados, no solo fragmentos de código.
  • Comienza con el chat sobre documentos, luego agrega calidad de recuperación, herramientas y evaluación.
  • Usa un almacén de vectores real, agrega planificadores para preguntas complejas y prueba sin descanso.
  • Las pequeñas elecciones arquitectónicas (fragmentación, reranking, filtros) cambian los resultados más que el intercambio de modelos.
  • El aprendizaje se acelera cuando sigues un plan estructurado y construyes algo real.

Qué sigue

  • Elige un tutorial de los tres primeros y crea una aplicación mínima hoy.
  • Agrega evaluación antes de escalar a los usuarios.
  • Planifica tu migración de producción: almacenamiento, autenticación, observabilidad y CI.
  • Revisa los tutoriales avanzados (agentes, multimodal, multi-tenant) a medida que crezca tu alcance.

Preguntas frecuentes

P1: ¿Cuáles son los mejores tutoriales de LlamaIndex para principiantes? Comienza con un inicio rápido que construya un chat sobre tus archivos PDF usando VectorStoreIndex y SimpleDirectoryReader. Luego, agrega un tutorial sobre fragmentación, metadatos y reranking para aumentar la calidad de la recuperación.
P2: ¿Cómo construyo una aplicación RAG de producción con LlamaIndex? Sigue los tutoriales que cubren los almacenes de vectores (pgvector, Pinecone), la recuperación híbrida y la evaluación con control de calidad calificado. Agrega seguimiento, salidas estructuradas y CI/CD para pasar de los notebooks a la producción.
P3: ¿Qué tutorial de LlamaIndex enseña agentes y uso de herramientas? Busca guías que usen agentes de estilo ReAct, QueryPipeline y llamadas de función con esquemas Pydantic. Estos tutoriales muestran cómo enrutar consultas, llamar a API y devolver JSON estructurado.
P4: ¿Cómo puedo evaluar la precisión de LlamaIndex RAG? Usa tutoriales de evaluación que introduzcan verificaciones de fundamentación, cobertura de citas y conjuntos de datos de control de calidad calificados. Realiza un seguimiento de la corrección, la latencia y el costo para detectar regresiones antes de la implementación.
P5: ¿Hay tutoriales de LlamaIndex para documentos multimodales? Sí, busca tutoriales que combinen OCR y análisis de diseño para imágenes y tablas, luego indexa el texto extraído con metadatos. Muestran cómo manejar gráficos, capturas de pantalla y archivos PDF complejos en RAG.

Artículos Recientes
Cómo dominar ChatPDF: Obtén insights más rápidos de documentos densos

Cómo dominar ChatPDF: Obtén insights más rápidos de documentos densos

La mejor alternativa a X Auto-Translation para documentos rápidos y precisos

La mejor alternativa a X Auto-Translation para documentos rápidos y precisos

¿Traducción AI de Samsung no disponible en Irán? Soluciones prácticas

¿Traducción AI de Samsung no disponible en Irán? Soluciones prácticas

Herramientas de traducción persa: una guía práctica para un trabajo más rápido y preciso

Herramientas de traducción persa: una guía práctica para un trabajo más rápido y preciso

La mejor alternativa a Grok para investigaciones profundas y citadas

La mejor alternativa a Grok para investigaciones profundas y citadas

Las 15 mejores funciones de los generadores de imágenes con IA que realmente usarás

Las 15 mejores funciones de los generadores de imágenes con IA que realmente usarás