2025년 RAG 마스터를 위한 10가지 최고의 LlamaIndex 튜토리얼
검색 증강 생성(RAG)이 LLM 앱을 더 스마트하게 만들 수 있다는 소식을 들었다면 맞습니다. 오늘날 안정적인 검색형 AI 어시스턴트를 가장 빠르게 출시하는 방법은 LlamaIndex를 제대로 배우는 것입니다. 최고의 LlamaIndex 튜토리얼은 학습 곡선을 몇 달에서 며칠로 단축할 수 있습니다.
이 가이드에서는 복사-붙여넣기 퀵스타트부터 프로덕션 수준의 파이프라인까지 모든 수준에 적합한 최고의 LlamaIndex 튜토리얼을 엄선했습니다. 멀티 테넌트 데이터, 구조적 추출, 에이전트 및 평가를 위한 비디오 가이드, 실습 노트북 및 고급 레시피를 찾을 수 있습니다.
또한 문서에 대한 채팅 구축, 임베딩 확장, 도구 추가, 답변 스트리밍 또는 결과 확인과 같이 사용자가 중요하게 생각하는 기술 또는 결과에 각 튜토리얼을 매핑합니다.
결국 어떤 LlamaIndex 튜토리얼부터 시작해야 하는지, 다음에 어떤 튜토리얼을 따라야 하는지, 그리고 실제 제품으로 결합하는 방법을 알게 될 것입니다.
지금 LlamaIndex 튜토리얼이 중요한 이유
- RAG는 AI 앱의 현재 시제입니다. LLM은 환각을 일으키지만 RAG는 사용자의 데이터를 기반으로 답변합니다.
- LlamaIndex는 가장 응집력 있는 RAG 스택입니다. 인덱싱, 검색, 쿼리 계획, 관찰 가능성 및 평가를 LangChain, OpenAI, Anthropic 및 오픈 소스 LLM과 잘 작동하는 구성 가능한 모듈로 래핑합니다.
- 튜토리얼은 빠른 길입니다. 최고의 LlamaIndex 튜토리얼은 코드뿐만 아니라 청킹, 재순위 지정, 캐싱 및 보호 장치와 같은 아키텍처 결정도 보여줍니다.
목표가 “내 문서와 채팅하고 환각을 일으키지 않기”라면 이 목록이 도움이 될 것입니다.
최고의 LlamaIndex 튜토리얼을 선택한 방법
- 결과 지향적: 각 튜토리얼 후에 유용한 것을 제공해야 합니다.
- 2025년 최신: 현재 LlamaIndex API({
VectorStoreIndex}, {Settings}, {QueryPipeline}, {ReActAgent 등)를 반영합니다.
- 프로덕션 인식: hello world를 넘어 평가, 추적 및 반복을 보여줍니다.
- 폭 + 깊이: 퀵스타트부터 에이전트, 멀티모달 및 구조적 추출까지.
10가지 최고의 LlamaIndex 튜토리얼(엄선)
아래는 큐레이팅된 경로입니다. 자신의 수준에서 시작하여 필요한 곳으로 이동하십시오.
1) 15분 퀵스타트: PDF를 통한 채팅
- 구축 내용: PDF 업로드, 인덱싱, 질문, 인용문 받기
- 주요 개념: {
SimpleDirectoryReader}, {VectorStoreIndex}, {Settings}, 임베딩
예제 골격:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- 다음 학습 내용: 청크 크기, 상위 k개 및 재순위 지정이 중요한 이유.
2) 청킹, 메타데이터 및 재순위 지정을 사용한 RAG 기본 사항
- 구축 내용: 더 나은 컨텍스트 품질을 갖춘 더 스마트한 검색기
- 주요 개념: {
SentenceSplitter}, 메타데이터 필터, {rerank} 구성 요소
- 장점: 몇 가지 노브가 환각을 크게 줄이는 방법을 보여줍니다.
시도:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- 결과: 긴 문서를 위한 더 높은 품질의 컨텍스트 창.
3) LlamaIndex + OpenAI 함수 호출(도구 사용 및 구조화된 출력)
- 구축 내용: 도구를 호출하고 JSON 스키마를 반환하는 에이전트
- 주요 개념: {
QueryPipeline}, 도구 사양, Pydantic 스키마, 함수 호출
- 장점: Q&A와 실제 작업(검색, CRUD, API)을 연결합니다.
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- 결과: 구조화된 추출 및 작업을 위한 프로덕션 지원 패턴.
4) 프로덕션 벡터 스토어 구축(Postgres, Pinecone, Weaviate)
- 구축 내용: 필터 및 하이브리드 검색을 갖춘 영구적인 벡터 스토리지
- 주요 개념: {
VectorStoreIndex} 어댑터, 하이브리드 BM25+임베딩, 메타데이터
- 장점: 지속성, 마이그레이션 및 비용 제어를 가르칩니다.
팁:
- 간단하고 저렴한 배포에는 Postgres/pgvector를 사용하십시오.
- 관리되는 확장의 경우 Pinecone/Weaviate를 사용하십시오. {
ef_construction}, {ef_search}를 조정하십시오.
- 희귀 용어 및 약어를 처리하려면 하이브리드 검색을 추가하십시오.
5) 에이전트를 사용한 쿼리 계획 및 다단계 추론
- 최적 대상: 복잡한 질문 및 다중 데이터 세트 검색
- 구축 내용: 쿼리를 하위 쿼리로 분해하는 플래너
- 주요 개념: {
ReActAgent}, {SubQuestionQueryEngine}, 라우팅
- 장점: “검색 후 답변”에서 “생각 후 검색”으로 이동합니다.
패턴:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) 관찰 가능성 및 평가: 추적, 근거 및 벤치마크
- 구축 내용: 회귀 및 환각을 감지하는 피드백 루프
- 주요 개념: LlamaIndex 평가, 등급 QA, 인용 확인, 추적
- 장점: 확장하기 전에 중요한 것을 측정하는 방법을 가르칩니다.
체크리스트:
- 추적을 통해 모든 프롬프트/응답을 기록합니다.
- 회귀 테스트에는 등급 QA 데이터 세트를 사용하십시오.
7) 멀티모달 데이터(이미지, 테이블, 마크다운)를 위한 RAG
- 최적 대상: 차트, 스크린샷 및 테이블이 있는 문서
- 구축 내용: 이미지에서 텍스트를 추출하고 테이블을 통해 추론하는 파이프라인
- 주요 개념: OCR + 레이아웃 구문 분석, 테이블 청킹, 멀티모달 모델
- 장점: 실제 문서는 엉망입니다. 이 튜토리얼은 길들이는 방법을 보여줍니다.
8) 멀티 테넌트 및 검색 격리
- 구축 내용: 각 고객의 데이터가 격리된 RAG 서비스
- 주요 개념: 네임스페이스, 메타데이터 보호, 테넌트별 인덱스, RBAC
- 장점: 설계에 의한 보안 및 개인 정보 보호; 깨끗한 업그레이드 경로.
9) 대규모 구조적 추출(송장, 로그, 계약)
- 구축 내용: 스키마 유효성 검사를 통한 결정적 JSON 출력
- 주요 개념: Pydantic 스키마, 재시도, 도구 증강 유효성 검사
- 장점: 수동 검토를 줄이고 LLM 출력을 안정적으로 만듭니다.
10) 엔드 투 엔드 프로덕션 패턴: 노트북에서 CI/CD로
- 구축 내용: 데이터 수집, 인덱싱 작업, 평가 및 릴리스 게이트가 있는 전체 파이프라인
- 주요 개념: 백그라운드 작업자, 예약된 재인덱싱, 기능 플래그
- 장점: 자신감을 가지고 지속적으로 제공하는 방법을 보여줍니다.
목표에 맞는 올바른 LlamaIndex 튜토리얼 선택
이 빠른 라우터를 사용하여 다음 단계를 선택하십시오.
- “오늘 결과가 필요합니다.” 퀵스타트(튜토리얼 #1)부터 시작한 다음 재순위 지정(튜토리얼 #2)을 추가하십시오.
- “답변뿐만 아니라 작업도 원합니다.” 함수 호출 및 에이전트(튜토리얼 #3 및 #5)로 이동하십시오.
- “확장 및 규정 준수 요구 사항이 있습니다.” 스토리지 + 멀티 테넌트 패턴(튜토리얼 #4 및 #8).
- “답변을 어떻게 신뢰할 수 있습니까?” 평가 및 추적(튜토리얼 #6).
- “문서에 시각적 요소가 많습니다.” 멀티모달 RAG(튜토리얼 #7).
- “구조화된 데이터가 필요합니다.” 스키마 및 유효성 검사기(튜토리얼 #9)를 사용하십시오.
심층 분석: 최고의 LlamaIndex 튜토리얼에서 볼 수 있는 모범 사례
1) 청킹은 제품 결정입니다.
- 장단점: 청크가 클수록 컨텍스트가 많지만 토큰 비용이 더 높습니다. 청크가 작을수록 회수율이 높지만 의미가 조각화됩니다.
- 좋은 기본값: ~10–20% 겹치는 512–1024 토큰.
- 메타데이터가 중요합니다. 소스, 페이지, 섹션, 제목을 보존하십시오.
2) 검색 품질이 모델 크기를 능가합니다.
- 재순위 지정: 더 나은 MRR을 위해 교차 인코더 또는 임베딩 재순위 지정기를 추가하십시오.
- 하이브리드 검색: 희귀 용어에는 BM25를, 의미에는 임베딩을 결합하십시오.
- 필터: 문서 유형, 날짜 또는 테넌트로 좁혀서 정확도를 높입니다.
3) 조기에 평가하고 항상 평가하십시오.
- 등급 QA: 인용문이 있는 질문-답변 쌍의 작은 집합을 구축하십시오.
- 메트릭: 답변 정확도, 근거, 대기 시간 및 쿼리당 비용.
- 안전하게 A/B: 전환하기 전에 새로운 청킹 또는 검색기를 섀도 배포하십시오.
4) 작업을 최우선으로 만드십시오.
- 구조화된 출력: 추출 작업에는 스키마를 사용하십시오.
- 도구: API(검색, 캘린더, DB)를 에이전트가 호출할 함수로 래핑하십시오.
- 보호 장치: 출력을 검증하고, 재시도를 구현하고, 도구 오류를 기록하십시오.
5) 비용 및 대기 시간 위생
- 임베딩 캐시: 텍스트를 중복 제거하고 빌드 간에 벡터를 재사용하십시오.
- 일괄 처리 작업: 대량으로 인덱싱합니다. UX를 개선하기 위해 답변을 스트리밍합니다.
- 더 스마트한 컨텍스트: 프롬프트를 과도하게 채우지 마십시오. 대신 상위 k개 + 재순위 지정을 사용하십시오.
최고의 LlamaIndex 튜토리얼을 사용한 7일 학습 계획
- 1일차: 퀵스타트(튜토리얼 #1). 20페이지 PDF를 통해 채팅을 구축합니다. CLI를 제공합니다.
- 2일차: 검색 개선(튜토리얼 #2). 재순위 지정기 + 하이브리드 검색을 추가합니다.
- 3일차: 함수 호출 추가(튜토리얼 #3). API에서 FAQ에 대한 도구를 만듭니다.
- 4일차: 실제 벡터 스토어로 이동(튜토리얼 #4). 로컬에서 pgvector를 사용하십시오.
- 5일차: 플래너 소개(튜토리얼 #5). 두 인덱스에서 질문을 라우팅합니다.
- 6일차: 평가 추가(튜토리얼 #6). 30개 질문 테스트 세트 및 기준선을 만듭니다.
- 7일차: 프로덕션 통과(튜토리얼 #10). 백그라운드 작업, 관찰 가능성, CI.
예제 프로젝트: LlamaIndex를 사용한 "Docs Concierge"
- 목표: 프로세스 문서에 대한 질문에 답변하고 티켓을 여는 안전한 내부 어시스턴트.
- 스택: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
- Confluence 내보내기 및 PDF를 수집합니다(메타데이터 + ACL 유지).
- 768 토큰에서 청크; pgvector로 인덱싱합니다.
- 하이브리드 검색 및 재순위 지정기를 추가합니다.
- 도구 만들기: {
create_jira_ticket}, {lookup_oncall}, {fetch_policy}.
- 50개의 큐레이팅된 질문으로 평가를 추가합니다. 근거를 측정합니다.
- 스트리밍 UI 및 인용 미리 보기로 배포합니다.
- 결과: 빠르고 인용된 답변; 원클릭 작업 자동화; 측정 가능한 정확도.
이러한 튜토리얼이 피하는 데 도움이 되는 일반적인 실수
- 평가 건너뛰기: 테스트하지 않으면 회귀를 제공합니다.
- 메타데이터 무시: 소스 속성 및 라우팅 기능을 잃게 됩니다.
- 과도한 크기의 청크: 토큰 부풀림은 더 나은 답변 없이 비용을 증가시킵니다.
- 도구 과소 지정: 에이전트는 명확한 입력과 결정적 출력이 필요합니다.
- 격리 없음: 멀티 테넌트 RAG는 고객 간 유출을 방지해야 합니다.
LlamaIndex 튜토리얼을 보완하는 도구
- 벡터 스토어: pgvector, Pinecone, Weaviate, Qdrant
- 재순위 지정기: Cohere Rerank, FlagEmbedding, Voyage rerank
- 평가: Ragas 스타일 QA, LlamaIndex 평가, 사용자 지정 루브릭 등급
- UI: 스트리밍 토큰을 위한 Streamlit, Next.js, FastAPI 웹 소켓
그건 그렇고, 브라우저 내에서 직접 실습하며 배우는 것을 좋아한다면 {Sider.ai}를 통해 코드, 문서 및 웹 페이지를 나란히 보면서 채팅할 수 있다는 점에 주목할 가치가 있습니다. LlamaIndex 튜토리얼에서 스니펫을 붙여넣고, 프롬프트를 실행하고, 더 빠르게 반복할 수 있습니다. RAG 프롬프트를 테스트하고 따라 하면서 구조화된 출력을 추출하는 데 유용합니다. 검색 대상: 최신 LlamaIndex 튜토리얼 찾기
- “최고의 LlamaIndex 튜토리얼 2025”
- “LlamaIndex 퀵스타트 RAG pdf”
- “LlamaIndex SubQuestionQueryEngine 예제”
- “LlamaIndex pgvector Pinecone 가이드”
- “LlamaIndex 에이전트 함수 호출 예제”
{Settings.llm}, {Settings.embed_model}, {VectorStoreIndex} 및 {as_query_engine}를 사용하는 최신 코드를 찾으십시오. 이것이 현재 관용구입니다.
주요 내용
- 최고의 LlamaIndex 튜토리얼은 코드 스니펫뿐만 아니라 결과를 제공하는 데 도움이 됩니다.
- 문서를 통한 채팅으로 시작한 다음 검색 품질, 도구 및 평가를 계층화하십시오.
- 실제 벡터 스토어를 사용하고, 복잡한 질문에 대한 플래너를 추가하고, 끊임없이 테스트하십시오.
- 청킹, 재순위 지정, 필터와 같은 작은 아키텍처 선택은 모델을 교체하는 것보다 결과를 더 많이 변경합니다.
- 구조화된 계획을 따르고 실제 무언가를 구축하면 학습이 가속화됩니다.
다음 단계
- 상위 3개 튜토리얼에서 하나를 선택하고 오늘 최소한의 앱을 구축하십시오.
- 프로덕션 마이그레이션 계획: 스토리지, 인증, 관찰 가능성 및 CI.
- 범위가 커짐에 따라 고급 튜토리얼(에이전트, 멀티모달, 멀티 테넌트)을 다시 방문하십시오.
FAQ
Q1:초보자를 위한 최고의 LlamaIndex 튜토리얼은 무엇입니까?
VectorStoreIndex 및 SimpleDirectoryReader를 사용하여 PDF를 통해 채팅을 구축하는 퀵스타트부터 시작하십시오. 그런 다음 청킹, 메타데이터 및 재순위 지정을 다루는 튜토리얼을 추가하여 검색 품질을 향상시키십시오.
Q2:LlamaIndex를 사용하여 프로덕션 RAG 앱을 구축하려면 어떻게 해야 합니까?
벡터 스토어(pgvector, Pinecone), 하이브리드 검색 및 등급 QA를 사용한 평가를 다루는 튜토리얼을 따르십시오. 추적, 구조화된 출력 및 CI/CD를 추가하여 노트북에서 프로덕션으로 이동하십시오.
Q3:어떤 LlamaIndex 튜토리얼이 에이전트 및 도구 사용을 가르칩니까?
ReAct 스타일 에이전트, QueryPipeline 및 Pydantic 스키마를 사용한 함수 호출을 사용하는 가이드를 찾으십시오. 이러한 튜토리얼은 쿼리를 라우팅하고, API를 호출하고, 구조화된 JSON을 반환하는 방법을 보여줍니다.
Q4:LlamaIndex RAG 정확도를 어떻게 평가할 수 있습니까?
근거 확인, 인용 범위 및 등급 QA 데이터 세트를 소개하는 평가 튜토리얼을 사용하십시오. 정확도, 대기 시간 및 비용을 추적하여 배포하기 전에 회귀를 포착하십시오.
Q5:멀티모달 문서에 대한 LlamaIndex 튜토리얼이 있습니까?
예, 이미지 및 테이블에 대한 OCR 및 레이아웃 구문 분석을 결합한 다음 추출된 텍스트를 메타데이터와 함께 인덱싱하는 튜토리얼을 찾으십시오. 차트, 스크린샷 및 복잡한 PDF를 RAG에서 처리하는 방법을 보여줍니다.