What are the best LlamaIndex tutorials for beginners?

Start with a quickstart that builds chat over your PDFs using VectorStoreIndex and SimpleDirectoryReader. Then add a tutorial on chunking, metadata, and reranking to boost retrieval quality.

How do I build a production RAG app with LlamaIndex?

Follow tutorials that cover vector stores (pgvector, Pinecone), hybrid retrieval, and evaluation with graded QA. Add tracing, structured outputs, and CI/CD to move from notebooks to production.

Which LlamaIndex tutorial teaches agents and tool use?

Look for guides using ReAct-style agents, QueryPipeline, and function calling with Pydantic schemas. These tutorials show how to route queries, call APIs, and return structured JSON.

How can I evaluate LlamaIndex RAG accuracy?

Use evaluation tutorials that introduce groundedness checks, citation coverage, and graded QA datasets. Track correctness, latency, and cost to catch regressions before deploying.

Are there LlamaIndex tutorials for multimodal documents?

Yes, seek tutorials that combine OCR and layout parsing for images and tables, then index the extracted text with metadata. They show how to handle charts, screenshots, and complex PDFs in RAG.

10 تا از بهترین آموزش‌های LlamaIndex برای تسلط بر RAG در سال 2025

اگر شنیده‌اید که تولید افزوده شده با بازیابی (RAG) می‌تواند برنامه‌های LLM شما را هوشمندتر کند، حق با شماست. سریع‌ترین راه برای ارائه یک دستیار هوش مصنوعی قابل اعتماد و شبیه به جستجو، یادگیری خوب LlamaIndex است—و بهترین آموزش‌های LlamaIndex می‌توانند منحنی یادگیری شما را از ماه‌ها به روزها کاهش دهند.

در این راهنما، ما بهترین آموزش‌های LlamaIndex را برای هر سطح انتخاب کرده‌ایم—از شروع سریع کپی-پیست گرفته تا خطوط لوله درجه تولید. شما آموزش‌های ویدئویی، نوت‌بوک‌های عملی و دستورالعمل‌های پیشرفته برای داده‌های چند مستاجره، استخراج ساختاریافته، عامل‌ها و ارزیابی را خواهید یافت.

ما همچنین هر آموزش را به مهارت یا نتیجه‌ای که به آن اهمیت می‌دهید مرتبط می‌کنیم: ساخت چت بر روی اسناد خود، مقیاس‌بندی جاسازی‌ها، افزودن ابزارها، پخش پاسخ‌ها یا تأیید نتایج.

در پایان، خواهید دانست که با کدام آموزش LlamaIndex شروع کنید، کدام یک را در ادامه دنبال کنید و چگونه آنها را در یک محصول واقعی ترکیب کنید.

چرا آموزش‌های LlamaIndex در حال حاضر مهم هستند

RAG زمان حال برنامه‌های هوش مصنوعی است. LLMها توهم می‌زنند. RAG پاسخ‌ها را در داده‌های شما مستقر می‌کند.

LlamaIndex منسجم‌ترین پشته RAG است. این پشته، نمایه سازی، بازیابی، برنامه ریزی پرس و جو، قابلیت مشاهده و ارزیابی را در ماژول‌های قابل ترکیبی می‌پیچد که به خوبی با LangChain، OpenAI، Anthropic و LLMهای متن باز کار می‌کنند.

آموزش‌ها مسیر سریع شما هستند. بهترین آموزش‌های LlamaIndex نه تنها کد، بلکه تصمیمات معماری را نیز نشان می‌دهند: تکه تکه کردن، رتبه‌بندی مجدد، ذخیره‌سازی و محافظ‌ها.

اگر هدف شما این است: «با اسناد من چت کن و توهم نزن»، این لیست شما را به آنجا می‌رساند.

چگونه بهترین آموزش‌های LlamaIndex را انتخاب کردیم

نتیجه‌محور: شما باید بعد از هر آموزش چیزی مفید ارائه دهید.

به روز برای سال 2025: منعکس کننده APIهای فعلی LlamaIndex (به عنوان مثال، VectorStoreIndex، Settings، QueryPipeline، ReActAgent).

آگاه از تولید: ارزیابی، ردیابی و تکرار را نشان می‌دهد—فراتر از hello world.

وسعت + عمق: از شروع سریع تا عامل‌ها، چندوجهی و استخراج ساختاریافته.

10 تا از بهترین آموزش‌های LlamaIndex (منتخب)

در زیر یک مسیر انتخاب شده وجود دارد. از سطح خود شروع کنید. در صورت نیاز پرش کنید.

1) شروع سریع 15 دقیقه‌ای: چت بر روی فایل‌های PDF خود

بهترین برای: مبتدیان مطلق و مدیران محصول

آنچه خواهید ساخت: فایل‌های PDF را بارگذاری کنید، فهرست کنید، سوال بپرسید، استناد دریافت کنید

مفاهیم کلیدی: SimpleDirectoryReader، VectorStoreIndex، Settings، جاسازی‌ها

چرا عالی است: حداقل کد، حداکثر لحظه 'آها!'

نمونه اسکلت:

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)

آنچه در ادامه خواهید آموخت: اندازه قطعه، top‑k و چرا رتبه‌بندی مجدد مهم است.

2) اصول RAG با تکه تکه کردن، فراداده و رتبه‌بندی مجدد

بهترین برای: مبتدی → متوسط

آنچه خواهید ساخت: یک بازیاب هوشمندتر با کیفیت زمینه بهتر

مفاهیم کلیدی: SentenceSplitter، فیلترهای فراداده، اجزای rerank

چرا عالی است: نشان می‌دهد که چگونه چند دستگیره به طور چشمگیری توهمات را کاهش می‌دهند

امتحان کنید:

from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)

نتیجه: پنجره‌های زمینه با کیفیت بالاتر برای اسناد طولانی.

3) LlamaIndex + فراخوانی تابع OpenAI (استفاده از ابزار و خروجی ساختاریافته)

بهترین برای: سازندگانی که گردش کار را خودکار می‌کنند

آنچه خواهید ساخت: یک عامل که ابزارها را فراخوانی می‌کند و طرحواره‌های JSON را برمی‌گرداند

مفاهیم کلیدی: QueryPipeline، مشخصات ابزار، طرحواره‌های Pydantic، فراخوانی تابع

چرا عالی است: پرسش و پاسخ را با اقدامات واقعی (جستجو، CRUD، APIها) پیوند می‌دهد

from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))

نتیجه: الگوهای آماده تولید برای استخراج و اقدام ساختاریافته.

4) ساخت یک فروشگاه برداری تولید (Postgres، Pinecone، Weaviate)

بهترین برای: تیم‌هایی که قصد مقیاس‌بندی دارند

آنچه خواهید ساخت: ذخیره‌سازی برداری بادوام با فیلترها و جستجوی ترکیبی

مفاهیم کلیدی: آداپتورهای VectorStoreIndex، جاسازی‌های ترکیبی BM25+، فراداده

چرا عالی است: پایداری، مهاجرت و کنترل هزینه را آموزش می‌دهد

نکات:

از Postgres/pgvector برای استقرارهای ساده و مقرون به صرفه استفاده کنید.

Pinecone/Weaviate برای مقیاس مدیریت شده؛ ef_construction، ef_search را تنظیم کنید.

بازیابی ترکیبی را برای رسیدگی به اصطلاحات و اختصارات نادر اضافه کنید.

5) برنامه ریزی پرس و جو و استدلال چند مرحله‌ای با عامل‌ها

بهترین برای: سوالات پیچیده و جستجوی چند مجموعه داده

آنچه خواهید ساخت: یک برنامه‌ریز که یک پرس و جو را به زیر پرس و جوها تجزیه می‌کند

مفاهیم کلیدی: ReActAgent، SubQuestionQueryEngine، مسیریابی

چرا عالی است: فراتر از «بازیابی سپس پاسخ» به «فکر کن سپس جستجو کن» می‌رود.

الگو:

from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))

6) قابلیت مشاهده و ارزیابی: ردیابی، استقرار و معیارها

بهترین برای: هر کسی که برنامه‌های واقعی را ارائه می‌دهد

آنچه خواهید ساخت: حلقه‌های بازخورد برای تشخیص رگرسیون‌ها و توهمات

مفاهیم کلیدی: ارزیابی‌های LlamaIndex، QA درجه‌بندی شده، بررسی استناد، ردیابی

چرا عالی است: به شما می‌آموزد که قبل از مقیاس‌بندی، آنچه را که مهم است اندازه‌گیری کنید

چک لیست:

همه اعلان‌ها/پاسخ‌ها را با ردیابی‌ها ثبت کنید.

از مجموعه داده‌های QA درجه‌بندی شده برای آزمایش رگرسیون استفاده کنید.

پوشش استقرار و استناد را پیگیری کنید.

7) RAG برای داده‌های چندوجهی (تصاویر، جداول، Markdown)

بهترین برای: اسناد با نمودارها، تصاویر و جداول

آنچه خواهید ساخت: خطوط لوله‌ای که متن را از تصاویر استخراج می‌کنند و بر روی جداول استدلال می‌کنند

مفاهیم کلیدی: OCR + تجزیه طرح‌بندی، تکه تکه کردن جدول، مدل‌های چندوجهی

چرا عالی است: اسناد دنیای واقعی نامرتب هستند. این آموزش به شما نشان می‌دهد که چگونه آنها را رام کنید.

8) چند مستاجره و جداسازی بازیابی

بهترین برای: سازندگان SaaS

آنچه خواهید ساخت: یک سرویس RAG که در آن داده‌های هر مشتری جدا شده است

مفاهیم کلیدی: فضاهای نام، محافظ‌های فراداده، شاخص‌های هر مستاجر، RBAC

چرا عالی است: امنیت و حریم خصوصی از طریق طراحی؛ مسیرهای ارتقاء تمیز.

9) استخراج ساختاریافته در مقیاس (فاکتورها، گزارش‌ها، قراردادها)

بهترین برای: عملیات، امور مالی، گردش کار قانونی

آنچه خواهید ساخت: خروجی‌های JSON قطعی با اعتبارسنجی طرحواره

مفاهیم کلیدی: طرحواره‌های Pydantic، تلاش‌های مجدد، اعتبارسنجی افزوده شده با ابزار

چرا عالی است: بررسی دستی را کاهش می‌دهد و خروجی LLM را قابل اعتماد می‌کند.

10) الگوی تولید سرتاسر: از نوت‌بوک‌ها تا CI/CD

بهترین برای: تیم‌هایی که به تولید می‌روند

آنچه خواهید ساخت: یک خط لوله کامل با دریافت داده، مشاغل نمایه سازی، ارزیابی و دروازه‌های انتشار

مفاهیم کلیدی: کارگران پس‌زمینه، نمایه سازی مجدد برنامه‌ریزی شده، پرچم‌های ویژگی

چرا عالی است: نشان می‌دهد که چگونه به طور مداوم با اطمینان ارائه دهید.

انتخاب آموزش LlamaIndex مناسب برای هدف خود

از این مسیریاب سریع برای انتخاب گام بعدی خود استفاده کنید:

«من امروز به نتایج نیاز دارم.» با شروع سریع (آموزش شماره 1) شروع کنید، سپس رتبه‌بندی مجدد را اضافه کنید (آموزش شماره 2).

«من اقدامات می‌خواهم، نه فقط پاسخ.» به فراخوانی تابع و عامل‌ها بروید (آموزش شماره 3 و 5).

«ما نیازهای مقیاس و انطباق داریم.» الگوهای ذخیره‌سازی + چند مستاجره (آموزش شماره 4 و 8).

«چگونه به پاسخ‌ها اعتماد کنیم؟» ارزیابی‌ها و ردیابی (آموزش شماره 6).

«اسناد ما دارای بار بصری زیادی هستند.» RAG چندوجهی (آموزش شماره 7).

«ما به داده‌های ساختاریافته نیاز داریم.» از طرحواره‌ها و اعتبارسنجی‌ها استفاده کنید (آموزش شماره 9).

غواصی عمیق: بهترین شیوه‌هایی که در آموزش‌های برتر LlamaIndex خواهید دید

1) تکه تکه کردن یک تصمیم محصول است

مبادله: قطعات بزرگتر = زمینه بیشتر اما هزینه توکن بالاتر؛ قطعات کوچکتر = فراخوانی بالاتر اما معنای تکه تکه شده.

پیش فرض‌های خوب: 512–1024 توکن با ~10–20٪ همپوشانی.

فراداده مهم است: منبع، صفحه، بخش، عناوین را حفظ کنید.

2) کیفیت بازیابی، اندازه مدل را شکست می‌دهد

رتبه‌بندی مجدد: یک رمزگذار متقابل یا رتبه‌بندی مجدد جاسازی را برای MRR بهتر اضافه کنید.

جستجوی ترکیبی: BM25 را برای اصطلاحات نادر با جاسازی‌ها برای معناشناسی ترکیب کنید.

فیلترها: برای بهبود دقت، بر اساس نوع سند، تاریخ یا مستاجر محدود کنید.

3) زود ارزیابی کنید، همیشه ارزیابی کنید

QA درجه‌بندی شده: یک مجموعه کوچک از جفت سوال-پاسخ با استناد ایجاد کنید.

معیارها: صحت پاسخ، استقرار، تأخیر و هزینه در هر پرس و جو.

A/B ایمن: قبل از قطع کردن، تکه تکه کردن یا بازیاب‌های جدید را به صورت سایه مستقر کنید.

4) اقدامات را درجه یک کنید

خروجی ساختاریافته: از طرحواره‌ها برای وظایف استخراج استفاده کنید.

ابزارها: APIها (جستجو، تقویم، DB) را به عنوان توابعی برای فراخوانی عامل‌ها بپیچید.

محافظ‌ها: خروجی‌ها را اعتبارسنجی کنید، تلاش‌های مجدد را پیاده‌سازی کنید، خطاهای ابزار را ثبت کنید.

5) بهداشت هزینه و تأخیر

جاسازی‌ها را کش کنید: متن را حذف کنید و بردارها را در سراسر ساخت‌ها دوباره استفاده کنید.

عملیات دسته‌ای: به صورت انبوه نمایه کنید؛ پاسخ‌ها را برای بهبود UX پخش کنید.

زمینه هوشمندتر: اعلان را بیش از حد پر نکنید—به جای آن top‑k + رتبه‌بندی مجدد.

یک برنامه یادگیری 7 روزه با استفاده از بهترین آموزش‌های LlamaIndex

روز 1: شروع سریع (آموزش شماره 1). چت را بر روی یک PDF 20 صفحه‌ای بسازید. یک CLI ارائه دهید.

روز 2: بازیابی را بهبود بخشید (آموزش شماره 2). رتبه‌بندی مجدد + جستجوی ترکیبی را اضافه کنید.

روز 3: فراخوانی تابع را اضافه کنید (آموزش شماره 3). یک ابزار برای سوالات متداول در API خود ایجاد کنید.

روز 4: به یک فروشگاه برداری واقعی بروید (آموزش شماره 4). از pgvector به صورت محلی استفاده کنید.

روز 5: یک برنامه‌ریز معرفی کنید (آموزش شماره 5). سوالات را در دو شاخص مسیریابی کنید.

روز 6: ارزیابی را اضافه کنید (آموزش شماره 6). یک مجموعه آزمایشی 30 سوالی و خط پایه ایجاد کنید.

روز 7: گذر تولید (آموزش شماره 10). مشاغل پس‌زمینه، قابلیت مشاهده، CI.

پروژه نمونه: «دروازه‌بان اسناد» با LlamaIndex

هدف: یک دستیار داخلی امن که به سوالات مربوط به اسناد فرآیند پاسخ می‌دهد و بلیط‌ها را باز می‌کند.

پشته: LlamaIndex، Postgres/pgvector، OpenAI/Anthropic، FastAPI، S3.

مراحل:

صادرات Confluence و فایل‌های PDF را دریافت کنید (فراداده + ACLها را نگه دارید).

در 768 توکن تکه تکه کنید؛ به pgvector نمایه کنید.

بازیابی ترکیبی و رتبه‌بندی مجدد را اضافه کنید.

ابزارها را ایجاد کنید: create_jira_ticket، lookup_oncall، fetch_policy.

ارزیابی را با 50 سوال انتخاب شده اضافه کنید؛ استقرار را اندازه‌گیری کنید.

با UI پخش و پیش نمایش استنادها مستقر کنید.

نتیجه: پاسخ‌های سریع و استناد شده؛ اتوماسیون وظایف با یک کلیک؛ دقت قابل اندازه‌گیری.

اشتباهات رایجی که این آموزش‌ها به شما کمک می‌کنند از آنها اجتناب کنید

نادیده گرفتن ارزیابی: اگر آزمایش نکنید، رگرسیون‌ها را ارائه خواهید داد.

نادیده گرفتن فراداده: شما انتساب منبع و قدرت مسیریابی را از دست خواهید داد.

تکه‌های بزرگ: تورم توکن هزینه را بدون پاسخ‌های بهتر افزایش می‌دهد.

مشخص نکردن ابزارها: عامل‌ها به ورودی‌های واضح و خروجی‌های قطعی نیاز دارند.

عدم جداسازی: RAG چند مستاجره باید از نشت بین مشتریان جلوگیری کند.

ابزارهایی که آموزش‌های LlamaIndex را تکمیل می‌کنند

فروشگاه‌های برداری: pgvector، Pinecone، Weaviate، Qdrant

رتبه‌بندی کننده‌ها: Cohere Rerank، FlagEmbedding، Voyage rerank

تکه کننده‌ها: تکه کننده‌های معنایی، تکه کننده‌های آگاه از جدول

ارزیابی‌ها: QA به سبک Ragas، ارزیابی‌های LlamaIndex، درجه‌بندی کننده‌های عنوان سفارشی

UI: Streamlit، Next.js، وب سوکت‌های FastAPI برای پخش توکن‌ها

به هر حال، اگر دوست دارید با انجام دادن در داخل مرورگر خود یاد بگیرید، شایان ذکر است که Sider.ai به شما امکان می‌دهد با کد، اسناد و صفحات وب در کنار هم چت کنید. می‌توانید قطعه‌هایی از آموزش‌های LlamaIndex را جای‌گذاری کنید، اعلان‌ها را اجرا کنید و سریع‌تر تکرار کنید—برای آزمایش اعلان‌های RAG و استخراج خروجی‌های ساختاریافته در حین دنبال کردن، مفید است.

چه چیزی را جستجو کنید: یافتن آموزش‌های به روز LlamaIndex

«بهترین آموزش‌های LlamaIndex 2025»

«شروع سریع LlamaIndex RAG pdf»

«مثال LlamaIndex SubQuestionQueryEngine»

«آموزش استقرار ارزیابی LlamaIndex»

«راهنمای LlamaIndex pgvector Pinecone»

«مثال فراخوانی تابع عامل‌های LlamaIndex»

به دنبال کد جدید با استفاده از Settings.llm، Settings.embed_model، VectorStoreIndex و as_query_engine باشید—اینها اصطلاحات فعلی هستند.

نکات کلیدی

بهترین آموزش‌های LlamaIndex به شما کمک می‌کنند نتایج را ارائه دهید، نه فقط قطعه‌های کد.

با چت بر روی اسناد شروع کنید، سپس کیفیت بازیابی، ابزارها و ارزیابی را لایه‌بندی کنید.

از یک فروشگاه برداری واقعی استفاده کنید، برنامه‌ریزها را برای سوالات پیچیده اضافه کنید و به طور مداوم آزمایش کنید.

انتخاب‌های معماری کوچک—تکه تکه کردن، رتبه‌بندی مجدد، فیلترها—نتایج را بیشتر از تعویض مدل‌ها تغییر می‌دهند.

وقتی یک برنامه ساختاریافته را دنبال می‌کنید و چیزی واقعی می‌سازید، یادگیری تسریع می‌شود.

بعدش چی

یک آموزش از سه آموزش برتر را انتخاب کنید و امروز یک برنامه حداقلی بسازید.

قبل از مقیاس‌بندی کاربران، ارزیابی را اضافه کنید.

مهاجرت تولید خود را برنامه‌ریزی کنید: ذخیره‌سازی، احراز هویت، قابلیت مشاهده و CI.

همانطور که دامنه شما رشد می‌کند، آموزش‌های پیشرفته (عامل‌ها، چندوجهی، چند مستاجره) را دوباره مرور کنید.

سوالات متداول

Q1:بهترین آموزش‌های LlamaIndex برای مبتدیان کدامند؟ با یک شروع سریع که چت را بر روی فایل‌های PDF خود با استفاده از VectorStoreIndex و SimpleDirectoryReader می‌سازد، شروع کنید. سپس یک آموزش در مورد تکه تکه کردن، فراداده و رتبه‌بندی مجدد اضافه کنید تا کیفیت بازیابی را افزایش دهید.

Q2:چگونه یک برنامه RAG تولید با LlamaIndex بسازم؟ آموزش‌هایی را دنبال کنید که فروشگاه‌های برداری (pgvector، Pinecone)، بازیابی ترکیبی و ارزیابی با QA درجه‌بندی شده را پوشش می‌دهند. ردیابی، خروجی‌های ساختاریافته و CI/CD را اضافه کنید تا از نوت‌بوک‌ها به تولید بروید.

Q3:کدام آموزش LlamaIndex عامل‌ها و استفاده از ابزار را آموزش می‌دهد؟ به دنبال راهنماهایی با استفاده از عامل‌های سبک ReAct، QueryPipeline و فراخوانی تابع با طرحواره‌های Pydantic باشید. این آموزش‌ها نشان می‌دهند که چگونه پرس و جوها را مسیریابی کنید، APIها را فراخوانی کنید و JSON ساختاریافته را برگردانید.

Q4:چگونه می‌توانم دقت LlamaIndex RAG را ارزیابی کنم؟ از آموزش‌های ارزیابی که بررسی‌های استقرار، پوشش استناد و مجموعه داده‌های QA درجه‌بندی شده را معرفی می‌کنند، استفاده کنید. صحت، تأخیر و هزینه را برای گرفتن رگرسیون‌ها قبل از استقرار پیگیری کنید.

Q5:آیا آموزش‌های LlamaIndex برای اسناد چندوجهی وجود دارد؟ بله، به دنبال آموزش‌هایی باشید که OCR و تجزیه طرح‌بندی را برای تصاویر و جداول ترکیب می‌کنند، سپس متن استخراج شده را با فراداده نمایه کنید. آنها نشان می‌دهند که چگونه نمودارها، تصاویر و فایل‌های PDF پیچیده را در RAG مدیریت کنید.