10 تا از بهترین آموزشهای LlamaIndex برای تسلط بر RAG در سال 2025
اگر شنیدهاید که تولید افزوده شده با بازیابی (RAG) میتواند برنامههای LLM شما را هوشمندتر کند، حق با شماست. سریعترین راه برای ارائه یک دستیار هوش مصنوعی قابل اعتماد و شبیه به جستجو، یادگیری خوب LlamaIndex است—و بهترین آموزشهای LlamaIndex میتوانند منحنی یادگیری شما را از ماهها به روزها کاهش دهند.
در این راهنما، ما بهترین آموزشهای LlamaIndex را برای هر سطح انتخاب کردهایم—از شروع سریع کپی-پیست گرفته تا خطوط لوله درجه تولید. شما آموزشهای ویدئویی، نوتبوکهای عملی و دستورالعملهای پیشرفته برای دادههای چند مستاجره، استخراج ساختاریافته، عاملها و ارزیابی را خواهید یافت.
ما همچنین هر آموزش را به مهارت یا نتیجهای که به آن اهمیت میدهید مرتبط میکنیم: ساخت چت بر روی اسناد خود، مقیاسبندی جاسازیها، افزودن ابزارها، پخش پاسخها یا تأیید نتایج.
در پایان، خواهید دانست که با کدام آموزش LlamaIndex شروع کنید، کدام یک را در ادامه دنبال کنید و چگونه آنها را در یک محصول واقعی ترکیب کنید.
چرا آموزشهای LlamaIndex در حال حاضر مهم هستند
- RAG زمان حال برنامههای هوش مصنوعی است. LLMها توهم میزنند. RAG پاسخها را در دادههای شما مستقر میکند.
- LlamaIndex منسجمترین پشته RAG است. این پشته، نمایه سازی، بازیابی، برنامه ریزی پرس و جو، قابلیت مشاهده و ارزیابی را در ماژولهای قابل ترکیبی میپیچد که به خوبی با LangChain، OpenAI، Anthropic و LLMهای متن باز کار میکنند.
- آموزشها مسیر سریع شما هستند. بهترین آموزشهای LlamaIndex نه تنها کد، بلکه تصمیمات معماری را نیز نشان میدهند: تکه تکه کردن، رتبهبندی مجدد، ذخیرهسازی و محافظها.
اگر هدف شما این است: «با اسناد من چت کن و توهم نزن»، این لیست شما را به آنجا میرساند.
چگونه بهترین آموزشهای LlamaIndex را انتخاب کردیم
- نتیجهمحور: شما باید بعد از هر آموزش چیزی مفید ارائه دهید.
- به روز برای سال 2025: منعکس کننده APIهای فعلی LlamaIndex (به عنوان مثال،
VectorStoreIndex، Settings، QueryPipeline، ReActAgent).
- آگاه از تولید: ارزیابی، ردیابی و تکرار را نشان میدهد—فراتر از hello world.
- وسعت + عمق: از شروع سریع تا عاملها، چندوجهی و استخراج ساختاریافته.
10 تا از بهترین آموزشهای LlamaIndex (منتخب)
در زیر یک مسیر انتخاب شده وجود دارد. از سطح خود شروع کنید. در صورت نیاز پرش کنید.
1) شروع سریع 15 دقیقهای: چت بر روی فایلهای PDF خود
- بهترین برای: مبتدیان مطلق و مدیران محصول
- آنچه خواهید ساخت: فایلهای PDF را بارگذاری کنید، فهرست کنید، سوال بپرسید، استناد دریافت کنید
- مفاهیم کلیدی:
SimpleDirectoryReader، VectorStoreIndex، Settings، جاسازیها
- چرا عالی است: حداقل کد، حداکثر لحظه 'آها!'
نمونه اسکلت:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- آنچه در ادامه خواهید آموخت: اندازه قطعه، top‑k و چرا رتبهبندی مجدد مهم است.
2) اصول RAG با تکه تکه کردن، فراداده و رتبهبندی مجدد
- بهترین برای: مبتدی → متوسط
- آنچه خواهید ساخت: یک بازیاب هوشمندتر با کیفیت زمینه بهتر
- مفاهیم کلیدی:
SentenceSplitter، فیلترهای فراداده، اجزای rerank
- چرا عالی است: نشان میدهد که چگونه چند دستگیره به طور چشمگیری توهمات را کاهش میدهند
امتحان کنید:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- نتیجه: پنجرههای زمینه با کیفیت بالاتر برای اسناد طولانی.
3) LlamaIndex + فراخوانی تابع OpenAI (استفاده از ابزار و خروجی ساختاریافته)
- بهترین برای: سازندگانی که گردش کار را خودکار میکنند
- آنچه خواهید ساخت: یک عامل که ابزارها را فراخوانی میکند و طرحوارههای JSON را برمیگرداند
- مفاهیم کلیدی:
QueryPipeline، مشخصات ابزار، طرحوارههای Pydantic، فراخوانی تابع
- چرا عالی است: پرسش و پاسخ را با اقدامات واقعی (جستجو، CRUD، APIها) پیوند میدهد
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- نتیجه: الگوهای آماده تولید برای استخراج و اقدام ساختاریافته.
4) ساخت یک فروشگاه برداری تولید (Postgres، Pinecone، Weaviate)
- بهترین برای: تیمهایی که قصد مقیاسبندی دارند
- آنچه خواهید ساخت: ذخیرهسازی برداری بادوام با فیلترها و جستجوی ترکیبی
- مفاهیم کلیدی: آداپتورهای
VectorStoreIndex، جاسازیهای ترکیبی BM25+، فراداده
- چرا عالی است: پایداری، مهاجرت و کنترل هزینه را آموزش میدهد
نکات:
- از Postgres/pgvector برای استقرارهای ساده و مقرون به صرفه استفاده کنید.
- Pinecone/Weaviate برای مقیاس مدیریت شده؛
ef_construction، ef_search را تنظیم کنید.
- بازیابی ترکیبی را برای رسیدگی به اصطلاحات و اختصارات نادر اضافه کنید.
5) برنامه ریزی پرس و جو و استدلال چند مرحلهای با عاملها
- بهترین برای: سوالات پیچیده و جستجوی چند مجموعه داده
- آنچه خواهید ساخت: یک برنامهریز که یک پرس و جو را به زیر پرس و جوها تجزیه میکند
- مفاهیم کلیدی:
ReActAgent، SubQuestionQueryEngine، مسیریابی
- چرا عالی است: فراتر از «بازیابی سپس پاسخ» به «فکر کن سپس جستجو کن» میرود.
الگو:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) قابلیت مشاهده و ارزیابی: ردیابی، استقرار و معیارها
- بهترین برای: هر کسی که برنامههای واقعی را ارائه میدهد
- آنچه خواهید ساخت: حلقههای بازخورد برای تشخیص رگرسیونها و توهمات
- مفاهیم کلیدی: ارزیابیهای LlamaIndex، QA درجهبندی شده، بررسی استناد، ردیابی
- چرا عالی است: به شما میآموزد که قبل از مقیاسبندی، آنچه را که مهم است اندازهگیری کنید
چک لیست:
- همه اعلانها/پاسخها را با ردیابیها ثبت کنید.
- از مجموعه دادههای QA درجهبندی شده برای آزمایش رگرسیون استفاده کنید.
- پوشش استقرار و استناد را پیگیری کنید.
7) RAG برای دادههای چندوجهی (تصاویر، جداول، Markdown)
- بهترین برای: اسناد با نمودارها، تصاویر و جداول
- آنچه خواهید ساخت: خطوط لولهای که متن را از تصاویر استخراج میکنند و بر روی جداول استدلال میکنند
- مفاهیم کلیدی: OCR + تجزیه طرحبندی، تکه تکه کردن جدول، مدلهای چندوجهی
- چرا عالی است: اسناد دنیای واقعی نامرتب هستند. این آموزش به شما نشان میدهد که چگونه آنها را رام کنید.
8) چند مستاجره و جداسازی بازیابی
- بهترین برای: سازندگان SaaS
- آنچه خواهید ساخت: یک سرویس RAG که در آن دادههای هر مشتری جدا شده است
- مفاهیم کلیدی: فضاهای نام، محافظهای فراداده، شاخصهای هر مستاجر، RBAC
- چرا عالی است: امنیت و حریم خصوصی از طریق طراحی؛ مسیرهای ارتقاء تمیز.
9) استخراج ساختاریافته در مقیاس (فاکتورها، گزارشها، قراردادها)
- بهترین برای: عملیات، امور مالی، گردش کار قانونی
- آنچه خواهید ساخت: خروجیهای JSON قطعی با اعتبارسنجی طرحواره
- مفاهیم کلیدی: طرحوارههای Pydantic، تلاشهای مجدد، اعتبارسنجی افزوده شده با ابزار
- چرا عالی است: بررسی دستی را کاهش میدهد و خروجی LLM را قابل اعتماد میکند.
10) الگوی تولید سرتاسر: از نوتبوکها تا CI/CD
- بهترین برای: تیمهایی که به تولید میروند
- آنچه خواهید ساخت: یک خط لوله کامل با دریافت داده، مشاغل نمایه سازی، ارزیابی و دروازههای انتشار
- مفاهیم کلیدی: کارگران پسزمینه، نمایه سازی مجدد برنامهریزی شده، پرچمهای ویژگی
- چرا عالی است: نشان میدهد که چگونه به طور مداوم با اطمینان ارائه دهید.
انتخاب آموزش LlamaIndex مناسب برای هدف خود
از این مسیریاب سریع برای انتخاب گام بعدی خود استفاده کنید:
- «من امروز به نتایج نیاز دارم.» با شروع سریع (آموزش شماره 1) شروع کنید، سپس رتبهبندی مجدد را اضافه کنید (آموزش شماره 2).
- «من اقدامات میخواهم، نه فقط پاسخ.» به فراخوانی تابع و عاملها بروید (آموزش شماره 3 و 5).
- «ما نیازهای مقیاس و انطباق داریم.» الگوهای ذخیرهسازی + چند مستاجره (آموزش شماره 4 و 8).
- «چگونه به پاسخها اعتماد کنیم؟» ارزیابیها و ردیابی (آموزش شماره 6).
- «اسناد ما دارای بار بصری زیادی هستند.» RAG چندوجهی (آموزش شماره 7).
- «ما به دادههای ساختاریافته نیاز داریم.» از طرحوارهها و اعتبارسنجیها استفاده کنید (آموزش شماره 9).
غواصی عمیق: بهترین شیوههایی که در آموزشهای برتر LlamaIndex خواهید دید
1) تکه تکه کردن یک تصمیم محصول است
- مبادله: قطعات بزرگتر = زمینه بیشتر اما هزینه توکن بالاتر؛ قطعات کوچکتر = فراخوانی بالاتر اما معنای تکه تکه شده.
- پیش فرضهای خوب: 512–1024 توکن با ~10–20٪ همپوشانی.
- فراداده مهم است: منبع، صفحه، بخش، عناوین را حفظ کنید.
2) کیفیت بازیابی، اندازه مدل را شکست میدهد
- رتبهبندی مجدد: یک رمزگذار متقابل یا رتبهبندی مجدد جاسازی را برای MRR بهتر اضافه کنید.
- جستجوی ترکیبی: BM25 را برای اصطلاحات نادر با جاسازیها برای معناشناسی ترکیب کنید.
- فیلترها: برای بهبود دقت، بر اساس نوع سند، تاریخ یا مستاجر محدود کنید.
3) زود ارزیابی کنید، همیشه ارزیابی کنید
- QA درجهبندی شده: یک مجموعه کوچک از جفت سوال-پاسخ با استناد ایجاد کنید.
- معیارها: صحت پاسخ، استقرار، تأخیر و هزینه در هر پرس و جو.
- A/B ایمن: قبل از قطع کردن، تکه تکه کردن یا بازیابهای جدید را به صورت سایه مستقر کنید.
4) اقدامات را درجه یک کنید
- خروجی ساختاریافته: از طرحوارهها برای وظایف استخراج استفاده کنید.
- ابزارها: APIها (جستجو، تقویم، DB) را به عنوان توابعی برای فراخوانی عاملها بپیچید.
- محافظها: خروجیها را اعتبارسنجی کنید، تلاشهای مجدد را پیادهسازی کنید، خطاهای ابزار را ثبت کنید.
5) بهداشت هزینه و تأخیر
- جاسازیها را کش کنید: متن را حذف کنید و بردارها را در سراسر ساختها دوباره استفاده کنید.
- عملیات دستهای: به صورت انبوه نمایه کنید؛ پاسخها را برای بهبود UX پخش کنید.
- زمینه هوشمندتر: اعلان را بیش از حد پر نکنید—به جای آن top‑k + رتبهبندی مجدد.
یک برنامه یادگیری 7 روزه با استفاده از بهترین آموزشهای LlamaIndex
- روز 1: شروع سریع (آموزش شماره 1). چت را بر روی یک PDF 20 صفحهای بسازید. یک CLI ارائه دهید.
- روز 2: بازیابی را بهبود بخشید (آموزش شماره 2). رتبهبندی مجدد + جستجوی ترکیبی را اضافه کنید.
- روز 3: فراخوانی تابع را اضافه کنید (آموزش شماره 3). یک ابزار برای سوالات متداول در API خود ایجاد کنید.
- روز 4: به یک فروشگاه برداری واقعی بروید (آموزش شماره 4). از pgvector به صورت محلی استفاده کنید.
- روز 5: یک برنامهریز معرفی کنید (آموزش شماره 5). سوالات را در دو شاخص مسیریابی کنید.
- روز 6: ارزیابی را اضافه کنید (آموزش شماره 6). یک مجموعه آزمایشی 30 سوالی و خط پایه ایجاد کنید.
- روز 7: گذر تولید (آموزش شماره 10). مشاغل پسزمینه، قابلیت مشاهده، CI.
پروژه نمونه: «دروازهبان اسناد» با LlamaIndex
- هدف: یک دستیار داخلی امن که به سوالات مربوط به اسناد فرآیند پاسخ میدهد و بلیطها را باز میکند.
- پشته: LlamaIndex، Postgres/pgvector، OpenAI/Anthropic، FastAPI، S3.
- صادرات Confluence و فایلهای PDF را دریافت کنید (فراداده + ACLها را نگه دارید).
- در 768 توکن تکه تکه کنید؛ به pgvector نمایه کنید.
- بازیابی ترکیبی و رتبهبندی مجدد را اضافه کنید.
- ابزارها را ایجاد کنید:
create_jira_ticket، lookup_oncall، fetch_policy.
- ارزیابی را با 50 سوال انتخاب شده اضافه کنید؛ استقرار را اندازهگیری کنید.
- با UI پخش و پیش نمایش استنادها مستقر کنید.
- نتیجه: پاسخهای سریع و استناد شده؛ اتوماسیون وظایف با یک کلیک؛ دقت قابل اندازهگیری.
اشتباهات رایجی که این آموزشها به شما کمک میکنند از آنها اجتناب کنید
- نادیده گرفتن ارزیابی: اگر آزمایش نکنید، رگرسیونها را ارائه خواهید داد.
- نادیده گرفتن فراداده: شما انتساب منبع و قدرت مسیریابی را از دست خواهید داد.
- تکههای بزرگ: تورم توکن هزینه را بدون پاسخهای بهتر افزایش میدهد.
- مشخص نکردن ابزارها: عاملها به ورودیهای واضح و خروجیهای قطعی نیاز دارند.
- عدم جداسازی: RAG چند مستاجره باید از نشت بین مشتریان جلوگیری کند.
ابزارهایی که آموزشهای LlamaIndex را تکمیل میکنند
- فروشگاههای برداری: pgvector، Pinecone، Weaviate، Qdrant
- رتبهبندی کنندهها: Cohere Rerank، FlagEmbedding، Voyage rerank
- تکه کنندهها: تکه کنندههای معنایی، تکه کنندههای آگاه از جدول
- ارزیابیها: QA به سبک Ragas، ارزیابیهای LlamaIndex، درجهبندی کنندههای عنوان سفارشی
- UI: Streamlit، Next.js، وب سوکتهای FastAPI برای پخش توکنها
به هر حال، اگر دوست دارید با انجام دادن در داخل مرورگر خود یاد بگیرید، شایان ذکر است که Sider.ai به شما امکان میدهد با کد، اسناد و صفحات وب در کنار هم چت کنید. میتوانید قطعههایی از آموزشهای LlamaIndex را جایگذاری کنید، اعلانها را اجرا کنید و سریعتر تکرار کنید—برای آزمایش اعلانهای RAG و استخراج خروجیهای ساختاریافته در حین دنبال کردن، مفید است. چه چیزی را جستجو کنید: یافتن آموزشهای به روز LlamaIndex
- «بهترین آموزشهای LlamaIndex 2025»
- «شروع سریع LlamaIndex RAG pdf»
- «مثال LlamaIndex SubQuestionQueryEngine»
- «آموزش استقرار ارزیابی LlamaIndex»
- «راهنمای LlamaIndex pgvector Pinecone»
- «مثال فراخوانی تابع عاملهای LlamaIndex»
به دنبال کد جدید با استفاده از Settings.llm، Settings.embed_model، VectorStoreIndex و as_query_engine باشید—اینها اصطلاحات فعلی هستند.
نکات کلیدی
- بهترین آموزشهای LlamaIndex به شما کمک میکنند نتایج را ارائه دهید، نه فقط قطعههای کد.
- با چت بر روی اسناد شروع کنید، سپس کیفیت بازیابی، ابزارها و ارزیابی را لایهبندی کنید.
- از یک فروشگاه برداری واقعی استفاده کنید، برنامهریزها را برای سوالات پیچیده اضافه کنید و به طور مداوم آزمایش کنید.
- انتخابهای معماری کوچک—تکه تکه کردن، رتبهبندی مجدد، فیلترها—نتایج را بیشتر از تعویض مدلها تغییر میدهند.
- وقتی یک برنامه ساختاریافته را دنبال میکنید و چیزی واقعی میسازید، یادگیری تسریع میشود.
بعدش چی
- یک آموزش از سه آموزش برتر را انتخاب کنید و امروز یک برنامه حداقلی بسازید.
- قبل از مقیاسبندی کاربران، ارزیابی را اضافه کنید.
- مهاجرت تولید خود را برنامهریزی کنید: ذخیرهسازی، احراز هویت، قابلیت مشاهده و CI.
- همانطور که دامنه شما رشد میکند، آموزشهای پیشرفته (عاملها، چندوجهی، چند مستاجره) را دوباره مرور کنید.
سوالات متداول
Q1:بهترین آموزشهای LlamaIndex برای مبتدیان کدامند؟
با یک شروع سریع که چت را بر روی فایلهای PDF خود با استفاده از VectorStoreIndex و SimpleDirectoryReader میسازد، شروع کنید. سپس یک آموزش در مورد تکه تکه کردن، فراداده و رتبهبندی مجدد اضافه کنید تا کیفیت بازیابی را افزایش دهید.
Q2:چگونه یک برنامه RAG تولید با LlamaIndex بسازم؟
آموزشهایی را دنبال کنید که فروشگاههای برداری (pgvector، Pinecone)، بازیابی ترکیبی و ارزیابی با QA درجهبندی شده را پوشش میدهند. ردیابی، خروجیهای ساختاریافته و CI/CD را اضافه کنید تا از نوتبوکها به تولید بروید.
Q3:کدام آموزش LlamaIndex عاملها و استفاده از ابزار را آموزش میدهد؟
به دنبال راهنماهایی با استفاده از عاملهای سبک ReAct، QueryPipeline و فراخوانی تابع با طرحوارههای Pydantic باشید. این آموزشها نشان میدهند که چگونه پرس و جوها را مسیریابی کنید، APIها را فراخوانی کنید و JSON ساختاریافته را برگردانید.
Q4:چگونه میتوانم دقت LlamaIndex RAG را ارزیابی کنم؟
از آموزشهای ارزیابی که بررسیهای استقرار، پوشش استناد و مجموعه دادههای QA درجهبندی شده را معرفی میکنند، استفاده کنید. صحت، تأخیر و هزینه را برای گرفتن رگرسیونها قبل از استقرار پیگیری کنید.
Q5:آیا آموزشهای LlamaIndex برای اسناد چندوجهی وجود دارد؟
بله، به دنبال آموزشهایی باشید که OCR و تجزیه طرحبندی را برای تصاویر و جداول ترکیب میکنند، سپس متن استخراج شده را با فراداده نمایه کنید. آنها نشان میدهند که چگونه نمودارها، تصاویر و فایلهای PDF پیچیده را در RAG مدیریت کنید.