2025 میں RAG پر مہارت حاصل کرنے کے لیے 10 بہترین LlamaIndex ٹیوٹوریلز
اگر آپ نے سنا ہے کہ Retrieval-Augmented Generation (RAG) آپ کی LLM ایپس کو مزید سمارٹ بنا سکتی ہے، تو آپ درست ہیں۔ آج کل ایک قابل اعتماد، سرچ جیسی AI اسسٹنٹ بنانے کا تیز ترین طریقہ یہ ہے کہ LlamaIndex کو اچھی طرح سیکھیں—اور بہترین LlamaIndex ٹیوٹوریلز آپ کے سیکھنے کے دورانیے کو مہینوں سے دنوں میں بدل سکتے ہیں۔
اس گائیڈ میں، ہم ہر سطح کے لیے بہترین LlamaIndex ٹیوٹوریلز چن کر لائے ہیں—کاپی پیسٹ کوئیک اسٹارٹس سے لے کر پروڈکشن گریڈ پائپ لائنز تک۔ آپ کو ملٹی ٹیننٹ ڈیٹا، اسٹرکچرڈ ایکسٹریکشن، ایجنٹس اور ایویلیوایشن کے لیے ویڈیو واک تھرو، ہینڈز آن نوٹ بکس اور جدید ترکیبیں ملیں گی۔
ہم ہر ٹیوٹوریل کو آپ کی مطلوبہ مہارت یا نتائج سے بھی جوڑیں گے: اپنی دستاویزات پر چیٹ بنانا، ایمبیڈنگز کو اسکیل کرنا، ٹولز شامل کرنا، جوابات کو اسٹریم کرنا یا نتائج کی تصدیق کرنا۔
آخر تک، آپ کو معلوم ہو جائے گا کہ کون سا LlamaIndex ٹیوٹوریل شروع کرنا ہے، کون سے اگلے ٹیوٹوریلز پر عمل کرنا ہے، اور ان کو ایک حقیقی پروڈکٹ میں کیسے جوڑنا ہے۔
LlamaIndex ٹیوٹوریلز اس وقت کیوں اہم ہیں
- RAG، AI ایپس کا زمانۂ حال ہے۔ LLMs من گھڑت باتیں کرتی ہیں؛ RAG آپ کے ڈیٹا میں جوابات کو بنیاد فراہم کرتا ہے۔
- LlamaIndex سب سے مربوط RAG اسٹیک ہے۔ یہ انڈیکسنگ، ریٹریول، کوئری پلاننگ، آبزرویبلٹی اور ایویلیوایشن کو کمپوزایبل ماڈیولز میں لپیٹتا ہے جو LangChain، OpenAI، Anthropic اور اوپن سورس LLMs کے ساتھ بخوبی کام کرتے ہیں۔
- ٹیوٹوریلز آپ کا تیز ترین راستہ ہیں۔ بہترین LlamaIndex ٹیوٹوریلز نہ صرف کوڈ دکھاتے ہیں، بلکہ آرکیٹیکچر کے فیصلے بھی بتاتے ہیں: چنکنگ، ری رینکنگ، کیشنگ اور گارڈ ریلز۔
اگر آپ کا مقصد یہ ہے: "میری دستاویزات کے ساتھ چیٹ کریں اور من گھڑت باتیں نہ کریں،" تو یہ فہرست آپ کو وہاں پہنچا دے گی۔
ہم نے بہترین LlamaIndex ٹیوٹوریلز کیسے چنے
- نتائج پر مبنی: آپ کو ہر ٹیوٹوریل کے بعد کچھ کارآمد چیز تیار کرنی چاہیے۔
- 2025 کے لیے جدید ترین: موجودہ LlamaIndex APIs کی عکاسی کرتا ہے (مثلاً،
VectorStoreIndex، Settings، QueryPipeline، ReActAgent)۔
- پروڈکشن سے آگاہ: ہیلو ورلڈ سے آگے، ایویلیوایشن، ٹریسنگ اور تکرار دکھاتا ہے۔
- وسعت + گہرائی: کوئیک اسٹارٹس سے لے کر ایجنٹس، ملٹی موڈل اور اسٹرکچرڈ ایکسٹریکشن تک۔
10 بہترین LlamaIndex ٹیوٹوریلز (منتخب کردہ)
ذیل میں ایک تیار کردہ راستہ ہے۔ اپنی سطح سے شروع کریں؛ جہاں ضرورت ہو وہاں جائیں۔
1) 15 منٹ کا کوئیک اسٹارٹ: اپنی PDFs پر چیٹ کریں
- بہترین برائے: مکمل مبتدی اور پروڈکٹ مینیجرز
- آپ کیا بنائیں گے: PDFs اپ لوڈ کریں، انڈیکس کریں، سوالات پوچھیں، حوالے حاصل کریں
- اہم تصورات:
SimpleDirectoryReader، VectorStoreIndex، Settings، ایمبیڈنگز
- یہ کیوں بہترین ہے: کم سے کم کوڈ، زیادہ سے زیادہ "آہا!" لمحہ
مثال کا ڈھانچہ:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- آپ اگلا کیا سیکھیں گے: چنک سائز، ٹاپ‑k، اور ری رینکنگ کیوں اہم ہے۔
2) چنکنگ، میٹا ڈیٹا اور ری رینکنگ کے ساتھ RAG کی بنیادی باتیں
- بہترین برائے: مبتدی → متوسط
- آپ کیا بنائیں گے: بہتر سیاق و سباق کے معیار کے ساتھ ایک سمارٹ ریٹریور
- اہم تصورات:
SentenceSplitter، میٹا ڈیٹا فلٹرز، rerank اجزاء
- یہ کیوں بہترین ہے: دکھاتا ہے کہ چند نوبس کس طرح من گھڑت باتوں کو ڈرامائی طور پر کم کرتے ہیں۔
آزمائیں:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- نتیجہ: طویل دستاویزات کے لیے اعلیٰ معیار کی سیاق و سباق ونڈوز۔
3) LlamaIndex + OpenAI فنکشن کالنگ (ٹول‑یوز اور اسٹرکچرڈ آؤٹ پٹ)
- بہترین برائے: ورک فلو کو خودکار کرنے والے بنانے والے
- آپ کیا بنائیں گے: ایک ایجنٹ جو ٹولز کو کال کرتا ہے اور JSON اسکیمز واپس کرتا ہے۔
- اہم تصورات:
QueryPipeline، ٹول اسپیک، Pydantic اسکیمز، فنکشن کالنگ
- یہ کیوں بہترین ہے: سوال و جواب کو حقیقی اقدامات (سرچ، CRUD، APIs) کے ساتھ جوڑتا ہے۔
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- نتیجہ: اسٹرکچرڈ ایکسٹریکشن اور ایکشن کے لیے پروڈکشن‑ریڈی پیٹرنز۔
4) ایک پروڈکشن ویکٹر اسٹور بنانا (Postgres, Pinecone, Weaviate)
- بہترین برائے: اسکیل کرنے کی منصوبہ بندی کرنے والی ٹیمیں
- آپ کیا بنائیں گے: فلٹرز اور ہائبرڈ سرچ کے ساتھ پائیدار ویکٹر اسٹوریج
- اہم تصورات:
VectorStoreIndex اڈاپٹر، ہائبرڈ BM25+embeddings، میٹا ڈیٹا
- یہ کیوں بہترین ہے: پرسسٹنس، مائیگریشنز اور لاگت کنٹرول سکھاتا ہے۔
تجاویز:
- سادہ، سستی تعیناتیوں کے لیے Postgres/pgvector استعمال کریں۔
- منظم اسکیل کے لیے Pinecone/Weaviate؛
ef_construction، ef_search کو ٹیون کریں۔
- نایاب اصطلاحات اور مخففات کو ہینڈل کرنے کے لیے ہائبرڈ ریٹریول شامل کریں۔
5) ایجنٹس کے ساتھ کوئری پلاننگ اور ملٹی‑اسٹیپ ریزننگ
- بہترین برائے: پیچیدہ سوالات اور ملٹی‑ڈیٹا سیٹ سرچ
- آپ کیا بنائیں گے: ایک منصوبہ ساز جو ایک سوال کو ذیلی سوالات میں تقسیم کرتا ہے۔
- اہم تصورات:
ReActAgent، SubQuestionQueryEngine، روٹنگ
- یہ کیوں بہترین ہے: "بازیافت کریں پھر جواب دیں" سے آگے بڑھ کر "سوچیں پھر تلاش کریں" تک جاتا ہے۔
پیٹرن:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) آبزرویبلٹی اور ایویلیوایشن: ٹریسنگ، گراؤنڈڈنس اور بینچ مارکس
- بہترین برائے: کوئی بھی جو حقیقی ایپس بھیج رہا ہے۔
- آپ کیا بنائیں گے: ریگریشنز اور من گھڑت باتوں کا پتہ لگانے کے لیے فیڈ بیک لوپس
- اہم تصورات: LlamaIndex evals، گریڈڈ QA، سائٹیشن چیکس، ٹریسنگ
- یہ کیوں بہترین ہے: آپ کو یہ سکھاتا ہے کہ اسکیل کرنے سے پہلے کیا چیز اہم ہے اس کی پیمائش کیسے کی جائے۔
چیک لسٹ:
- تمام پرامپٹس/جوابات کو ٹریسز کے ساتھ لاگ کریں۔
- ریگریشن ٹیسٹنگ کے لیے گریڈڈ QA ڈیٹا سیٹس استعمال کریں۔
- گراؤنڈڈنس اور سائٹیشن کوریج کو ٹریک کریں۔
7) ملٹی موڈل ڈیٹا کے لیے RAG (تصاویر، ٹیبلز، مارک ڈاؤن)
- بہترین برائے: چارٹس، اسکرین شاٹس اور ٹیبلز والی دستاویزات
- آپ کیا بنائیں گے: پائپ لائنز جو تصاویر سے متن نکالتی ہیں اور ٹیبلز پر استدلال کرتی ہیں۔
- اہم تصورات: OCR + لے آؤٹ پارسنگ، ٹیبل چنکنگ، ملٹی موڈل ماڈلز
- یہ کیوں بہترین ہے: حقیقی دنیا کی دستاویزات گندی ہوتی ہیں؛ یہ ٹیوٹوریل آپ کو بتاتا ہے کہ انہیں کیسے قابو کرنا ہے۔
8) ملٹی‑ٹیننٹ اور ریٹریول آئسولیشن
- بہترین برائے: SaaS بنانے والے
- آپ کیا بنائیں گے: ایک RAG سروس جہاں ہر صارف کا ڈیٹا الگ تھلگ ہو۔
- اہم تصورات: نیم اسپیسز، میٹا ڈیٹا گارڈز، فی‑ٹیننٹ انڈیکسز، RBAC
- یہ کیوں بہترین ہے: ڈیزائن کے ذریعے سیکیورٹی اور پرائیویسی؛ صاف اپ گریڈ پاتھس۔
9) اسکیل پر اسٹرکچرڈ ایکسٹریکشن (انوائسز، لاگز، معاہدے)
- بہترین برائے: آپریشنز، فنانس، قانونی ورک فلو
- آپ کیا بنائیں گے: اسکیما ویلیڈیشن کے ساتھ متعین JSON آؤٹ پٹس
- اہم تصورات: Pydantic اسکیمز، ریٹرائز، ٹول‑آگمنٹڈ ویلیڈیشن
- یہ کیوں بہترین ہے: دستی جائزے کو کم کرتا ہے اور LLM آؤٹ پٹ کو قابل اعتماد بناتا ہے۔
10) اینڈ‑ٹو‑اینڈ پروڈکشن پیٹرن: نوٹ بکس سے CI/CD تک
- بہترین برائے: پروڈ کی طرف جانے والی ٹیمیں
- آپ کیا بنائیں گے: ڈیٹا انجیکشن، انڈیکسنگ جابز، ایویلیوایشن اور ریلیز گیٹس کے ساتھ ایک مکمل پائپ لائن
- اہم تصورات: پس منظر کے ورکرز، شیڈولڈ ری‑انڈیکسنگ، فیچر فلیگز
- یہ کیوں بہترین ہے: اعتماد کے ساتھ مسلسل بھیجنا سکھاتا ہے۔
اپنے مقصد کے لیے صحیح LlamaIndex ٹیوٹوریل کا انتخاب کرنا
اپنا اگلا مرحلہ منتخب کرنے کے لیے اس فوری روٹر کا استعمال کریں:
- "مجھے آج نتائج کی ضرورت ہے۔" کوئیک اسٹارٹ (ٹیوٹوریل #1) سے شروع کریں، پھر ری رینکنگ شامل کریں (ٹیوٹوریل #2)۔
- "مجھے صرف جوابات نہیں، ایکشنز بھی چاہیے۔" فنکشن کالنگ اور ایجنٹس پر جائیں (ٹیوٹوریل #3 اور #5)۔
- "ہمیں اسکیل اور تعمیل کی ضروریات ہیں۔" اسٹوریج + ملٹی‑ٹیننٹ پیٹرنز (ٹیوٹوریل #4 اور #8)۔
- "ہم جوابات پر کیسے بھروسہ کریں؟" ایولز اور ٹریسنگ (ٹیوٹوریل #6)۔
- "ہماری دستاویزات بصری طور پر بھاری ہیں۔" ملٹی موڈل RAG (ٹیوٹوریل #7)۔
- "ہمیں اسٹرکچرڈ ڈیٹا کی ضرورت ہے۔" اسکیمز اور ویلیڈیٹرز استعمال کریں (ٹیوٹوریل #9)۔
گہرائی سے جائزہ: بہترین طریقے جو آپ کو ٹاپ LlamaIndex ٹیوٹوریلز میں نظر آئیں گے۔
1) چنکنگ ایک پروڈکٹ فیصلہ ہے۔
- ٹریڈ‑آف: بڑے چنکس = زیادہ سیاق و سباق لیکن زیادہ ٹوکن لاگت؛ چھوٹے چنکس = زیادہ ریکال لیکن بکھرے ہوئے معنی۔
- اچھے ڈیفالٹس: 512–1024 ٹوکنز تقریباً 10–20% اوورلیپ کے ساتھ۔
- میٹا ڈیٹا اہم ہے: ماخذ، صفحہ، سیکشن، ہیڈنگز کو محفوظ کریں۔
2) ریٹریول کوالٹی ماڈل سائز کو مات دیتی ہے۔
- ری رینکنگ: بہتر MRR کے لیے ایک کراس‑انکوڈر یا ایمبیڈنگ ری رینکر شامل کریں۔
- ہائبرڈ سرچ: سیمینٹکس کے لیے ایمبیڈنگز کے ساتھ نایاب اصطلاحات کے لیے BM25 کو یکجا کریں۔
- فلٹرز: درستگی کو بہتر بنانے کے لیے دستاویز کی قسم، تاریخ یا ٹیننٹ کے لحاظ سے تنگ کریں۔
3) جلد ایویلیوایٹ کریں، ہمیشہ ایویلیوایٹ کریں۔
- گریڈڈ QA: سائٹیشنز کے ساتھ سوال–جواب کے جوڑوں کا ایک چھوٹا سیٹ بنائیں۔
- میٹرکس: جواب کی درستگی، گراؤنڈڈنس، تاخیر اور فی سوال لاگت۔
- محفوظ طریقے سے A/B کریں: کٹ اوور کرنے سے پہلے نئی چنکنگ یا ریٹریورز کو شیڈو تعینات کریں۔
4) ایکشنز کو فرسٹ‑کلاس بنائیں۔
- اسٹرکچرڈ آؤٹ پٹ: ایکسٹریکشن ٹاسکس کے لیے اسکیمز استعمال کریں۔
- ٹولز: ایجنٹس کو کال کرنے کے لیے APIs (سرچ، کیلنڈر، DB) کو فنکشنز کے طور پر لپیٹیں۔
- گارڈ ریلز: آؤٹ پٹس کی توثیق کریں، ریٹرائز کو نافذ کریں، ٹول کی غلطیوں کو لاگ کریں۔
5) لاگت اور تاخیر کی حفظان صحت
- کیش ایمبیڈنگز: متن کو ڈیڈپلیکیٹ کریں اور تعمیرات میں ویکٹرز کو دوبارہ استعمال کریں۔
- بیچ آپریشنز: بلک میں انڈیکس کریں؛ UX کو بہتر بنانے کے لیے جوابات کو اسٹریم کریں۔
- سمارٹر سیاق و سباق: پرامپٹ کو زیادہ نہ بھریں—اس کے بجائے ٹاپ‑k + ری رینک کریں۔
بہترین LlamaIndex ٹیوٹوریلز کا استعمال کرتے ہوئے 7 دن کا سیکھنے کا منصوبہ
- دن 1: کوئیک اسٹارٹ (ٹیوٹوریل #1)۔ 20‑صفحات کی PDF پر چیٹ بنائیں۔ ایک CLI بھیجیں۔
- دن 2: ریٹریول کو بہتر بنائیں (ٹیوٹوریل #2)۔ ری رینکر + ہائبرڈ سرچ شامل کریں۔
- دن 3: فنکشن کالنگ شامل کریں (ٹیوٹوریل #3)۔ اپنی API میں FAQs کے لیے ایک ٹول بنائیں۔
- دن 4: ایک حقیقی ویکٹر اسٹور پر منتقل ہوں (ٹیوٹوریل #4)۔ مقامی طور پر pgvector استعمال کریں۔
- دن 5: ایک منصوبہ ساز متعارف کروائیں (ٹیوٹوریل #5)۔ دو انڈیکسز میں سوالات روٹ کریں۔
- دن 6: ایویلیوایشن شامل کریں (ٹیوٹوریل #6)۔ 30‑سوالوں کا ٹیسٹ سیٹ اور بیس لائن بنائیں۔
- دن 7: پروڈکشن پاس (ٹیوٹوریل #10)۔ پس منظر کی جابز، آبزرویبلٹی، CI۔
مثال کا پروجیکٹ: LlamaIndex کے ساتھ "Docs Concierge"
- مقصد: ایک محفوظ داخلی اسسٹنٹ جو عمل کی دستاویزات کے بارے میں سوالات کے جوابات دیتا ہے اور ٹکٹ کھولتا ہے۔
- اسٹیک: LlamaIndex، Postgres/pgvector، OpenAI/Anthropic، FastAPI، S3۔
- Confluence ایکسپورٹس اور PDFs کو انجسٹ کریں (میٹا ڈیٹا + ACLs رکھیں)۔
- 768 ٹوکنز پر چنک کریں؛ pgvector میں انڈیکس کریں۔
- ہائبرڈ ریٹریول اور ایک ری رینکر شامل کریں۔
- ٹولز بنائیں:
create_jira_ticket، lookup_oncall، fetch_policy۔
- 50 تیار کردہ سوالات کے ساتھ ایویلیوایشن شامل کریں؛ گراؤنڈڈنس کی پیمائش کریں۔
- اسٹریمنگ UI اور سائٹیشن پریویوز کے ساتھ تعینات کریں۔
- نتیجہ: تیز، سائٹڈ جوابات؛ ایک‑کلک ٹاسک آٹومیشن؛ قابل پیمائش درستگی۔
عام غلطیاں جن سے یہ ٹیوٹوریلز آپ کو بچنے میں مدد کرتے ہیں۔
- ایویلیوایشن کو چھوڑنا: اگر آپ ٹیسٹ نہیں کریں گے، تو آپ ریگریشنز بھیجیں گے۔
- میٹا ڈیٹا کو نظر انداز کرنا: آپ ماخذ انتساب اور روٹنگ پاور کھو دیں گے۔
- اوور سائزڈ چنکس: ٹوکن بلوٹ بہتر جوابات کے بغیر لاگت میں اضافہ کرتا ہے۔
- انڈر‑اسپیسیفائنگ ٹولز: ایجنٹس کو واضح ان پٹس اور متعین آؤٹ پٹس کی ضرورت ہوتی ہے۔
- کوئی آئسولیشن نہیں: ملٹی‑ٹیننٹ RAG کو کراس‑کسٹمر لیکج کو روکنا چاہیے۔
وہ ٹولز جو LlamaIndex ٹیوٹوریلز کی تکمیل کرتے ہیں۔
- ویکٹر اسٹورز: pgvector, Pinecone, Weaviate, Qdrant
- ری رینکرز: Cohere Rerank, FlagEmbedding, Voyage rerank
- چنکرز: سیمینٹک اسپلٹرز، ٹیبل-اویئر اسپلٹرز
- ایولز: Ragas-style QA, LlamaIndex evals, custom rubric graders
- UI: اسٹریملٹ، Next.js، اسٹریمنگ ٹوکنز کے لیے FastAPI ویب ساکٹس
ویسے، اگر آپ اپنے براؤزر کے اندر کام کر کے سیکھنا پسند کرتے ہیں، تو یہ بات قابل غور ہے کہ Sider.ai آپ کو کوڈ، دستاویزات اور ویب صفحات کے ساتھ ساتھ چیٹ کرنے کی سہولت دیتا ہے۔ آپ LlamaIndex ٹیوٹوریلز سے اسنیپٹس پیسٹ کر سکتے ہیں، پرامپٹس کے ذریعے چلا سکتے ہیں، اور تیزی سے تکرار کر سکتے ہیں—RAG پرامپٹس کی جانچ کرنے اور اسٹرکچرڈ آؤٹ پٹس نکالنے کے لیے آسان ہے جب آپ ساتھ ساتھ چلتے ہیں۔ کیا تلاش کریں: جدید ترین LlamaIndex ٹیوٹوریلز تلاش کرنا
- "best LlamaIndex tutorials 2025"
- "LlamaIndex quickstart RAG pdf"
- "LlamaIndex SubQuestionQueryEngine example"
- "LlamaIndex evaluation groundedness tutorial"
- "LlamaIndex pgvector Pinecone guide"
- "LlamaIndex agents function calling example"
Settings.llm، Settings.embed_model، VectorStoreIndex، اور as_query_engine کا استعمال کرتے ہوئے حالیہ کوڈ تلاش کریں—یہ موجودہ محاورے ہیں۔
اہم نکات
- بہترین LlamaIndex ٹیوٹوریلز آپ کو صرف کوڈ اسنیپٹس نہیں، نتائج بھیجنے میں مدد کرتے ہیں۔
- دستاویزات پر چیٹ کے ساتھ شروع کریں، پھر ریٹریول کوالٹی، ٹولز اور ایویلیوایشن میں اضافہ کریں۔
- ایک حقیقی ویکٹر اسٹور استعمال کریں، پیچیدہ سوالات کے لیے منصوبہ ساز شامل کریں، اور بے دریغ جانچ کریں۔
- چھوٹے آرکیٹیکچرل انتخاب—چنکنگ، ری رینکنگ، فلٹرز—ماڈلز کو تبدیل کرنے سے زیادہ نتائج تبدیل کرتے ہیں۔
- جب آپ ایک منظم منصوبے پر عمل کرتے ہیں اور کچھ حقیقی بناتے ہیں تو سیکھنا تیز ہوتا ہے۔
اب آگے کیا؟
- اوپر کے تین میں سے ایک ٹیوٹوریل منتخب کریں اور آج ہی ایک کم سے کم ایپ بنائیں۔
- صارفین کو اسکیل کرنے سے پہلے ایویلیوایشن شامل کریں۔
- اپنی پروڈکشن مائیگریشن کی منصوبہ بندی کریں: اسٹوریج، آتھ، آبزرویبلٹی اور CI۔
- اپنی گنجائش بڑھنے کے ساتھ ہی جدید ٹیوٹوریلز (ایجنٹس، ملٹی موڈل، ملٹی‑ٹیننٹ) پر دوبارہ غور کریں۔
عمومی سوالات
Q1: مبتدیوں کے لیے بہترین LlamaIndex ٹیوٹوریلز کون سے ہیں؟
ایک کوئیک اسٹارٹ کے ساتھ شروع کریں جو VectorStoreIndex اور SimpleDirectoryReader کا استعمال کرتے ہوئے آپ کی PDFs پر چیٹ بناتا ہے۔ پھر ریٹریول کوالٹی کو بڑھانے کے لیے چنکنگ، میٹا ڈیٹا اور ری رینکنگ پر ایک ٹیوٹوریل شامل کریں۔
Q2: میں LlamaIndex کے ساتھ ایک پروڈکشن RAG ایپ کیسے بناؤں؟
ان ٹیوٹوریلز پر عمل کریں جو ویکٹر اسٹورز (pgvector, Pinecone)، ہائبرڈ ریٹریول اور گریڈڈ QA کے ساتھ ایویلیوایشن کا احاطہ کرتے ہیں۔ نوٹ بکس سے پروڈکشن میں منتقل ہونے کے لیے ٹریسنگ، اسٹرکچرڈ آؤٹ پٹس اور CI/CD شامل کریں۔
Q3: کون سا LlamaIndex ٹیوٹوریل ایجنٹس اور ٹول استعمال کرنا سکھاتا ہے؟
ReAct-style ایجنٹس، QueryPipeline اور Pydantic اسکیمز کے ساتھ فنکشن کالنگ کا استعمال کرتے ہوئے گائیڈز تلاش کریں۔ یہ ٹیوٹوریلز دکھاتے ہیں کہ کوئریز کو کیسے روٹ کیا جائے، APIs کو کیسے کال کیا جائے اور اسٹرکچرڈ JSON کیسے واپس کیا جائے۔
Q4: میں LlamaIndex RAG کی درستگی کا اندازہ کیسے لگا سکتا ہوں؟
ایویلیوایشن ٹیوٹوریلز استعمال کریں جو گراؤنڈڈنس چیکس، سائٹیشن کوریج اور گریڈڈ QA ڈیٹا سیٹس متعارف کراتے ہیں۔ تعینات کرنے سے پہلے ریگریشنز کو پکڑنے کے لیے درستگی، تاخیر اور لاگت کو ٹریک کریں۔
Q5: کیا ملٹی موڈل دستاویزات کے لیے LlamaIndex ٹیوٹوریلز موجود ہیں؟
ہاں، وہ ٹیوٹوریلز تلاش کریں جو تصاویر اور ٹیبلز کے لیے OCR اور لے آؤٹ پارسنگ کو یکجا کرتے ہیں، پھر میٹا ڈیٹا کے ساتھ نکالا گیا متن انڈیکس کریں۔ وہ دکھاتے ہیں کہ RAG میں چارٹس، اسکرین شاٹس اور پیچیدہ PDFs کو کیسے ہینڈل کیا جائے۔