تازہ ترین 25 ستمبر 2025 کو
7 منٹ
/v1/chat/completions اینڈ پوائنٹ بنانا۔pip install litellmexport OPENAI_API_KEY=sk-...# اختیاری: مزید پرووائیڈرزexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # یا "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- اوپر کا کوڈ چلائیں۔- مقصد: LiteLLM کے ذریعے پہلی OpenAI-مطابقت رکھنے والی درخواست بنائیں۔- عملی بلڈر- DataCamp ٹیوٹوریل پڑھیں اور مثالوں کو اسٹریمِنگ اور ریٹریز کے ساتھ بڑھائیں۔- دو پرووائیڈرز شامل کریں اور فال بیکس ٹیسٹ کریں۔- ٹیم/پروڈکشن مالک- آفیشل Getting Started گائیڈ کا مطالعہ کریں۔- پراکسی کھڑا کریں، آبزرویبیلیٹی اور لاگت ٹریکنگ شامل کریں۔- ریٹ لمٹس اور PII ریڈیکشن پالیسی نافذ کریں۔—## گہرائی میں جائزہ: ہفتہ وار استعمال کے پیٹرنز### OpenAI مطابقت کو ایک انٹرفیس کنٹریکٹ سمجھیں- OpenAI کے API شیپ کو اپنی ایپ کا کنٹریکٹ سمجھیں۔ تمام درخواستیں LiteLLM پراکسی کے `/v1/*` اینڈ پوائنٹس پر جاتی ہیں۔- ماڈل سوئپ کریں (مثلاً `gpt-4o` → `claude-3-5`) ترتیب کے ذریعے، کوڈ کے ذریعے نہیں۔### استعمال کی بنیاد پر ماڈل روٹنگ- لیٹینسی حساس راستہ: تیز اور سستے ماڈلز کو روٹ کریں۔- منطق کا راستہ: بہتر معیار کے ماڈلز کو روٹ کریں مثلاً RAG یا ٹول کے لیے۔- پرائیویسی راستہ: مقامی/Ollama کو PII حصوں کے لیے روٹ کریں۔### لاگت کے تحفظات- درخواستوں کو `user_id`/`team` سے ٹیگ کریں۔- ہر ٹیم/ماڈل کے لیے بجٹ مقرر کریں۔- ٹوکن کے استعمال کو مرکزی اسٹور میں لاگ کریں اور غیر معمولی سرگرمی پر الرٹس دیں۔### مزاحمت- جِٹر کے ساتھ ریٹریز فعال کریں۔- ہر پرووائیڈر کے لیے ٹائم آؤٹ اور بار بار ناکامیوں پر سرکٹ بریکرز ترتیب دیں۔- پرووائیڈر کی ترجیحات اور واضح فال بیکس مقرر کریں۔### آبزرویبیلیٹی- درخواست/جواب کے میٹا ڈیٹا، لیٹینسی ہسٹوگرام، اور ماڈل/ورژن کو کیپچر کریں۔- لاگز میں راز/PII کو ریڈیکٹ کریں۔- سروسز کے درمیان ٹریسز کو مربوط کریں تاکہ سست کالز کو جلد تلاش کیا جا سکے۔—## مثال LiteLLM پراکسی کنفیگریشن (پروڈکشن کے لیے تیار آغاز)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- ایک عملی، مثال پر مبنی مضمون۔- آفیشل LiteLLM ڈاکیومنٹس شروع کرنے اور پراکسی بہترین طریقوں کے لیے۔—## ایکشن پلان: آپ کے اگلے 7 دندن 1–2: کرش کورس اور فوری آغاز کریں؛ پہلی پروکسی درخواست کریں۔دن 3–4: دوسرا پرووائیڈر اور اسٹریمِنگ شامل کریں؛ ٹائم آؤٹس، ریٹریز سیٹ کریں۔دن 5: کنفیگریشن کے ساتھ پراکسی کھڑا کریں؛ استعمال کی بنیاد پر روٹ کریں (لیٹینسی بمقابلہ منطق)۔دن 6: لاگنگ، لاگت ٹریکنگ، اور ریڈیکشن شامل کریں۔دن 7: لوڈ ٹیسٹ کریں؛ پرووائیڈر کی ناکامیوں کی نقل کریں؛ فال بیکس کی تصدیق کریں۔—## کلیدی نکات- LiteLLM بغیر وینڈر لاک-ان کے ملٹی-پرووائیڈر LLM ایپس تک پہنچنے کا تیز ترین راستہ ہے۔- OpenAI-مطابقت رکھنے والے انٹرفیس سے شروع کریں، پھر گورننس کے لیے پراکسی تک بڑھیں۔- روٹنگ، مزاحمت، اور آبزرویبیلیٹی میں جلد سرمایہ کاری کریں — آپ کو ہفتے دو میں ان کی ضرورت ہوگی، مہینے چھ میں نہیں۔- اوپر دیے گئے ٹیوٹوریلز روزانہ 80% استعمال کی کوریج دیتے ہیں؛ باقی آپ کی پروڈکٹ کا خفیہ حل ہے۔### اکثر پوچھے جانے والے سوالات (FAQ)Q1: نو آموزوں کے لیے بہترین LiteLLM ٹیوٹوریل کون سا ہے؟LiteLLM Crash Course یوٹیوب پر دیکھیں جو ایک تیز بصری وضاحت ہے، پھر پراکسی کے لیے آفیشل Getting Started گائیڈ پڑھیں۔ DataCamp ٹیوٹوریل عملی مثالیں فراہم کرتا ہے جو آپ کاپی کر سکتے ہیں۔Q2: میں LiteLLM کو OpenAI-مطابقت رکھنے والی پراکسی کے طور پر کیسے استعمال کروں؟LiteLLM پراکسی چلائیں اور اپنے SDK کے بنیادی URL کو پراکسی کے `/v1` اینڈ پوائنٹس پر پوائنٹ کریں۔ پرووائیڈر کی تفصیلات LiteLLM کنفیگریشن میں رکھیں تاکہ آپ کا ایپلیکیشن کوڈ پورٹ ایبل رہے۔Q3: کیا LiteLLM خودکار طور پر OpenAI، Anthropic، اور Gemini کے درمیان روٹنگ کر سکتا ہے؟جی ہاں۔ LiteLLM کنفیگریشن میں ماڈلز اور روٹنگ حکمت عملیوں کو ڈیفائن کریں تاکہ لیٹینسی، لاگت، یا معیار کی بنیاد پر پرووائیڈرز کے درمیان سوئچ کیا جا سکے۔ قابل اعتماد ہونے کے لیے فال بیکس بھی سیٹ کریں۔Q4: میں LiteLLM کے ساتھ اسٹریمِنگ اور ٹول/فنکشن کالنگ کیسے فعال کروں؟LiteLLM کے ذریعے OpenAI-مطابقت رکھنے والے API کا استعمال کریں اور `stream=True` (یا SDK میں SSE) کو فعال کریں۔ ٹول کالنگ کے لیے، OpenAI فنکشن کالنگ فارمیٹ کو فالو کریں — LiteLLM اسے ٹارگٹ پرووائیڈر کو فارورڈ کر دیتا ہے۔Q5: LiteLLM کے ساتھ لاگت کنٹرول کرنے کا سب سے تیز طریقہ کیا ہے؟درخواستیں پراکسی کے ذریعے مرکزی بنائیں، استعمال کی لاگنگ فعال کریں، اور فی کلید ریٹ لمٹس اور بجٹس نافذ کریں۔ مختلف ورک لوڈز کو کم لاگت والے ماڈلز پر روٹ کریں اور ورژنز کو پن کریں تاکہ غیر متوقع تبدیلیاں نہ ہوں۔
ChatPDF میں مہارت کیسے حاصل کریں: گھنے دستاویزات سے تیز تر بصیرت

تیز، درست دستاویزات کے لیے بہترین X آٹو-ترجمہ متبادل

کیا ایران میں Samsung AI ترجمہ دستیاب نہیں؟ عملی حل

فارسی ترجمہ کے اوزار: تیز اور درست کام کے لیے عملی رہنمائی

گہرے، حوالہ دار تحقیق کے لیے بہترین Grok متبادل

اے آئی امیج جنریٹر کی 15 بہترین خصوصیات جو آپ واقعی استعمال کریں گے