تم التحديث في 25 سبتمبر 2025
6 دقيقة
# Pythonpip install litellm# Node.jsnpm install litellm# مثال: استخدام OpenAI + Anthropic + Mistralexport OPENAI_API_KEY=sk-...export ANTHROPIC_API_KEY=sk-ant-...export MISTRAL_API_KEY=sk-mis-...from litellm import completionresp = completion(model="gpt-4o-mini", # or "anthropic/claude-3-5-sonnet", "mistral/mistral-large"messages=.---## التدفق والأدوات ووضع JSON### تدفق الردود```pythonfrom litellm import completionfor chunk in completion(model="gpt-4o-mini",messages=.### استخدام التكلفة والرمز المميزيمكن لـ LiteLLM تتبع استخدام الرمز المميز وتقدير التكلفة لكل طلب أو نموذج أو مشروع. باستخدام الوكيل، يمكنك تصدير الاستخدام إلى السجلات أو لوحات المعلومات أو حوض الفوترة. هذا لا يقدر بثمن عندما تمزج البائعين بأسعار مختلفة.---## وكيل LiteLLM (بوابة LLM)إذا كنت فريقًا أو نظامًا أساسيًا، فإن الوكيل هو القوة الخارقة الحقيقية: خدمة مركزية مع التوجيه والمصادقة وحدود المعدل والتسجيل والمراقبة. أنت تتفاعل معه باستخدام واجهة برمجة تطبيقات OpenAI بحيث بالكاد يتغير كود تطبيقك.### ابدأ الوكيل```bash# أبسط تشغيل محليlitellm --port 4000/v1/chat/completions. وجّه عميل OpenAI الحالي الخاص بك إلى ` وستكون جاهزًا.config.yaml:model_list:- model_name: gpt-4o-minilitellm_params:model: openai/gpt-4o-miniapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}router:strategy: simple_weightedroutes:- model: gpt-4o-miniweight: 0.6- model: claude-3-5-sonnetweight: 0.4rate_limits:requests_per_minute: 120logging:level: infosink: stdoutauth:api_keys:- key: svc-app-123litellm --config config.yaml --port 4000from openai import OpenAIclient = OpenAI(base_url=" api_key="svc-app-123")resp = client.chat.completions.create(model="gpt-4o-mini",messages=.---## التوجيه المتقدم: الكمون أو التكلفة أو الموثوقيةيمكنك تنفيذ استراتيجيات التوجيه مثل:- التوزيع الدوري المرجح لنماذج A/B- الأقل زمن انتقال أولاً حسب المنطقة- التوجيه الواعي بالتكلفة لنقاط النهاية غير الحرجة- الرجوع إلى الخطأ/إعادة المحاولة عبر الموفرينباستخدام سياسة جهاز التوجيه، يمكنك أن تقول "فضل الرخيص، والرجوع إلى المميز للمطالبات الصعبة." هذا يوفر توافرًا عاليًا وميزانيات يمكن التنبؤ بها.---## الحواجز والاعتدال والسلامةأضف برامج وسيطة للمعالجة المسبقة واللاحقة لإزالة معلومات التعريف الشخصية (PII) أو فرض عوامل تصفية الأمان أو تخفيف المخرجات قبل إعادتها إلى العملاء. ادمج الإشراف الأصلي للموفر (مثل OpenAI و Google) مع فحوصات السياسة الخاصة بك في الوكيل. مثال: اطلب التحقق من صحة مخطط JSON وأعد السؤال عندما يكون غير صالح.---## المراقبة والتسجيل- تمكين تسجيل الطلبات/الاستجابات مع التنقيح.- تصدير المقاييس إلى Prometheus/Grafana أو APM الخاص بك.- تتبع زمن الانتقال والرموز المميزة والتكلفة حسب نقطة النهاية والمستخدم.هذا يحول "روليت النموذج" إلى خدمة مُدارة مع اتفاقيات مستوى الخدمة والميزانيات.---## أنماط الاستخدام الواقعي1) مرونة متعددة البائعين- الأساسي: نموذج سريع/رخيص؛ الاحتياطي: نموذج عالي الدقة على 429/5xx.- المزايا: تحسين وقت التشغيل، والتحكم في التكاليف، والجودة المستقرة.2) ترقيات نموذج علامة الميزة- استخدم أوزان جهاز التوجيه لتقديم نموذج جديد بنسبة 5% من حركة المرور؛ مراقبة المقاييس؛ رفع المستوى عندما يكون مستقرًا.3) مستويات المنتج- المستوى المجاني موجه إلى النماذج الصغيرة؛ المستوى الاحترافي للنماذج المتميزة.4) سجلات ونماذج المطالبات- مركزية المطالبات في الوكيل بحيث ترث الخدمات التحسينات دون عمليات إعادة النشر.5) فواتير وميزانيات الفريق- تتبع الإنفاق عن طريق مفتاح API؛ فرض حدودًا مرنة وصارمة لكل فريق أو منتج.---## قائمة التحقق من الأمن والامتثال- قم بتخزين مفاتيح الموفر في مدير الأسرار الخاص بك؛ الرجوع إليها عبر متغيرات البيئة في التكوين.- قم بتشغيل تنقيح الطلبات وتنظيف معلومات التعريف الشخصية في السجلات.- استخدم مفاتيح API لكل خدمة للوكيل؛ قم بتدويرها بانتظام.- قم بتعيين حدود ومعدلات على مستوى المؤسسة.- إضافة قوائم السماح/الرفض للنماذج ونقاط النهاية.---## استكشاف الأخطاء وإصلاحها: إصلاحات سريعة- "غير مصرح به" عبر الوكيل: تحقق من `auth.api_keys` وأن عميلك يستخدم `base_url` + المفتاح الصحيح.- لم يتم العثور على النموذج: تأكد من أن `model_list` يحتوي على الاسم المألوف الذي تستدعيه.- المهلات: قم بزيادة `timeout` أو التوجيه إلى منطقة موفر أقل زمن انتقال.- مخرجات غريبة: تمكين مخطط JSON + التحقق من الصحة؛ إضافة عمليات إعادة محاولة واحتياطية.- ارتفاعات التكلفة: قم بتشغيل التخزين المؤقت؛ قم بتوجيه حركة المرور المجمعة إلى نماذج أرخص؛ تعيين حصص لكل مفتاح.للحصول على مزيد من الغوص العميق وأحدث الميزات، يتم تحديث المستندات الرسمية بشكل متكرر وتستحق وضع إشارة مرجعية عليها. تعد البرامج التعليمية مثل دليل DataCamp رائعة للأنماط العملية، ويمكن أن يساعدك فيديو الدورة التدريبية المكثفة للمبتدئين على رؤية المفاهيم في العمل.---## ضع كل شيء معًا: الهيكل المرجعي للتطبيق (Python FastAPI)```python# app.pyfrom fastapi import FastAPIfrom pydantic import BaseModelfrom litellm import completionimport osclass ChatReq(BaseModel):question: strapp = FastAPI@app.post("/ask")async def ask(req: ChatReq):resp = completion(model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),messages=.### أسئلة وأجوبةس1: ما هو LiteLLM ولماذا يتم استخدامه بدلاً من حزم SDK المباشرة للموفرين؟LiteLLM هي بوابة متوافقة مع OpenAI لأكثر من 100 نموذج لغوي كبير، مما يمنحك واجهة برمجة تطبيقات واحدة ونموذجًا ذهنيًا واحدًا. فهو يقلل من تقييد البائع، ويبسط التوجيه، ويضيف ميزات العمليات مثل التخزين المؤقت وإعادة المحاولة وتتبع التكاليف.س2: كيف يمكنني استخدام LiteLLM مع OpenAI SDK؟وجّه عنوان URL الأساسي لـ SDK إلى وكيل LiteLLM واستخدم مفتاح API الخاص بالوكيل. يمكن أن يظل الكود الخاص بك كما هو بينما يبدل الوكيل الموفرين أو النماذج خلف الكواليس.س3: هل يمكن لـ LiteLLM بث الاستجابات وإرجاع JSON؟نعم. استخدم `stream=True` للحصول على تدفقات الرمز المميز، و `response_format` مع مخطط JSON لفرض مخرجات منظمة عبر الموفرين.س4: كيف يمكنني التحكم في التكاليف عبر موفري LLM المختلفين؟قم بتمكين تسجيل الاستخدام وتقدير التكلفة، وإضافة التخزين المؤقت، وتعيين حدود المعدل، وتوجيه حركة المرور المجمعة إلى نماذج أرخص عبر الوكيل. مراقبة مع لوحات المعلومات للميزانيات واتفاقيات مستوى الخدمة.س5: هل LiteLLM مناسبة لفرق الإنتاج؟نعم. يوفر الوكيل المصادقة وحدود المعدل والتوجيه والمراقبة والبرامج الوسيطة للسلامة. لقد تم تصميمه كبوابة LLM تعمل على مركزية الإدارة مع الحفاظ على توافق تطبيقك مع OpenAI.
كيفية إتقان ChatPDF: الحصول على رؤى أسرع من المستندات الكثيفة

أفضل بديل لـ X Auto-Translation لترجمة سريعة ودقيقة للوثائق

هل ترجمة سامسونج بالذكاء الاصطناعي غير متوفرة في إيران؟ حلول عملية

أدوات الترجمة الفارسية: دليل عملي للعمل بسرعة ودقة

أفضل بديل لـ Grok للبحث العميق والمستند إلى المراجع

أهم 15 ميزة في مولد الصور بالذكاء الاصطناعي ستستخدمها فعليًا