بهروزرسانی شده در 25 سپتامبر 2025
6 دقیقه
# پایتونpip install litellm# نود.جیاسnpm install litellm# مثال: استفاده از OpenAI + Anthropic + Mistralexport OPENAI_API_KEY=sk-...export ANTHROPIC_API_KEY=sk-ant-...export MISTRAL_API_KEY=sk-mis-...from litellm import completionresp = completion(model="gpt-4o-mini", # or "anthropic/claude-3-5-sonnet", "mistral/mistral-large"messages=.---## استریمینگ، ابزارها و حالت JSON### پاسخهای استریمینگ```pythonfrom litellm import completionfor chunk in completion(model="gpt-4o-mini",messages=.### هزینه و میزان استفاده از توکنLiteLLM میتواند میزان استفاده از توکن را ردیابی کرده و هزینه هر درخواست، مدل یا پروژه را تخمین بزند. با استفاده از پروکسی، میتوانید میزان استفاده را به گزارشها، داشبوردها یا یک محل تخلیه صورتحساب صادر کنید. این ویژگی هنگام ترکیب فروشندگان با قیمتگذاری متفاوت بسیار ارزشمند است.---## پروکسی LiteLLM (دروازه LLM)اگر یک تیم یا پلتفرم هستید، پروکسی قدرت واقعی است: یک سرویس مرکزی با مسیریابی، احراز هویت، محدودیت نرخ، ثبت گزارش و قابلیت مشاهده. شما با استفاده از سطح API OpenAI با آن تعامل میکنید، بنابراین کد برنامه شما به سختی تغییر میکند.### شروع پروکسی```bash# سادهترین اجرای محلیlitellm --port 4000/v1/chat/completions را در معرض دید قرار میدهد. کلاینت OpenAI موجود خود را به `{your_proxy_url}` اشاره دهید و کارتان تمام است.config.yaml:model_list:- model_name: gpt-4o-minilitellm_params:model: openai/gpt-4o-miniapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}router:strategy: simple_weightedroutes:- model: gpt-4o-miniweight: 0.6- model: claude-3-5-sonnetweight: 0.4rate_limits:requests_per_minute: 120logging:level: infosink: stdoutauth:api_keys:- key: svc-app-123litellm --config config.yaml --port 4000from openai import OpenAIclient = OpenAI(base_url="{your_proxy_url}", api_key="svc-app-123")resp = client.chat.completions.create(model="gpt-4o-mini",messages=.---## مسیریابی پیشرفته: تأخیر، هزینه یا قابلیت اطمینانمیتوانید استراتژیهای مسیریابی مانند:- دورهای وزنی برای مدلهای A/B- کمترین تأخیر ابتدا بر اساس منطقه- مسیریابی آگاه از هزینه برای نقاط پایانی غیر بحرانی- بازگشت به خطا/تلاش مجدد در سراسر ارائهدهندگانبا یک سیاست روتر، میتوانید بگویید «ارزان را ترجیح بده، برای اعلانهای سخت به مدلهای پریمیوم بازگرد». این امر در دسترس بودن بالا و بودجههای قابل پیشبینی را ارائه میدهد.---## محافظها، تعدیل و ایمنیمیانافزارهای پیش و پسپردازش را برای حذف PII، اعمال فیلترهای ایمنی یا تعدیل خروجیها قبل از بازگرداندن به مشتریان اضافه کنید. تعدیل بومی ارائهدهنده (به عنوان مثال، OpenAI، Google) را با بررسیهای سیاست خود در پروکسی ترکیب کنید. مثال: نیاز به اعتبارسنجی طرحواره JSON و درخواست مجدد در صورت نامعتبر بودن.---## قابلیت مشاهده و ثبت گزارش- فعال کردن ثبت گزارش درخواست/پاسخ با ویرایش.- صادر کردن متریکها به Prometheus/Grafana یا APM خود.- ردیابی تأخیر، توکنها و هزینه بر اساس نقطه پایانی و کاربر.این امر «رولت مدل» را به یک سرویس مدیریتشده با SLOها و بودجهها تبدیل میکند.---## الگوهای استفاده در دنیای واقعی۱) انعطافپذیری چندفروشندهای- اصلی: مدل سریع/ارزان؛ بازگشت: مدل با دقت بالا در 429/5xx.- مزایا: زمان کارکرد بهتر، کنترل هزینه و کیفیت پایدار.۲) ارتقاء مدل با پرچم ویژگی- از وزنهای روتر برای آزمایش یک مدل جدید برای 5٪ از ترافیک استفاده کنید؛ متریکها را نظارت کنید؛ هنگام پایداری، آن را افزایش دهید.۳) سطوح محصول- سطح رایگان به مدلهای کوچک مسیریابی میشود؛ سطح Pro به مدلهای پریمیوم.۴) رجیستریها و قالبهای اعلان- اعلانها را در پروکسی متمرکز کنید تا سرویسها بهبودها را بدون استقرار مجدد به ارث ببرند.۵) صورتحساب و بودجههای تیمی- هزینه را بر اساس کلید API ردیابی کنید؛ محدودیتهای نرم و سخت را برای هر تیم یا محصول اعمال کنید.---## چک لیست امنیت و انطباق- کلیدهای ارائهدهنده را در مدیر راز خود ذخیره کنید؛ از طریق متغیرهای محیطی در پیکربندی ارجاع دهید.- ویرایش درخواست و پاکسازی PII را در گزارشها روشن کنید.- از کلیدهای API مخصوص سرویس برای پروکسی استفاده کنید؛ به طور منظم بچرخانید.- محدودیتهای نرخ و سهمیه در سطح سازمان تعیین کنید.- لیستهای مجاز/غیرمجاز را برای مدلها و نقاط پایانی اضافه کنید.---## عیبیابی: اصلاحات سریع- «غیرمجاز» از طریق پروکسی: `auth.api_keys` را بررسی کنید و مطمئن شوید که کلاینت شما از `base_url` + کلید صحیح استفاده میکند.- مدل یافت نشد: اطمینان حاصل کنید که `model_list` حاوی نام دوستانهای است که شما فراخوانی میکنید.- تایماوتها: `timeout` را افزایش دهید یا به یک منطقه ارائهدهنده با تأخیر کمتر مسیریابی کنید.- خروجیهای عجیب و غریب: طرحواره JSON + اعتبارسنجی را فعال کنید؛ تلاشهای مجدد و بازگشتها را اضافه کنید.- افزایش هزینهها: کش را روشن کنید؛ ترافیک انبوه را به مدلهای ارزانتر مسیریابی کنید؛ سهمیههای هر کلید را تنظیم کنید.برای اطلاعات بیشتر و آخرین ویژگیها، اسناد رسمی به طور مکرر بهروزرسانی میشوند و ارزش نشانهگذاری دارند. آموزشهایی مانند راهنمای DataCamp برای الگوهای عملی عالی هستند و ویدیوی دوره فشرده مبتدی میتواند به شما کمک کند تا مفاهیم را در عمل ببینید.---## همه را کنار هم بگذارید: اسکلت برنامه مرجع (پایتون FastAPI)```python# app.pyfrom fastapi import FastAPIfrom pydantic import BaseModelfrom litellm import completionimport osclass ChatReq(BaseModel):question: strapp = FastAPI@app.post("/ask")async def ask(req: ChatReq):resp = completion(model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),messages=.### پرسشهای متداولQ1:LiteLLM چیست و چرا باید از آن به جای SDKهای مستقیم ارائهدهنده استفاده کرد؟LiteLLM یک درگاه سازگار با OpenAI برای بیش از ۱۰۰ مدل LLM است که به شما یک API و یک مدل ذهنی میدهد. این ابزار قفل شدن در یک فروشنده را کاهش میدهد، مسیریابی را ساده میکند و ویژگیهای عملیاتی مانند کش، تلاشهای مجدد و ردیابی هزینه را اضافه میکند.Q2:چگونه از LiteLLM با SDK OpenAI استفاده کنم؟URL پایه SDK را به پروکسی LiteLLM اشاره دهید و از کلید API پروکسی خود استفاده کنید. کد شما میتواند یکسان بماند در حالی که پروکسی ارائهدهندگان یا مدلها را در پشت صحنه تعویض میکند.Q3:آیا LiteLLM میتواند پاسخها را استریم کرده و JSON را برگرداند؟بله. از `stream=True` برای دریافت جریانهای توکن و `response_format` با طرحواره JSON برای اعمال خروجیهای ساختاریافته در سراسر ارائهدهندگان استفاده کنید.Q4:چگونه هزینهها را در بین ارائهدهندگان مختلف LLM کنترل کنم؟ثبت گزارش میزان استفاده و تخمین هزینه را فعال کنید، کش را اضافه کنید، محدودیتهای نرخ را تعیین کنید و ترافیک انبوه را از طریق پروکسی به مدلهای ارزانتر مسیریابی کنید. با داشبوردها برای بودجهها و SLOها نظارت کنید.Q5:آیا LiteLLM برای تیمهای تولید مناسب است؟<a114>بله. پروکسی احراز هویت، محدودیتهای نرخ، مسیریابی، قابلیت مشاهده و میانافزار ایمنی را فراهم میکند. این ابزار به عنوان یک دروازه LLM طراحی شده است که حاکمیت را متمرکز میکند در حالی که برنامه شما را با OpenAI سازگار نگه میدارد.
چگونه در ChatPDF مهارت پیدا کنیم: دسترسی سریعتر به اطلاعات از اسناد حجیم

بهترین جایگزین X Auto-Translation برای ترجمه سریع و دقیق اسناد

عدم دسترسی به ترجمه هوش مصنوعی سامسونگ در ایران؟ راهکارهای عملی

ابزارهای ترجمه فارسی: راهنمای عملی برای کار سریعتر و دقیقتر

بهترین جایگزین Grok برای تحقیقات عمیق و مستند

۱۵ ویژگی برتر تولیدکننده تصویر هوش مصنوعی که واقعاً از آنها استفاده خواهید کرد