อัปเดตเมื่อ 25 ก.ย. 2025
6 นาที
# Pythonpip install litellm# Node.jsnpm install litellm# ตัวอย่าง: การใช้ OpenAI + Anthropic + Mistralexport OPENAI_API_KEY=sk-...export ANTHROPIC_API_KEY=sk-ant-...export MISTRAL_API_KEY=sk-mis-...from litellm import completionresp = completion(model="gpt-4o-mini", # หรือ "anthropic/claude-3-5-sonnet", "mistral/mistral-large"messages=.---## การสตรีม, เครื่องมือ และโหมด JSON### การสตรีมการตอบสนอง```pythonfrom litellm import completionfor chunk in completion(model="gpt-4o-mini",messages=.### การใช้โทเค็นและค่าใช้จ่ายLiteLLM สามารถติดตามการใช้โทเค็นและประมาณค่าใช้จ่ายต่อคำขอ โมเดล หรือโปรเจ็กต์ ด้วยพร็อกซี คุณสามารถส่งออกการใช้งานไปยังบันทึก แดชบอร์ด หรือ Billing Sink สิ่งนี้มีค่ามากเมื่อคุณรวมผู้จำหน่ายที่มีราคาแตกต่างกัน---## พร็อกซี LiteLLM (LLM Gateway)หากคุณเป็นทีมหรือแพลตฟอร์ม พร็อกซีคือ Superpower ที่แท้จริง: บริการส่วนกลางที่มีการกำหนดเส้นทาง การตรวจสอบสิทธิ์ การจำกัดอัตรา การบันทึก และการสังเกต คุณโต้ตอบกับมันโดยใช้อินเทอร์เฟซ OpenAI API ดังนั้นโค้ดแอปของคุณจึงแทบไม่มีการเปลี่ยนแปลง### เริ่มพร็อกซี```bash# รันภายในเครื่องที่ง่ายที่สุดlitellm --port 4000/v1/chat/completions ชี้ Client OpenAI ที่มีอยู่ของคุณไปที่ ` และคุณก็พร้อมแล้วconfig.yaml:model_list:- model_name: gpt-4o-minilitellm_params:model: openai/gpt-4o-miniapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}router:strategy: simple_weightedroutes:- model: gpt-4o-miniweight: 0.6- model: claude-3-5-sonnetweight: 0.4rate_limits:requests_per_minute: 120logging:level: infosink: stdoutauth:api_keys:- key: svc-app-123litellm --config config.yaml --port 4000from openai import OpenAIclient = OpenAI(base_url=" api_key="svc-app-123")resp = client.chat.completions.create(model="gpt-4o-mini",messages=.---## การกำหนดเส้นทางขั้นสูง: Latency, ค่าใช้จ่าย หรือความน่าเชื่อถือคุณสามารถใช้กลยุทธ์การกำหนดเส้นทาง เช่น:- Weighted Round-Robin ไปยัง A/B models- Lowest-latency-first ตามภูมิภาค- Cost-aware routing สำหรับ Endpoint ที่ไม่สำคัญ- Fallback-on-error/retry ข้ามผู้ให้บริการด้วยนโยบาย Router คุณสามารถพูดได้ว่า “ชอบราคาถูก สำรองไปยังพรีเมียมสำหรับ Prompt ที่ยาก” สิ่งนี้ให้ความพร้อมใช้งานสูงและงบประมาณที่คาดการณ์ได้---## Guardrails, การกลั่นกรอง และความปลอดภัยเพิ่ม Middleware ก่อนและหลังการประมวลผลเพื่อลบ PII บังคับใช้ตัวกรองความปลอดภัย หรือกลั่นกรองเอาต์พุตก่อนที่จะส่งคืนให้กับ Client รวมการกลั่นกรองของผู้ให้บริการดั้งเดิม (เช่น OpenAI, Google) กับการตรวจสอบนโยบายของคุณเองในพร็อกซี ตัวอย่าง: กำหนดให้มีการตรวจสอบ Schema JSON และขอใหม่เมื่อไม่ถูกต้อง---## การสังเกตและการบันทึก- เปิดใช้งานการบันทึกคำขอ/การตอบสนองด้วยการแก้ไข- ส่งออกเมตริกไปยัง Prometheus/Grafana หรือ APM ของคุณ- ติดตาม Latency, โทเค็น และค่าใช้จ่ายตาม Endpoint และผู้ใช้สิ่งนี้เปลี่ยน “Model Roulette” ให้เป็นบริการที่มีการจัดการพร้อม SLO และงบประมาณ---## รูปแบบการใช้งานจริง1) ความยืดหยุ่นของผู้จำหน่ายหลายราย- Primary: โมเดลที่รวดเร็ว/ราคาถูก; Fallback: โมเดลที่มีความแม่นยำสูงบน 429/5xx- ข้อดี: Uptime ที่ดีขึ้น การควบคุมค่าใช้จ่าย และคุณภาพที่เสถียร2) อัปเกรดโมเดล Feature Flag- ใช้ Router Weights เพื่อ Canary โมเดลใหม่เป็น 5% ของ Traffic; ตรวจสอบเมตริก; เพิ่มขึ้นเมื่อเสถียร3) ระดับผลิตภัณฑ์- Free Tier กำหนดเส้นทางไปยังโมเดลขนาดเล็ก; Pro Tier ไปยังโมเดลพรีเมียม4) Prompt Registries และ Templates- รวมศูนย์ Prompt ในพร็อกซีเพื่อให้ Service สืบทอดการปรับปรุงโดยไม่ต้อง Redeploy5) การเรียกเก็บเงินและงบประมาณของทีม- ติดตามการใช้จ่ายตาม API Key; บังคับใช้ Soft และ Hard Limits ต่อทีมหรือผลิตภัณฑ์---## Security and Compliance Checklist- จัดเก็บ Provider Key ใน Secret Manager ของคุณ; อ้างอิงผ่าน Env Vars ใน Config- เปิด Request Redaction และ PII Scrubbing ใน Logs- ใช้ API Key ต่อ Service สำหรับพร็อกซี; หมุนเวียนเป็นประจำ- ตั้งค่า Org-wide Rate Limits และ Quotas- เพิ่ม Allowlists/Denylists สำหรับโมเดลและ Endpoint---## การแก้ไขปัญหา: การแก้ไขอย่างรวดเร็ว- “Unauthorized” ผ่านพร็อกซี: ตรวจสอบ `auth.api_keys` และ Client ของคุณใช้ `base_url` + คีย์ที่ถูกต้อง- ไม่พบโมเดล: ตรวจสอบให้แน่ใจว่า `model_list` มีชื่อที่เรียกง่ายที่คุณกำลังเรียก- Timeouts: เพิ่ม `timeout` หรือกำหนดเส้นทางไปยัง Provider Region ที่มี Latency ต่ำกว่า- เอาต์พุตที่แปลก: เปิดใช้งาน JSON Schema + Validation; เพิ่ม Retries และ Fallbacks- Cost Spikes: เปิดใช้งาน Caching; กำหนดเส้นทาง Bulk Traffic ไปยังโมเดลที่ถูกกว่า; ตั้งค่า Per-key Quotasสำหรับการเจาะลึกและคุณสมบัติล่าสุด เอกสารอย่างเป็นทางการจะมีการอัปเดตบ่อยครั้งและควรค่าแก่การบุ๊กมาร์ก บทช่วยสอนเช่นคู่มือของ DataCamp เหมาะสำหรับรูปแบบการใช้งานจริง และวิดีโอ Crash Course สำหรับผู้เริ่มต้นสามารถช่วยให้คุณเห็นแนวคิดในการปฏิบัติจริง---## รวบรวมทุกอย่างเข้าด้วยกัน: โครงสร้างแอปอ้างอิง (Python FastAPI)```python# app.pyfrom fastapi import FastAPIfrom pydantic import BaseModelfrom litellm import completionimport osclass ChatReq(BaseModel):question: strapp = FastAPI@app.post("/ask")async def ask(req: ChatReq):resp = completion(model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),messages=.### FAQQ1: LiteLLM คืออะไร และเหตุใดจึงควรใช้แทน Provider SDKs โดยตรงLiteLLM เป็น Gateway ที่เข้ากันได้กับ OpenAI สำหรับ LLM กว่า 100 รายการ ทำให้คุณมี API เดียวและความเข้าใจเดียว มันลดการผูกมัดกับผู้จำหน่าย ลดความซับซ้อนในการกำหนดเส้นทาง และเพิ่มคุณสมบัติ Ops เช่น Caching, Retries และการติดตามค่าใช้จ่ายQ2: ฉันจะใช้ LiteLLM กับ OpenAI SDK ได้อย่างไรชี้ Base URL ของ SDK ไปยังพร็อกซี LiteLLM และใช้ API Key ของพร็อกซี โค้ดของคุณสามารถคงเดิมได้ในขณะที่พร็อกซีสลับผู้ให้บริการหรือโมเดลเบื้องหลังQ3: LiteLLM สามารถสตรีมการตอบสนองและส่งคืน JSON ได้หรือไม่ได้ ใช้ `stream=True` เพื่อรับ Token Streams และ `response_format` พร้อม JSON Schema เพื่อบังคับใช้ Structured Outputs ข้ามผู้ให้บริการQ4: ฉันจะควบคุมค่าใช้จ่ายข้ามผู้ให้บริการ LLM ที่แตกต่างกันได้อย่างไรเปิดใช้งาน Usage Logging และ Cost Estimation เพิ่ม Caching ตั้งค่า Rate Limits และกำหนดเส้นทาง Bulk Traffic ไปยังโมเดลที่ถูกกว่าผ่านพร็อกซี ตรวจสอบด้วยแดชบอร์ดสำหรับงบประมาณและ SLOsQ5: LiteLLM เหมาะสำหรับทีมงาน Production หรือไม่ใช่ พร็อกซีให้การตรวจสอบสิทธิ์ การจำกัดอัตรา การกำหนดเส้นทาง การสังเกต และ Safety Middleware มันถูกออกแบบมาให้เป็น LLM Gateway ที่รวมศูนย์การกำกับดูแลในขณะที่ทำให้แอปของคุณเข้ากันได้กับ OpenAI
วิธีเชี่ยวชาญการใช้ ChatPDF: ได้ข้อมูลเชิงลึกเร็วขึ้นจากเอกสารหนาแน่น

ทางเลือกที่ดีที่สุดสำหรับ X Auto-Translation เพื่อเอกสารที่รวดเร็วและแม่นยำ

ไม่สามารถใช้ฟีเจอร์แปลภาษา AI ของ Samsung ในอิหร่านได้? วิธีแก้ไขที่ใช้งานได้จริง

เครื่องมือแปลภาษาเปอร์เซีย: คู่มือใช้งานจริงเพื่อการทำงานที่รวดเร็วและแม่นยำ

ทางเลือกที่ดีที่สุดแทน Grok สำหรับการวิจัยเชิงลึกที่มีการอ้างอิง

15 ฟีเจอร์เด่นของ AI Image Generator ที่คุณจะได้ใช้จริง