What is the best LiteLLM tutorial for beginners?

Start with the LiteLLM Crash Course on YouTube for a quick visual walkthrough, then read the official Getting Started guide for the proxy. The DataCamp tutorial provides practical examples you can copy.

How do I use LiteLLM as an OpenAI-compatible proxy?

Run the LiteLLM proxy and point your SDK’s base URL to the proxy’s `/v1` endpoints. Keep provider details in the LiteLLM config so your application code stays portable.

Can LiteLLM route between OpenAI, Anthropic, and Gemini automatically?

Yes. Define models and routing strategies in the LiteLLM config to switch between providers by latency, cost, or quality. You can also set fallbacks for reliability.

How do I enable streaming and tool/function calling with LiteLLM?

Use the OpenAI-compatible API via LiteLLM and enable `stream=True` (or SSE in your SDK). For tool calling, follow the OpenAI function-calling format—LiteLLM forwards it to the target provider.

What’s the fastest way to control costs with LiteLLM?

Centralize requests through the proxy, enable usage logging, and enforce per-key rate limits and budgets. Route different workloads to cost-optimized models and pin versions to avoid surprises.

บทเรียน LiteLLM ที่ดีที่สุด: คู่มือปี 2025 ของคุณสำหรับการครอบครอง LLM Gateway

หากคุณกำลังผสานรวม OpenAI, Azure OpenAI, Anthropic, Gemini, โมเดลภายในเครื่อง และทุกอย่างในระหว่างนั้น LiteLLM คือเครื่องมือแบบ Swiss Army ที่คุณตามหา มันทำหน้าที่เป็นเลเยอร์ที่เข้ากันได้กับ OpenAI และพร็อกซี เพื่อให้แอปของคุณพูดภาษาเดียวกันในขณะที่คุณเปลี่ยนโมเดล ผู้ให้บริการ และราคาตามหลัง ความท้าทาย? คือการหาว่าจะเริ่มจากตรงไหน และแหล่งข้อมูลใดคุ้มค่ากับเวลาของคุณจริงๆ

คู่มือที่ตรงประเด็นและเน้นทางออกนี้ รวบรวมบทเรียน LiteLLM ที่ดีที่สุดในปี 2025 แสดงให้เห็นว่าแต่ละแหล่งเหมาะกับใคร และเส้นทางที่เร็วที่สุดสู่การใช้งานจริง เราจะผสมผสานชัยชนะอย่างรวดเร็ว การเจาะลึก และรูปแบบที่ผ่านการทดสอบที่คุณสามารถคัดลอกได้

เมื่อจบแล้ว คุณจะรู้ว่าเริ่มดูหรืออ่านบทเรียน LiteLLM ไหนก่อน วิธีตั้งค่า LiteLLM proxy และวิธีรวมกับ OpenAI SDKs, การสตรีม, การ retry, การจำกัดอัตรา, การกำหนดเส้นทางโมเดล และการสังเกตการณ์อย่างไร

—

LiteLLM คืออะไร (และทำไมทีมถึงยกย่อง)?

LiteLLM มี API และ SDK ที่เข้ากันได้กับ OpenAI ซึ่งช่วยให้คุณ:

กำหนดเส้นทางไปยังผู้ให้บริการหลายราย (OpenAI, Azure OpenAI, Anthropic, Google, Cohere, Together, Ollama และอื่นๆ) ด้วยอินเทอร์เฟซเดียว

ติดตั้งพร็อกซีส่วนกลาง (LLM gateway) เพื่อมาตรฐานการตรวจสอบสิทธิ์ การบันทึก การติดตามต้นทุน และนโยบาย

สลับโมเดลโดยไม่ต้องเขียนแอปใหม่

หากคุณสร้างแอป multi-LLM LiteLLM คือเนื้อเยื่อเชื่อมต่อ เอกสารอย่างเป็นทางการแข็งแกร่ง และตอนนี้มีบทเรียนจากบุคคลที่สามหลายชิ้นที่ครอบคลุมกรณีใช้งานจริง

—

บทเรียน LiteLLM ที่ดีที่สุด 10 อันดับในปี 2025

ด้านล่างนี้คือแหล่งข้อมูลยอดนิยม เหมาะกับใคร และคุณจะได้เรียนรู้อะไร ถูกจัดอันดับตามความชัดเจน ความครบถ้วน และความเกี่ยวข้องกับการใช้งานจริง

1) LiteLLM Crash Course | สำหรับผู้เริ่มต้นอย่างสมบูรณ์ (วิดีโอ)

เหมาะสำหรับ: ผู้เรียนสายภาพและนักพัฒนาที่ต้องการตั้งค่าครบภายในหนึ่งชั่วโมง

เหตุผลที่ดี: ครอบคลุมการติดตั้ง พื้นฐาน Python SDK และวิธีผสานรวมคำขอที่เข้ากันกับ OpenAI พร้อมทัวร์ฟีเจอร์หลักเช่นการสตรีม

เริ่มที่นี่ถ้าคุณไม่เคยใช้ LiteLLM มาก่อน

รับชม: LiteLLM Crash Course | สำหรับผู้เริ่มต้นอย่างสมบูรณ์

2) DataCamp: LiteLLM — คู่มือพร้อมตัวอย่างปฏิบัติ (บทความ)

เหมาะสำหรับ: นักพัฒนาที่ชอบโค้ดตัวอย่างพร้อมใช้งาน

เหตุผลที่ดี: เดินผ่านตั้งแต่ “hello world” ถึงการตอบสนองแบบสตรีม แสดงวิธีการทำคำขอ API เบื้องต้นและขยายรูปแบบการใช้งาน

อ่าน: LiteLLM: คู่มือพร้อมตัวอย่างปฏิบัติ

3) เอกสารอย่างเป็นทางการ: LiteLLM เริ่มต้นใช้งาน (เอกสาร)

เหมาะสำหรับ: ทีมที่ย้ายสู่การใช้งานจริงด้วยพร็อกซี/เกตเวย์ นโยบาย และความต้องการในการกำหนดเส้นทาง

เหตุผลที่ดี: คำแนะนำชัดเจนว่าเมื่อไหร่ควรใช้พร็อกซี วิธีเชื่อมต่อกับผู้ให้บริการหลายราย กำหนดค่าโมเดล และรวมศูนย์การเข้าถึง

อ่าน: LiteLLM — เริ่มต้นใช้งาน

4) สร้าง API ที่เข้ากันได้กับ OpenAI ด้วย LiteLLM Proxy

สิ่งที่คุณจะได้เรียนรู้: วิธีตั้งค่า LiteLLM proxy ในเครื่อง กำหนดค่าตัวแปรสภาพแวดล้อมสำหรับผู้ให้บริการหลายราย สร้าง endpoint รวม /v1/chat/completions

ทำไมจึงสำคัญ: ทีมส่วนใหญ่ที่ใช้งานจริงมาตรฐานกับพร็อกซีเพื่อปลดล็อกความสามารถในการสังเกตการณ์และนโยบาย

จับคู่กับเอกสาร Getting Started อย่างเป็นทางการและ SDK ภาษาโปรดของคุณ

5) การกำหนดเส้นทางหลายผู้ให้บริการและการสำรอง

สิ่งที่คุณจะได้เรียนรู้: การกำหนดรายการผู้ให้บริการ ตรวจสุขภาพ และ fallback อัตโนมัติเพื่อจัดการกับการขัดข้องหรือตัวจำกัดอัตรา

ทำไมจึงสำคัญ: รักษาความทนทานของแอป เช่น กำหนดเส้นทางหลักไปยัง GPT-4o และ fallback ไปยัง Claude 3.5 หรือ Gemini หากความหน่วงเพิ่มขึ้น

6) การควบคุมต้นทุนและการมอนิเตอร์การใช้งาน

สิ่งที่คุณจะได้เรียนรู้: วิธีการบันทึกต้นทุนต่อคำขอ บังคับโควต้า และติดแท็กการใช้งานตามทีม/แอป

ทำไมจึงสำคัญ: LiteLLM เป็นหน้าต่างเดียวของคุณสำหรับผู้ให้บริการทุกคน เพิ่มการแจ้งเตือนและงบประมาณก่อนที่ CFO ของคุณจะถาม

7) การสตรีม การใช้เครื่องมือ และผลลัพธ์แบบมีโครงสร้าง

สิ่งที่คุณจะได้เรียนรู้: การใช้งาน server-sent events (SSE) สตรีมมิ่ง การเรียกฟังก์ชัน/เครื่องมือ และผลลัพธ์ JSON schema

ทำไมจึงสำคัญ: แอป AI สมัยใหม่ต้องการ UX ที่รวดเร็วโต้ตอบได้และการเรียกฟังก์ชันที่เชื่อถือได้ LiteLLM รองรับรูปแบบเหล่านี้ผ่านอินเทอร์เฟซที่เข้ากันได้กับ OpenAI

8) แบบผสม Local + Cloud: Ollama ผ่าน LiteLLM

สิ่งที่คุณจะได้เรียนรู้: ชี้ LiteLLM ไปที่โมเดลในเครื่องผ่าน Ollama พร้อมเก็บโมเดลคลาวด์ไว้ และกำหนดเส้นทางตามงาน ความหน่วง หรือค่าใช้จ่าย

ทำไมจึงสำคัญ: รันงานส่วนตัวในเครื่อง ระเบิดไปที่คลาวด์สำหรับคำสั่งซับซ้อน

9) การจำกัดอัตรา การ retry และตัวตัดวงจร

สิ่งที่คุณจะได้เรียนรู้: กำหนดขีดจำกัดอัตราต่อโมเดล, การหน่วงแบบ exponential backoff และรูปแบบ fail-fast

ทำไมจึงสำคัญ: ป้องกันฝูงชนใหญ่ที่พร้อมกันและเพิ่มความน่าเชื่อถือเมื่อโหลดสูง

10) การสังเกตการณ์: บันทึก, ติดตาม, และการแก้ไขข้อมูลส่วนตัว

สิ่งที่คุณจะได้เรียนรู้: รวบรวมบันทึกและติดตามจากผู้ให้บริการทั้งหมด แก้ไขข้อมูลส่วนบุคคล และส่งเทเลเมทรีไปยัง APM/วิเคราะห์ที่โปรดปราน

ทำไมจึงสำคัญ: การดีบักแอป multi-LLM โดยไม่มีเกตเวย์เป็นเรื่องยาก LiteLLM ทำให้จัดการได้ง่ายขึ้น

—

เริ่มต้นอย่างรวดเร็ว: 15 นาทีแรกของคุณกับ LiteLLM

ทำตามลำดับนี้หลังจากดู crash course และสแกนเอกสาร

ติดตั้งและตั้งค่ากุญแจ

pip install litellm
export OPENAI_API_KEY=sk-...
# ตัวเลือกเพิ่มเติม: ผู้ให้บริการอื่น
export ANTHROPIC_API_KEY=...
export GOOGLE_API_KEY=...

แชทแบบไฟล์เดียวที่เข้ากันได้กับ OpenAI

from litellm import completion
resp = completion(
model="gpt-4o", # หรือ "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"
messages=.
- รันโค้ด quickstart ข้างต้น
- เป้าหมาย: ทำคำขอ OpenAI-compatible ครั้งแรกผ่าน LiteLLM
- สำหรับผู้สร้างที่ปฏิบัติได้
- อ่านบทเรียน DataCamp และเพิ่มตัวอย่างด้วยสตรีมมิ่งและ retry
- เพิ่มสองผู้ให้บริการและทดสอบ fallback
- สำหรับเจ้าของทีม/การผลิต
- ศึกษาคู่มือ Getting Started อย่างเป็นทางการ
- ตั้งค่าพร็อกซี เพิ่มการสังเกตการณ์และติดตามต้นทุน
- บังคับใช้ขีดจำกัดอัตราและนโยบายแก้ไขข้อมูลส่วนบุคคล
—
## เจาะลึก: รูปแบบที่คุณจะใช้ทุกสัปดาห์
### ความเข้ากันได้กับ OpenAI เป็นสัญญาอินเทอร์เฟซ
- ถือว่า API รูปแบบ OpenAI เป็นสัญญาแอปของคุณ คำขอทั้งหมดไปยัง endpoint `/v1/*` ของ LiteLLM proxy
- สลับโมเดล (เช่น `gpt-4o` → `claude-3-5`) ผ่านการตั้งค่า ไม่ใช่โค้ด
### การกำหนดเส้นทางโมเดลตามกรณีใช้
- เส้นทางตอบสนองเร็ว: กำหนดเส้นทางไปยังโมเดลที่เร็วและถูกกว่า
- เส้นทางตรรกะ: กำหนดเส้นทางไปยังโมเดลคุณภาพสูงสำหรับการสร้างข้อความแบบเรียกคืนเสริม (RAG) หรือการใช้เครื่องมือ
- เส้นทางความเป็นส่วนตัว: กำหนดเส้นทางไปยังโมเดลในเครื่อง/Ollama สำหรับข้อมูลส่วนบุคคล
### ยามรักษาต้นทุน
- ติดแท็กคำขอด้วย `user_id`/`team`
- ตั้งงบประมาณต่อทีม/โมเดล
- บันทึกการใช้งานโทเค็นไว้ที่ที่เก็บกลางและแจ้งเตือนเมื่อผิดปกติ
### ความทนทาน
- เปิดใช้งาน retry พร้อม jitter
- กำหนดเวลาหมดอายุต่อผู้ให้บริการ และตัวตัดวงจรเมื่อล้มเหลวซ้ำ
- กำหนดลำดับความสำคัญผู้ให้บริการและ fallback อย่างชัดเจน
### การสังเกตการณ์
- เก็บ metadata ของคำขอ/คำตอบ, ฮิสโตแกรมความหน่วง, และรุ่นโมเดล/เวอร์ชัน
- แก้ไขความลับ/ข้อมูลส่วนบุคคลในบันทึก
- เชื่อมโยงการติดตามข้ามบริการเพื่อค้นหาคำขอล่าช้าอย่างรวดเร็ว
—
## ตัวอย่างการตั้งค่า LiteLLM Proxy (พร้อมใช้งานสำหรับการผลิต)
```yaml
# config.yaml
model_list:
- model_name: gpt-4o
litellm_params:
model: openai/gpt-4o
api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
litellm_params:
model: anthropic/claude-3-5-sonnet
api_key: ${ANTHROPIC_API_KEY}
- model_name: gemini-1.5-pro
litellm_params:
model: google/gemini-1.5-pro
api_key: ${GOOGLE_API_KEY}
defaults:
timeout: 30s
max_tokens: 1024
routing:
- name: low-latency
models: .
- บทความที่เน้นตัวอย่างปฏิบัติจริง
- เอกสาร LiteLLM อย่างเป็นทางการสำหรับการเริ่มต้นและแนวทางปฏิบัติที่ดีที่สุดของพร็อกซี
—
## แผนปฏิบัติการ: 7 วันข้างหน้าของคุณ
วัน 1–2: ดู crash course และ quickstart ทำคำขอผ่านพร็อกซีครั้งแรกของคุณ
วัน 3–4: เพิ่มผู้ให้บริการที่สองและสตรีมมิ่ง กำหนดค่า timeout, retry
วัน 5: ตั้งค่าพร็อกซีพร้อม config กำหนดเส้นทางตามกรณีใช้งาน (ความหน่วงกับตรรกะ)
วัน 6: เพิ่มการบันทึก, ติดตามต้นทุน, และแก้ไขข้อมูลส่วนบุคคล
วัน 7: ทดสอบโหลด จำลองผู้ให้บริการล้มเหลว ตรวจสอบ fallback
—
## ข้อสรุปสำคัญ
- LiteLLM คือเส้นทางที่เร็วที่สุดสู่แอป LLM หลายผู้ให้บริการโดยไม่ถูกล็อกกับผู้ขายใดผู้ขายหนึ่ง
- เริ่มด้วยอินเทอร์เฟซที่เข้ากันได้กับ OpenAI แล้วค่อยยกระดับไปพร็อกซีเพื่อการกำกับดูแล
- ลงทุนตั้งแต่เนิ่นๆ ในการกำหนดเส้นทาง ความทนทาน และการสังเกตการณ์ เพราะคุณจะต้องใช้ในสัปดาห์ที่สอง ไม่ใช่เดือนที่หก
- บทเรียนด้านบนครอบคลุม 80% ของสิ่งที่คุณจะใช้งานประจำวัน ส่วนที่เหลือคือความลับเฉพาะของผลิตภัณฑ์คุณ
### คำถามที่ถามบ่อย
Q1: บทเรียน LiteLLM ที่ดีที่สุดสำหรับผู้เริ่มต้นคืออะไร?
เริ่มจาก LiteLLM Crash Course บน YouTube เพื่อดูภาพรวมแบบเห็นได้ชัดเจนรวดเร็ว จากนั้นอ่านคู่มือ Getting Started อย่างเป็นทางการสำหรับพร็อกซี บทเรียน DataCamp ให้ตัวอย่างปฏิบัติที่คุณสามารถคัดลอกได้
Q2: ฉันจะใช้ LiteLLM เป็นพร็อกซีที่เข้ากันได้กับ OpenAI อย่างไร?
รัน LiteLLM proxy และชี้ base URL ของ SDK ของคุณไปที่ endpoint `/v1` ของพร็อกซี เก็บรายละเอียดผู้ให้บริการไว้ใน config ของ LiteLLM เพื่อให้โค้ดแอปของคุณพกพาได้
Q3: LiteLLM สามารถกำหนดเส้นทางระหว่าง OpenAI, Anthropic และ Gemini อัตโนมัติได้ไหม?
ได้ กำหนดโมเดลและกลยุทธ์การกำหนดเส้นทางใน config ของ LiteLLM เพื่อสลับผู้ให้บริการตามความหน่วง ต้นทุน หรือคุณภาพ คุณยังสามารถตั้ง fallback เพื่อความน่าเชื่อถือ
Q4: ฉันจะเปิดใช้งานการสตรีมและการเรียกเครื่องมือ/ฟังก์ชันกับ LiteLLM ได้อย่างไร?
ใช้ API ที่เข้ากันได้กับ OpenAI ผ่าน LiteLLM และเปิดใช้งาน `stream=True` (หรือ SSE ใน SDK ของคุณ) สำหรับการเรียกเครื่องมือ ให้ปฏิบัติตามรูปแบบการเรียกฟังก์ชันของ OpenAI — LiteLLM จะส่งต่อไปยังผู้ให้บริการเป้าหมาย
Q5: วิธีที่เร็วที่สุดในการควบคุมต้นทุนด้วย LiteLLM คืออะไร?
รวมคำขอผ่านพร็อกซี เปิดใช้งานการบันทึกการใช้งาน และบังคับใช้ขีดจำกัดอัตราและงบประมาณต่อคีย์ กำหนดเส้นทางงานต่างๆ ไปยังโมเดลที่คุ้มค่า และตรึงเวอร์ชันเพื่อหลีกเลี่ยงความไม่คาดคิด