What is the best LiteLLM tutorial for beginners?

Start with the LiteLLM Crash Course on YouTube for a quick visual walkthrough, then read the official Getting Started guide for the proxy. The DataCamp tutorial provides practical examples you can copy.

How do I use LiteLLM as an OpenAI-compatible proxy?

Run the LiteLLM proxy and point your SDK’s base URL to the proxy’s `/v1` endpoints. Keep provider details in the LiteLLM config so your application code stays portable.

Can LiteLLM route between OpenAI, Anthropic, and Gemini automatically?

Yes. Define models and routing strategies in the LiteLLM config to switch between providers by latency, cost, or quality. You can also set fallbacks for reliability.

How do I enable streaming and tool/function calling with LiteLLM?

Use the OpenAI-compatible API via LiteLLM and enable `stream=True` (or SSE in your SDK). For tool calling, follow the OpenAI function-calling format—LiteLLM forwards it to the target provider.

What’s the fastest way to control costs with LiteLLM?

Centralize requests through the proxy, enable usage logging, and enforce per-key rate limits and budgets. Route different workloads to cost-optimized models and pin versions to avoid surprises.

最佳 LiteLLM 教學：2025 年掌握 LLM Gateway 的指南

如果你正在整合 OpenAI、Azure OpenAI、Anthropic、Gemini、本地模型及其他各種選項，LiteLLM 就是你一直在尋找的萬用 Swiss Army 刀。它作為一個可即插即用、與 OpenAI 兼容的層與代理，讓你的應用只需說一種語言，便可在背後切換模型、供應商與價格。挑戰在於：從哪裡開始，以及哪些資源實際值得花時間學習。

這份實務且解決方案導向的指南精選了 2025 年最佳的 LiteLLM 教學，說明每個資源適合的對象及最快上線的路徑。我們將結合快速入門、深入解析與實戰經驗，供你參考複製。

看完後，你將清楚知道第一個該看或閱讀哪些 LiteLLM 教學，如何啟動 LiteLLM 代理，以及如何整合 OpenAI SDK、串流、重試、速率限制、模型路由和可觀測性。

—

什麼是 LiteLLM（為什麼團隊都信賴它）？

LiteLLM 提供一個與 OpenAI 兼容的 API 與 SDK，讓你可以：

使用一組介面路由多家供應商（OpenAI、Azure OpenAI、Anthropic、Google、Cohere、Together、Ollama 等）。

部署集中代理（LLM gateway），統一定義認證、日誌、成本追蹤和政策。

切換模型時不需重寫應用程式。

如果你正在打造多 LLM 應用，LiteLLM 就是這些模型間的連結核心。官方文件齊全，且有多篇第三方教學涵蓋真實應用案例。

—

2025 年十大最佳 LiteLLM 教學

以下列出頂尖資源、適合對象及學習重點，依清晰度、完整度與實務相關性排名。

1) LiteLLM Crash Course | 入門新手（影片）

推薦：視覺學習者與想於一小時內完成端到端設定的開發者。

優點：涵蓋安裝、Python SDK 基礎、整合 OpenAI 兼容呼叫，並介紹串流等核心功能。

若你從未使用過 LiteLLM，建議從這裡開始。

觀看：LiteLLM Crash Course | 入門新手。

2) DataCamp：LiteLLM — 實例指南（文章）

推薦：偏好以程式碼為主、可複製貼上的開發者。

優點：由 "hello world" 到串流回應，示範如何做基本 API 呼叫及擴展使用模式。

閱讀：LiteLLM: A Guide With Practical Examples。

3) 官方文件：LiteLLM 入門指南（文件）

推薦：有代理/閘道器、政策和路由需求，準備邁向生產的團隊。

優點：提供何時使用代理、如何設定多供應商、模型配置及集中存取的清楚指引。

閱讀：LiteLLM — Getting Started。

4) 使用 LiteLLM Proxy 建立與 OpenAI 兼容的 API

學習內容：在本機啟動 LiteLLM 代理，為多供應商設定環境變數，建立統一的 /v1/chat/completions 端點。

重要性：大多數生產團隊透過代理實現可觀測性及政策控制。

可搭配官方入門指南及你喜愛的程式語言 SDK 使用。

5) 多供應商路由與備援策略

學習內容：設定供應商列表、健康檢查及自動備援對策，以應付停機或速率限制。

重要性：保持應用彈性。例如主路由至 GPT-4o，延遲升高時備援 Claude 3.5 或 Gemini。

6) 成本控制與使用監控

學習內容：如何記錄每次請求成本、強制配額及以團隊/應用標籤分類用量。

重要性：LiteLLM 可成為跨供應商的單一管理介面。及早加入警示和預算控管，避免財務長催促。

7) 串流、工具使用與結構化輸出

學習內容：實作伺服器事件串流（SSE）、函式/工具呼叫及 JSON Schema 格式輸出。

重要性：現代 AI 應用依賴快速互動體驗與穩定函式呼叫，LiteLLM 透過與 OpenAI 兼容的介面支持這些模式。

8) 本地 + 雲端混合：經由 LiteLLM 使用 Ollama

學習內容：透過 Ollama 指向本地模型，並保留雲端模型，按工作、延遲或成本路由。

重要性：本地處理私密任務，複雜提示則突發使用雲端。

9) 速率限制、重試與斷路器

學習內容：設定每模型速率限制、指數回退機制及快速失敗模式。

重要性：避免流量擁擠、提升載入下的可靠性。

10) 可觀測性：日誌、追蹤及資料脫敏

學習內容：集中管理所有供應商的日誌及追蹤，脫敏個資，並將遙測資料發送到你喜愛的 APM/分析工具。

重要性：沒有代理想要除錯多 LLM 應用非常困難，LiteLLM 讓這件事變得可行。

—

快速入門：你的前 15 分鐘使用 LiteLLM

看完快速課程並略讀文件後，跟著這流程操作。

安裝並設定金鑰

pip install litellm
export OPENAI_API_KEY=sk-...
# 選填：加入更多供應商
export ANTHROPIC_API_KEY=...
export GOOGLE_API_KEY=...

單檔 OpenAI 兼容聊天示例

from litellm import completion
resp = completion(
model="gpt-4o", # 或 "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"
messages=.
- 執行上方快速入門程式碼。
- 目標：透過 LiteLLM 發出第一個 OpenAI 兼容請求。
- 實作者
- 閱讀 DataCamp 教學，延伸使用串流與重試功能。
- 加入兩個供應商並測試備援。
- 團隊／生產負責人
- 研讀官方入門指南。
- 部署代理，加入可觀測性與成本追蹤。
- 實施速率限制與個資脫敏策略。
—
## 深入解析：你每週會用到的模式
### OpenAI 兼容做為介面合約
- 將 OpenAI API 的形態視為你的應用合約。所有請求都送至 LiteLLM 代理的 `/v1/*` 端點。
- 透過設定切換模型（例如 `gpt-4o` → `claude-3-5`），而非改寫程式碼。
### 按使用場景進行模型路由
- 對延遲敏感的流程路由到快速且便宜的模型。
- 推理流程則路由質量較高、適合檢索增強生成（RAG）或工具使用的模型。
- 隱私需求路由到本地或 Ollama 處理含個資的段落。
### 成本護欄
- 請求附加 `user_id`/`team` 標籤。
- 每團隊／模型設定預算。
- 紀錄 token 使用量於中央儲存，並在異常時警告。
### 彈性設計
- 啟用帶抖動的重試機制。
- 針對供應商設定逾時與斷路器，處理重複失敗。
- 定義供應商優先順序及明確備援。
### 可觀測性
- 擷取請求/回應元資料、延遲直方圖及模型版本。
- 日誌中脫敏秘密或個人識別資訊 (PII)。
- 追蹤跨服務的呼叫流程，快速定位延遲。
—
## LiteLLM 代理範例設定（生產就緒起點）
```yaml
# config.yaml
model_list:
- model_name: gpt-4o
  litellm_params:
    model: openai/gpt-4o
    api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
  litellm_params:
    model: anthropic/claude-3-5-sonnet
    api_key: ${ANTHROPIC_API_KEY}
- model_name: gemini-1.5-pro
  litellm_params:
    model: google/gemini-1.5-pro
    api_key: ${GOOGLE_API_KEY}
defaults:
  timeout: 30s
  max_tokens: 1024
routing:
- name: low-latency
  models: .
- 一篇實務且舉例豐富的文章。
- 官方 LiteLLM 文件的入門與代理最佳實踐。
—
## 行動計劃：未來 7 天的安排
第 1–2 天：完成快速課程與快速入門；發出第一個代理請求。
第 3–4 天：加入第二供應商與串流功能；設定逾時、重試。
第 5 天：部署代理並載入設定；依使用場景路由（延遲 vs 推理）。
第 6 天：增加日誌、成本追蹤與脫敏功能。
第 7 天：負載測試；模擬供應商故障；驗證備援。
—
## 重點整理
- LiteLLM 是最快讓多供應商 LLM 應用擺脫供應商綁定的路徑。
- 先從 OpenAI 兼容介面開始，再進階到代理做治理。
- 建議早期投入路由、彈性與可觀測性，這些你第二週就會用到，而非六個月後。
- 上述教學涵蓋你日常使用 80% 的範圍，剩下的就是你產品的獨家秘訣。
### 常見問題（FAQ）
Q1: 初學者適合哪個 LiteLLM 教學？
建議先看 YouTube 上的 LiteLLM Crash Course，快速視覺導覽，再閱覽官方代理入門指南。DataCamp 教學則提供可複製的實務範例。
Q2: 如何以 LiteLLM 當作 OpenAI 兼容代理？
運行 LiteLLM 代理，將 SDK 的基底 URL 指向代理的 `/v1` 端點。將供應商細節放在 LiteLLM 設定，讓應用程式碼可攜。
Q3: LiteLLM 可以自動在 OpenAI、Anthropic 和 Gemini 間路由嗎？
可以。只要在 LiteLLM 設定中定義模型及路由策略，即可依延遲、成本或品質切換供應商，也可設定備援以提升可靠度。
Q4: 如何啟用 LiteLLM 的串流與工具/函式呼叫？
透過 LiteLLM 的 OpenAI 兼容 API 並啟用`stream=True`（或 SDK 中的 SSE）。工具呼叫遵循 OpenAI 的函式呼叫格式，LiteLLM 將其轉發至目標供應商。
Q5: LiteLLM 控制成本最快的方法是什麼？
透過代理集中請求，啟用用量日誌，強制每金鑰速率限制與預算控管。針對不同工作負載路由至成本優化模型，並鎖定版本避免突發狀況。