What is the best LiteLLM tutorial for beginners?

Start with the LiteLLM Crash Course on YouTube for a quick visual walkthrough, then read the official Getting Started guide for the proxy. The DataCamp tutorial provides practical examples you can copy.

How do I use LiteLLM as an OpenAI-compatible proxy?

Run the LiteLLM proxy and point your SDK’s base URL to the proxy’s `/v1` endpoints. Keep provider details in the LiteLLM config so your application code stays portable.

Can LiteLLM route between OpenAI, Anthropic, and Gemini automatically?

Yes. Define models and routing strategies in the LiteLLM config to switch between providers by latency, cost, or quality. You can also set fallbacks for reliability.

How do I enable streaming and tool/function calling with LiteLLM?

Use the OpenAI-compatible API via LiteLLM and enable `stream=True` (or SSE in your SDK). For tool calling, follow the OpenAI function-calling format—LiteLLM forwards it to the target provider.

What’s the fastest way to control costs with LiteLLM?

Centralize requests through the proxy, enable usage logging, and enforce per-key rate limits and budgets. Route different workloads to cost-optimized models and pin versions to avoid surprises.

Najboljše vadnice za LiteLLM: Vaš vodnik za obvladovanje prehoda LLM v letu 2025

Če povezujete OpenAI, Azure OpenAI, Anthropic, Gemini, lokalne modele in vse vmes, je LiteLLM švicarski nož, ki ste ga iskali. Deluje kot nadomestni sloj, združljiv z OpenAI, in posrednik, tako da lahko vaše aplikacije govorijo en jezik, medtem ko v ozadju zamenjujete modele, ponudnike in cene. Izziv? Ugotoviti, kje začeti – in katere vire je dejansko vredno vašega časa.

Ta praktičen, na rešitve usmerjen vodnik izbira najboljše vadnice za LiteLLM v letu 2025, vam pokaže, komu je posamezen vir namenjen, in najhitrejšo pot do produkcije. Združili bomo hitre zmage, poglobljene raziskave in preizkušene vzorce, ki jih lahko kopirate.

Do konca boste natančno vedeli, katere vadnice za LiteLLM si najprej ogledati ali prebrati, kako zagnati posrednika LiteLLM in kako integrirati s SDK-ji OpenAI, pretakanjem, ponovnimi poskusi, omejitvami hitrosti, usmerjanjem modelov in opazovanjem.

—

Kaj je LiteLLM (in zakaj se ekipe nanj prisegajo)?

LiteLLM ponuja API in SDK, združljiva z OpenAI, ki vam omogočata:

Usmerjanje k številnim ponudnikom (OpenAI, Azure OpenAI, Anthropic, Google, Cohere, Together, Ollama, in drugi) z enim samim vmesnikom.

Uvedbo centraliziranega posrednika (prehod LLM) za standardizacijo avtentikacije, beleženja, sledenja stroškom in pravilnikov.

Zamenjavo modelov brez prepisovanja vaše aplikacije.

Če gradite aplikacije z več LLM-ji, je LiteLLM vezivno tkivo. Uradna dokumentacija je močna, številne vadnice tretjih oseb pa zdaj pokrivajo primere uporabe v resničnem svetu.

—

10 najboljših vadnic za LiteLLM v letu 2025

Spodaj so navedeni najboljši viri, komu so namenjeni in kaj se boste naučili – razvrščeni po jasnosti, popolnosti in pomembnosti za produkcijo.

1) Hitri tečaj LiteLLM | Za popolne začetnike (video)

Najboljše za: Vizualne učence in razvijalce, ki želijo celovito nastavitev v manj kot eni uri.

Zakaj je dober: Zajema namestitev, osnove Python SDK in kako integrirati klice, združljive z OpenAI, z ogledom osnovnih funkcij, kot je pretakanje.

Začnite tukaj, če še nikoli niste uporabljali LiteLLM.

Oglejte si: Hitri tečaj LiteLLM | Za popolne začetnike.

2) DataCamp: LiteLLM – Vodnik s praktičnimi primeri (članek)

Najboljše za: Razvijalce, ki imajo raje primere s kodo, ki jih lahko kopirajo in prilepijo.

Zakaj je dober: Vodi od "hello world" do pretakanja odzivov, prikazuje, kako izvajati osnovne API klice in razširiti vzorce uporabe.

Preberite: LiteLLM: Vodnik s praktičnimi primeri.

3) Uradna dokumentacija: Začetek z LiteLLM (dokumentacija)

Najboljše za: Ekipe, ki prehajajo v produkcijo s posrednikom/prehodom, pravilnikom in potrebami po usmerjanju.

Zakaj je dobra: Jasna navodila o tem, kdaj uporabiti posrednika, kako povezati več ponudnikov, konfigurirati modele in centralizirati dostop.

Preberite: LiteLLM – Začetek.

4) Zgradite API, združljiv z OpenAI, s posrednikom LiteLLM

Kaj se boste naučili: Zagon posrednika LiteLLM lokalno, nastavitev spremenljivk okolja za več ponudnikov, ustvarjanje enotne končne točke /v1/chat/completions.

Zakaj je pomembno: Večina produkcijskih ekip standardizira posrednika za odklepanje opazovanja in pravilnika.

To združite z uradnim vodnikom za začetek in vašim najljubšim jezikovnim SDK.

5) Usmerjanje med več ponudniki in rezervni sistemi

Kaj se boste naučili: Konfigurirajte sezname ponudnikov, preverjanja stanja in samodejne rezervne sisteme za obravnavo izpadov ali omejitev hitrosti.

Zakaj je pomembno: Ohranja odpornost vaše aplikacije. Na primer, primarno usmerite na GPT-4o in rezervno na Claude 3.5 ali Gemini, če se latenca poveča.

6) Nadzor stroškov in spremljanje uporabe

Kaj se boste naučili: Kako beležiti stroške na zahtevo, uveljavljati kvote in označevati uporabo po ekipi/aplikaciji.

Zakaj je pomembno: LiteLLM je lahko vaša enotna točka za vse ponudnike. Dodajte opozorila in proračune, preden vas za to prosi vaš finančni direktor.

7) Pretakanje, uporaba orodij in strukturirani izhodi

Kaj se boste naučili: Implementirajte pretakanje dogodkov, ki jih pošilja strežnik (SSE), funkcijo/klic orodja in izhode sheme JSON.

Zakaj je pomembno: Sodobne aplikacije z umetno inteligenco se zanašajo na hitro, interaktivno UX in zanesljivo klicanje funkcij. LiteLLM podpira te vzorce prek svojega vmesnika, združljivega z OpenAI.

8) Hibrid lokalnega + oblaka: Ollama prek LiteLLM

Kaj se boste naučili: Usmerite LiteLLM na lokalne modele prek Ollama, medtem ko ohranite modele v oblaku na voljo – nato usmerjajte po opravilu, latenci ali stroških.

Zakaj je pomembno: Lokalno izvajajte zasebna opravila, za kompleksne pozive pa uporabite oblak.

9) Omejevanje hitrosti, ponovni poskusi in prekinjevalniki tokokrogov

Kaj se boste naučili: Konfigurirajte omejitve hitrosti na model, eksponentno zaustavitev in vzorce hitrega neuspeha.

Zakaj je pomembno: Preprečite preobremenitve in izboljšajte zanesljivost pri obremenitvah.

10) Opazovanje: Dnevniki, sledi in redakcija

Kaj se boste naučili: Centralizirajte dnevnike in sledi od vseh ponudnikov, redigirajte PII in pošiljajte telemetrijo vašemu najljubšemu APM/analitiki.

Zakaj je pomembno: Odpravljanje napak v aplikacijah z več LLM-ji brez prehoda je boleče; LiteLLM to omogoča.

—

Hiter začetek: Vaših prvih 15 minut z LiteLLM

Sledite temu poteku po ogledu hitrega tečaja in pregledu dokumentacije.

Namestite in nastavite ključe

pip install litellm
export OPENAI_API_KEY=sk-...
# Izbirno: več ponudnikov
export ANTHROPIC_API_KEY=...
export GOOGLE_API_KEY=...

Eno datotečno klepetanje, združljivo z OpenAI

from litellm import completion
resp = completion(
model="gpt-4o", # ali "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"
messages=.
- Zaženite zgornjo kodo za hiter začetek.
- Cilj: Izvedite svojo prvo zahtevo, združljivo z OpenAI, prek LiteLLM.
- Praktični graditelj
- Preberite vadnico DataCamp in razširite primere s pretakanjem in ponovnimi poskusi.
- Dodajte dva ponudnika in preizkusite rezervne sisteme.
- Lastnik ekipe/produkcije
- Preučite uradni vodnik za začetek.
- Vzpostavite posrednika, dodajte opazovanje in sledenje stroškom.
- Uveljavite omejitve hitrosti in pravilnike o redakciji PII.
—
## Poglobljena analiza: Vzorci, ki jih boste uporabljali tedensko
### Združljivost z OpenAI kot pogodba vmesnika
- Obliko API-ja OpenAI obravnavajte kot pogodbo vaše aplikacije. Vse zahteve gredo na končne točke `/v1/*` vašega posrednika LiteLLM.
- Zamenjajte modele (npr. `gpt-4o` → `claude-3-5`) s konfiguracijo, ne s kodo.
### Usmerjanje modelov po primeru uporabe
- Pot, občutljiva na latenco: usmerite na hitre, cenejše modele.
- Pot razmišljanja: usmerite na modele višje kakovosti za generiranje z razširjeno pridobitvijo (RAG) ali uporabo orodij.
- Pot zasebnosti: usmerite na lokalno/Ollama za segmente PII.
### Zaščita stroškov
- Označite zahteve z `user_id`/`team`.
- Nastavite proračune na ekipo/model.
- Beležite uporabo žetonov v centralno shrambo in opozarjajte na anomalije.
### Odpornost
- Omogočite ponovne poskuse z jitterjem.
- Konfigurirajte časovne omejitve na ponudnika in prekinjevalnike tokokrogov pri ponavljajočih se napakah.
- Določite prioritete ponudnikov in eksplicitne rezervne sisteme.
### Opazovanje
- Zajamite metapodatke zahteve/odziva, histogram latence in model/različico.
- Redigirajte skrivnosti/PII v dnevnikih.
- Korelirajte sledi med storitvami, da hitro najdete počasne klice.
—
## Primer konfiguracije posrednika LiteLLM (začetni komplet, pripravljen za produkcijo)
```yaml
# config.yaml
model_list:
- model_name: gpt-4o
litellm_params:
model: openai/gpt-4o
api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
litellm_params:
model: anthropic/claude-3-5-sonnet
api_key: ${ANTHROPIC_API_KEY}
- model_name: gemini-1.5-pro
litellm_params:
model: google/gemini-1.5-pro
api_key: ${GOOGLE_API_KEY}
defaults:
timeout: 30s
max_tokens: 1024
routing:
- name: low-latency
models: .
- Praktičen članek, ki temelji na primerih.
- Uradna dokumentacija LiteLLM za začetek in najboljše prakse posrednika.
—
## Akcijski načrt: Vaših naslednjih 7 dni
1.–2. dan: Opravite hitri tečaj in hiter začetek; izvedite svojo prvo posredniško zahtevo.
3.–4. dan: Dodajte drugega ponudnika in pretakanje; nastavite časovne omejitve, ponovne poskuse.
5. dan: Vzpostavite posrednika s konfiguracijo; usmerjajte po primeru uporabe (latenca v primerjavi z razmišljanjem).
6. dan: Dodajte beleženje, sledenje stroškom in redakcijo.
7. dan: Preizkus obremenitve; simulirajte napake ponudnika; preverite rezervne sisteme.
—
## Ključni zaključki
- LiteLLM je najhitrejša pot do aplikacij z več LLM-ji brez zaklepanja ponudnika.
- Začnite z vmesnikom, združljivim z OpenAI, nato pa napredujte do posrednika za upravljanje.
- Zgodaj investirajte v usmerjanje, odpornost in opazovanje – potrebovali jih boste v drugem tednu, ne v šestem mesecu.
- Zgornje vadnice pokrivajo 80 % tistega, kar boste uporabljali vsak dan; preostanek je skrivna sestavina vašega izdelka.
### Pogosta vprašanja
V1: Katera je najboljša vadnica za LiteLLM za začetnike?
Začnite s hitrim tečajem LiteLLM na YouTubu za hiter vizualni sprehod, nato pa preberite uradni vodnik za začetek za posrednika. Vadnica DataCamp ponuja praktične primere, ki jih lahko kopirate.
V2: Kako uporabljam LiteLLM kot posrednika, združljivega z OpenAI?
Zaženite posrednika LiteLLM in usmerite osnovni URL vašega SDK-ja na končne točke `/v1` posrednika. Podrobnosti o ponudniku hranite v konfiguraciji LiteLLM, da bo vaša koda aplikacije ostala prenosljiva.
V3: Ali lahko LiteLLM samodejno usmerja med OpenAI, Anthropic in Gemini?
Da. Določite modele in strategije usmerjanja v konfiguraciji LiteLLM za preklapljanje med ponudniki glede na latenco, stroške ali kakovost. Nastavite lahko tudi rezervne sisteme za zanesljivost.
V4: Kako omogočim pretakanje in klicanje orodij/funkcij z LiteLLM?
Uporabite API, združljiv z OpenAI, prek LiteLLM in omogočite `stream=True` (ali SSE v vašem SDK). Za klicanje orodij sledite formatu klicanja funkcij OpenAI – LiteLLM ga posreduje ciljnemu ponudniku.
V5: Kakšen je najhitrejši način za nadzor stroškov z LiteLLM?
Centralizirajte zahteve prek posrednika, omogočite beleženje uporabe in uveljavite omejitve hitrosti in proračune na ključ. Usmerjajte različne obremenitve na stroškovno optimizirane modele in pripnite različice, da se izognete presenečenjem.