What is LiteLLM and why use it over direct provider SDKs?

LiteLLM is an OpenAI-compatible gateway for 100+ LLMs, giving you one API and one mental model. It reduces vendor lock-in, simplifies routing, and adds ops features like caching, retries, and cost tracking.

How do I use LiteLLM with the OpenAI SDK?

Point the SDK’s base URL to the LiteLLM proxy and use your proxy API key. Your code can stay the same while the proxy swaps providers or models behind the scenes.

Can LiteLLM stream responses and return JSON?

Yes. Use `stream=True` to get token streams, and `response_format` with JSON schema to enforce structured outputs across providers.

How do I control costs across different LLM providers?

Enable usage logging and cost estimation, add caching, set rate limits, and route bulk traffic to cheaper models via the proxy. Monitor with dashboards for budgets and SLOs.

Is LiteLLM suitable for production teams?

Yes. The proxy provides auth, rate limits, routing, observability, and safety middleware. It’s designed as an LLM gateway that centralizes governance while keeping your app OpenAI-compatible.

Hogyan használjuk a LiteLLM-et: Gyakorlati útmutató példákkal, profi tippekkel és valós munkafolyamatokkal

Ha valaha is azt kívántad, hogy minden modell API úgy viselkedjen, mint az OpenAI-é, akkor imádni fogod a LiteLLM-et. Ez egy könnyű átjáró, amely lehetővé teszi, hogy több mint 100 LLM-et hívj meg egyetlen, OpenAI-kompatibilis felülettel – helyben a kódban vagy egy központi proxyn keresztül, amelyet megoszthatsz a csapatokkal. Ebben az útmutatóban végigvezetjük a telepítést, az alapvető és haladó használatot, a streaminget, a batchinget, az újrapróbálkozásokat, a gyorsítótárazást, a költségkövetést és a LiteLLM proxy telepítését védőkorlátokkal és útválasztással. Python és JavaScript példákat, valamint valós mintákat is tartalmazunk.

Érdemes megjegyezni: ha gyorsan szeretnél promptokat prototípusozni, kérdéseket feltenni több modellen keresztül, és rendszerezni az eredményeket, a Sider.AI hasznos segítőtárs lehet a kutatásban és az iterációban, miközben a LiteLLM-alapú stacket kiépíted. Kiegészíti a munkafolyamatodat azáltal, hogy segít összehasonlítani a kimeneteket és finomítani a promptokat, mielőtt azokat kodifikálnád.

Gyakorlati és megoldásorientált megközelítést alkalmazunk, így másolhatsz és ki is adhatod.

Mi az a LiteLLM (és miért használják a csapatok)?

Egy API sok modellhez: Hívd az Anthropic, OpenAI, Google, Azure, Cohere, Mistral, Bedrock és más modelleket OpenAI-stílusú funkciókkal.

Kétféleképpen használhatod:

Kliens SDK-k (Python/JS): Gyors használat szkriptekben, szervereken, notebookokban.

Proxy (LLM átjáró): Központosított szolgáltatás útválasztáshoz, hitelesítéshez, naplózáshoz, költségellenőrzéshez és megfigyelhetőséghez.

Drop-in kompatibilitás: Cserélj modelleket anélkül, hogy átírnád az alkalmazásodat.

Működési jellemzők: Újrapróbálkozások, időtúllépések, streaming, batching, gyorsítótárazás, nyomkövetés és költségjelentés azonnal.

Ha most kezded, futtasd át a hivatalos Első lépések dokumentációt egy gyors mentális modellhez. A gyakorlati példákhoz a DataCamp oktatóanyaga egy szilárd társ lépésről lépésre bemutatott kóddal. Ha a videót részesíted előnyben, van egy kezdőknek szóló gyorstalpaló is.

Gyors indítás: Telepítés és az első hívás

Telepítés

# Python
pip install litellm
# Node.js
npm install litellm

Környezeti változók

# Példa: OpenAI + Anthropic + Mistral használata
export OPENAI_API_KEY=sk-...
export ANTHROPIC_API_KEY=sk-ant-...
export MISTRAL_API_KEY=sk-mis-...

Python: Minimális chat kiegészítés

from litellm import completion
resp = completion(
model="gpt-4o-mini", # vagy "anthropic/claude-3-5-sonnet", "mistral/mistral-large"
messages=.
---
## Streaming, eszközök és JSON mód
### Streaming válaszok
```python
from litellm import completion
for chunk in completion(
model="gpt-4o-mini",
messages=.
### Költség és token használat
A LiteLLM nyomon követheti a token használatot, és megbecsülheti a költségeket kérésenként, modellenként vagy projektenként. A proxyval exportálhatod a használatot naplókba, irányítópultokra vagy egy számlázási célba. Ez felbecsülhetetlen értékű, ha különböző árképzésű szállítókat használsz.
---
## A LiteLLM Proxy (LLM átjáró)
Ha egy csapat vagy platform vagy, a proxy az igazi szupererő: egy központi szolgáltatás útválasztással, hitelesítéssel, sebességkorlátozással, naplózással és megfigyelhetőséggel. Az OpenAI API felületét használva kommunikálsz vele, így az alkalmazáskódod alig változik.
### Indítsd el a proxyt
```bash
# legegyszerűbb helyi futtatás
litellm --port 4000

Alapértelmezés szerint OpenAI-kompatibilis végpontokat tesz elérhetővé, mint például a /v1/chat/completions. Irányítsd a meglévő OpenAI kliensedet a ` -ra, és kész is vagy.

Szolgáltatók és kulcsok konfigurálása

Hozd létre a config.yaml fájlt:

model_list:
- model_name: gpt-4o-mini
litellm_params:
model: openai/gpt-4o-mini
api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
litellm_params:
model: anthropic/claude-3-5-sonnet
api_key: ${ANTHROPIC_API_KEY}
router:
strategy: simple_weighted
routes:
- model: gpt-4o-mini
weight: 0.6
- model: claude-3-5-sonnet
weight: 0.4
rate_limits:
requests_per_minute: 120
logging:
level: info
sink: stdout
auth:
api_keys:
- key: svc-app-123

Futtatás konfigurációval:

litellm --config config.yaml --port 4000

Használd a proxyt az OpenAI SDK-kből (Nincs kódváltozás)

from openai import OpenAI
client = OpenAI(base_url=" api_key="svc-app-123")
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=.
---
## Haladó útválasztás: Késleltetés, költség vagy megbízhatóság
Olyan útválasztási stratégiákat valósíthatsz meg, mint:
- Súlyozott round-robin az A/B modellekhez
- Legalacsonyabb késleltetés először régiónként
- Költségtudatos útválasztás nem kritikus végpontokhoz
- Hiba esetén visszalépés/újrapróbálkozás a szolgáltatók között
Egy útválasztási szabályzattal azt mondhatod, hogy „a legolcsóbbat preferálom, nehéz promptok esetén válts prémiumra”. Ez magas rendelkezésre állást és kiszámítható költségvetést biztosít.
---
## Védőkorlátok, moderálás és biztonság
Adj hozzá elő- és utófeldolgozó middleware-t a PII eltávolításához, a biztonsági szűrők érvényesítéséhez vagy a kimenetek moderálásához, mielőtt visszaküldené azokat az ügyfeleknek. Kombináld a szolgáltató-natív moderálást (pl. OpenAI, Google) a saját szabályzataid ellenőrzésével a proxyban. Példa: követeld meg a JSON séma validálását, és kérdezd meg újra, ha érvénytelen.
---
## Megfigyelhetőség és naplózás
- Engedélyezd a kérés/válasz naplózást a bizalmas adatok eltávolításával.
- Exportálj metrikákat a Prometheus/Grafana-ba vagy az APM-edbe.
- Kövesd nyomon a késleltetést, a tokeneket és a költségeket végpontonként és felhasználónként.
Ez a „modell rulettet” egy felügyelt szolgáltatássá alakítja át SLO-kkal és költségvetésekkel.
---
## Valós használati minták
1) Több szállítós rugalmasság
- Elsődleges: gyors/olcsó modell; Visszalépés: nagy pontosságú modell 429/5xx esetén.
- Előnyök: jobb üzemidő, költségellenőrzés és stabil minőség.
2) Feature flag modellfrissítések
- Használj útválasztó súlyokat egy új modell kanári teszteléséhez a forgalom 5%-án; figyeld a metrikákat; növeld, ha stabil.
3) Termékszintek
- Ingyenes szint kis modellekhez irányítva; Pro szint prémium modellekhez.
4) Prompt regisztrációs adatbázisok és sablonok
- Központosítsd a promptokat a proxyban, így a szolgáltatások újratelepítés nélkül öröklik a fejlesztéseket.
5) Csapat számlázás és költségvetések
- Kövesd nyomon a költéseket API kulcsonként; érvényesíts lágy és kemény korlátokat csapatonként vagy termékenként.
---
## Biztonsági és megfelelőségi ellenőrzőlista
- Tárold a szolgáltatói kulcsokat a titkosításkezelődben; hivatkozz rájuk környezeti változókon keresztül a konfigurációban.
- Kapcsold be a kérés adatainak eltávolítását és a PII tisztítását a naplókban.
- Használj szolgáltatásonkénti API kulcsokat a proxyhoz; rendszeresen cseréld őket.
- Állíts be szervezeti szintű sebességkorlátozásokat és kvótákat.
- Adj hozzá engedélyező-/tiltólistákat a modellekhez és végpontokhoz.
---
## Hibaelhárítás: Gyors javítások
- „Jogosulatlan” a proxyn keresztül: Ellenőrizd az `auth.api_keys` beállításait, és hogy a kliensed a `base_url` + helyes kulcsot használja-e.
- Modell nem található: Győződj meg arról, hogy a `model_list` tartalmazza a barátságos nevet, amelyet hívsz.
- Időtúllépések: Növeld a `timeout` értékét, vagy irányítsd egy alacsonyabb késleltetésű szolgáltatói régióba.
- Furcsa kimenetek: Engedélyezd a JSON sémát + validálást; adj hozzá újrapróbálkozásokat és visszalépéseket.
- Költségnövekedés: Kapcsold be a gyorsítótárazást; irányítsd a tömeges forgalmat olcsóbb modellekhez; állíts be kulcsonkénti kvótákat.
A mélyebb merülésekhez és a legújabb funkciókhoz a hivatalos dokumentációt gyakran frissítik, és érdemes könyvjelzővel ellátni. Az olyan oktatóanyagok, mint a DataCamp útmutatója nagyszerűek a gyakorlati mintákhoz, és a kezdőknek szóló gyorstalpaló videó segíthet a fogalmak gyakorlati megtekintésében.
---
## Rakd össze az egészet: Referencia alkalmazás váz (Python FastAPI)
```python
# app.py
from fastapi import FastAPI
from pydantic import BaseModel
from litellm import completion
import os
class ChatReq(BaseModel):
question: str
app = FastAPI
@app.post("/ask")
async def ask(req: ChatReq):
resp = completion(
model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),
messages=.
### GYIK
Q1: Mi az a LiteLLM, és miért érdemes a közvetlen szolgáltatói SDK-k helyett használni?
A LiteLLM egy OpenAI-kompatibilis átjáró több mint 100 LLM-hez, amely egy API-t és egy mentális modellt biztosít. Csökkenti a szállítói kötöttséget, egyszerűsíti az útválasztást, és olyan műveleti funkciókat ad hozzá, mint a gyorsítótárazás, az újrapróbálkozások és a költségkövetés.
Q2: Hogyan használhatom a LiteLLM-et az OpenAI SDK-val?
Irányítsd az SDK base URL-jét a LiteLLM proxyra, és használd a proxy API kulcsodat. A kódod ugyanaz maradhat, miközben a proxy a háttérben szolgáltatókat vagy modelleket cserél.
Q3: Tud a LiteLLM streaming válaszokat adni és JSON-t visszaadni?
Igen. Használd a `stream=True` beállítást a token streamekhez, és a `response_format` beállítást JSON sémával a strukturált kimenetek érvényesítéséhez a szolgáltatók között.
Q4: Hogyan szabályozhatom a költségeket a különböző LLM szolgáltatók között?
Engedélyezd a használati naplózást és a költségbecslést, adj hozzá gyorsítótárazást, állíts be sebességkorlátozásokat, és irányítsd a tömeges forgalmat olcsóbb modellekhez a proxyn keresztül. Figyeld az irányítópultokkal a költségvetéseket és az SLO-kat.
Q5: A LiteLLM alkalmas éles csapatok számára?
<a114>Igen. A proxy hitelesítést, sebességkorlátozásokat, útválasztást, megfigyelhetőséget és biztonsági middleware-t biztosít. Úgy tervezték, mint egy LLM átjáró, amely központosítja a kormányzást, miközben az alkalmazásod OpenAI-kompatibilis marad.

A LiteLLM használata: Gyakorlati útmutató példákkal, profi tippekkel és valós munkafolyamatokkal