Uuendatud 25. sept 2025
6 min
# Pythonpip install litellm# Node.jsnpm install litellm# Näide: OpenAI + Anthropic + Mistral kasutamineexport OPENAI_API_KEY=sk-...export ANTHROPIC_API_KEY=sk-ant-...export MISTRAL_API_KEY=sk-mis-...from litellm import completionresp = completion(model="gpt-4o-mini", # or "anthropic/claude-3-5-sonnet", "mistral/mistral-large"messages=.---## Voogedastus, tööriistad ja JSON režiim### Vastuste voogedastus```pythonfrom litellm import completionfor chunk in completion(model="gpt-4o-mini",messages=.### Kulude ja märkide kasutamineLiteLLM saab jälgida märkide kasutust ja hinnata kulusid taotluse, mudeli või projekti kohta. Puhverserveriga saad eksportida kasutuse logidesse, armatuurlaudadesse või arveldusteenusesse. See on hindamatu, kui kasutad erineva hinnakujundusega müüjaid.---## LiteLLM-i puhverserver (LLM Gateway)Kui oled meeskond või platvorm, siis on puhverserver tõeline supervõime: tsentraalne teenus marsruutimise, autentimise, määrade piirangute, logimise ja jälgitavusega. Sa suhtled sellega OpenAI API pinna kaudu, nii et sinu rakenduse kood peaaegu ei muutu.### Käivita puhverserver```bash# lihtsaim kohalik käivituslitellm --port 4000/v1/chat/completions. Suuna oma olemasolev OpenAI klient ` ja oledki valmis.config.yaml:model_list:- model_name: gpt-4o-minilitellm_params:model: openai/gpt-4o-miniapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}router:strategy: simple_weightedroutes:- model: gpt-4o-miniweight: 0.6- model: claude-3-5-sonnetweight: 0.4rate_limits:requests_per_minute: 120logging:level: infosink: stdoutauth:api_keys:- key: svc-app-123litellm --config config.yaml --port 4000from openai import OpenAIclient = OpenAI(base_url=" api_key="svc-app-123")resp = client.chat.completions.create(model="gpt-4o-mini",messages=.---## Täiustatud marsruutimine: latentsus, hind või usaldusväärsusSaad rakendada marsruutimisstrateegiaid nagu:- Kaalutud round-robin mudelite A/B testimiseks- Madalaima latentsusega esimesena piirkonna järgi- Kuluteadlik marsruutimine mitte-kriitiliste lõpp-punktide jaoks- Vea korral tagavaraks/uuesti proovimine pakkujate vahelRuuteri poliitikaga saad öelda: “eelista odavat, kukkuda raskete viipade korral premiumile”. See pakub kõrget kättesaadavust ja prognoositavaid eelarveid.---## Turvameetmed, modereerimine ja ohutusLisa eel- ja järel-töötluse vahevara, et eemaldada PII, jõustada ohutusfiltreid või modereerida väljundeid enne klientidele tagastamist. Kombineeri pakkuja-põhist modereerimist (nt OpenAI, Google) omaenda poliitikakontrollidega puhverserveris. Näide: nõua JSON-skeemi valideerimist ja küsi uuesti, kui see on kehtetu.---## Jälgitavus ja logimine- Luba taotluse/vastuse logimine redaktsiooniga.- Ekspordi mõõdikud Prometheus/Grafanasse või oma APM-i.- Jälgi latentsust, märke ja kulusid lõpp-punkti ja kasutaja järgi.See muudab “mudeli ruleti” hallatavaks teenuseks koos SLO-de ja eelarvetega.---## Reaalse maailma kasutusmustrid1) Mitme müüja vastupidavus- Esmane: kiire/odav mudel; Tagavara: kõrge täpsusega mudel 429/5xx korral.- Eelised: parem tööaeg, kulude kontroll ja stabiilne kvaliteet.2) Funktsioonilippude mudeli uuendused- Kasuta ruuteri kaalusid, et uut mudelit 5% liiklusest katsetada; jälgi mõõdikuid; suurenda, kui see on stabiilne.3) Tootetasemed- Tasuta tase marsruuditud väikestesse mudelitesse; Pro tase premium mudelitesse.4) Viipade registrid ja mallid- Tsentraliseeri viipad puhverserveris, et teenused päriksid täiustusi ilma uuesti juurutamiseta.5) Meeskonna arveldamine ja eelarved- Jälgi kulutusi API võtme järgi; jõusta pehmeid ja rangeid limiite meeskonna või toote kohta.---## Turvalisuse ja vastavuse kontrollnimekiri- Salvesta pakkuja võtmed oma saladuste halduris; viita konfiguratsioonis env muutujate kaudu.- Lülita sisse taotluse redaktsioon ja PII puhastamine logides.- Kasuta puhverserveri jaoks teenusepõhiseid API võtmeid; roteeri regulaarselt.- Sea organisatsiooni laiad määrade limiidid ja kvoodid.- Lisa lubatud/keelatud nimekirjad mudelitele ja lõpp-punktidele.---## Tõrkeotsing: kiired lahendused- “Volitamata” puhverserveri kaudu: kontrolli `auth.api_keys` ja kas sinu klient kasutab `base_url` + õiget võtit.- Mudelit ei leitud: veendu, et `model_list` sisaldab sõbralikku nime, mida sa kutsud.- Ajalõpud: suurenda `timeout` või marsruudi madalama latentsusega pakkuja piirkonda.- Veidrad väljundid: luba JSON-skeem + valideerimine; lisa uuesti proovimisi ja tagavarasid.- Kulude kasv: lülita sisse vahemällu salvestamine; marsruudi hulgi liiklus odavamatesse mudelitesse; sea võtmepõhised kvoodid.Sügavamate sukeldumiste ja uusimate funktsioonide jaoks uuendatakse ametlikke dokumente sageli ja tasub need järjehoidjatesse lisada. Õpetused nagu DataCampi juhend on suurepärased praktiliste mustrite jaoks ja algaja kiirkursuse video aitab sul näha kontseptsioone tegevuses.---## Pane see kõik kokku: viiterakenduse skelett (Python FastAPI)```python# app.pyfrom fastapi import FastAPIfrom pydantic import BaseModelfrom litellm import completionimport osclass ChatReq(BaseModel):question: strapp = FastAPI@app.post("/ask")async def ask(req: ChatReq):resp = completion(model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),messages=.### KKKQ1:Mis on LiteLLM ja miks seda kasutada otse pakkuja SDK-de asemel?LiteLLM on OpenAI-ga ühilduv lüüs 100+ LLM-ile, andes sulle ühe API ja ühe vaimse mudeli. See vähendab müüja lukustumist, lihtsustab marsruutimist ja lisab ops funktsioone nagu vahemällu salvestamine, uuesti proovimine ja kulude jälgimine.Q2:Kuidas ma kasutan LiteLLM-i OpenAI SDK-ga?Suuna SDK baas-URL LiteLLM-i puhverserverisse ja kasuta oma puhverserveri API võtit. Sinu kood võib jääda samaks, samal ajal kui puhverserver vahetab pakkujaid või mudeleid kulisside taga.Q3:Kas LiteLLM saab voogedastada vastuseid ja tagastada JSON-i?Jah. Kasuta `stream=True`, et saada märkide voogusid ja `response_format` koos JSON-skeemiga, et jõustada struktureeritud väljundeid kõigi pakkujate puhul.Q4:Kuidas ma kontrollin kulusid erinevate LLM-i pakkujate puhul?Luba kasutuslogimine ja kulude hindamine, lisa vahemällu salvestamine, sea määrade limiidid ja marsruudi hulgi liiklus odavamatesse mudelitesse puhverserveri kaudu. Jälgi armatuurlaudadega eelarveid ja SLO-sid.Q5:Kas LiteLLM sobib tootmismeeskondadele?Jah. Puhverserver pakub autentimist, määrade limiite, marsruutimist, jälgitavust ja ohutusvahevara. See on loodud LLM-i lüüsina, mis tsentraliseerib juhtimist, hoides samal ajal sinu rakenduse OpenAI-ga ühilduvana.
Kuidas valitseda ChatPDF-i: Kiirem ülevaade mahukatest dokumentidest

Parim X automaatse tõlke alternatiiv kiirete ja täpsete dokumentide jaoks

Samsungi tehisintellekti tõlge ei ole Iraanis saadaval? Praktilised lahendused

Pärsia tõlkete tööriistad: praktiline juhend kiirema ja täpsema töö jaoks

Parim Groki alternatiiv põhjalikuks ja viidatud uurimistööks

AI pildigeneraatori 15 parimat funktsiooni, mida sa tegelikult kasutad