Imesasishwa 25 Sep 2025
6 dk
# Pythonpip install litellm# Node.jsnpm install litellm# Mfano: kutumia OpenAI + Anthropic + Mistralexport OPENAI_API_KEY=sk-...export ANTHROPIC_API_KEY=sk-ant-...export MISTRAL_API_KEY=sk-mis-...from litellm import completionresp = completion(model="gpt-4o-mini", # or "anthropic/claude-3-5-sonnet", "mistral/mistral-large"messages=.---## Utiririshaji, Zana, na Hali ya JSON### Utiririshaji wa Majibu```pythonfrom litellm import completionfor chunk in completion(model="gpt-4o-mini",messages=.### Gharama na Matumizi ya TokeniLiteLLM inaweza kufuatilia matumizi ya tokeni na kukadiria gharama kwa kila ombi, modeli, au mradi. Ukiwa na proksi, unaweza kuhamisha matumizi kwenye kumbukumbu, dashibodi, au sinki ya bili. Hii ni muhimu sana unapochanganya wachuuzi na bei tofauti.---## Proksi ya LiteLLM (Lango la LLM)Ikiwa wewe ni timu au jukwaa, proksi ndiyo nguvu kuu halisi: huduma kuu iliyo na uelekezaji, uthibitishaji, vikomo vya viwango, uwekaji kumbukumbu, na uwezo wa kuona. Unashirikiana nayo kwa kutumia kiolesura cha OpenAI API ili msimbo wako wa programu ubadilike kidogo.### Anzisha Proksi```bash# uendeshaji rahisi zaidi wa ndanilitellm --port 4000/v1/chat/completions. Elekeza mteja wako aliyepo wa OpenAI kwa ` na umemaliza.config.yaml:model_list:- model_name: gpt-4o-minilitellm_params:model: openai/gpt-4o-miniapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}router:strategy: simple_weightedroutes:- model: gpt-4o-miniweight: 0.6- model: claude-3-5-sonnetweight: 0.4rate_limits:requests_per_minute: 120logging:level: infosink: stdoutauth:api_keys:- key: svc-app-123litellm --config config.yaml --port 4000from openai import OpenAIclient = OpenAI(base_url=" api_key="svc-app-123")resp = client.chat.completions.create(model="gpt-4o-mini",messages=.---## Uelekezaji wa Hali ya Juu: Muda wa Latency, Gharama, au UaminifuUnaweza kutekeleza mikakati ya uelekezaji kama vile:- Mzunguko wa mizunguko iliyopimwa kwa A/B models- Muda wa chini kabisa wa latency kwanza kwa eneo- Uelekezaji unaozingatia gharama kwa vituo visivyo muhimu- Kurudi nyuma-juu-ya-hitilafu/majaribio upya katika watoajiUkiwa na sera ya router, unaweza kusema "pendelea bei rahisi, rudisha nyuma kwa premium kwa vichocheo vigumu." Hii inatoa upatikanaji wa juu na bajeti zinazotabirika.---## Vizurizi, Usuluhishi, na UsalamaOngeza programu ya kati ya usindikaji kabla na baada ya kusafisha PII, kutekeleza vichungi vya usalama, au kusuluhisha matokeo kabla ya kurudi kwa wateja. Unganisha usuluhishi asili wa mtoa huduma (mfano, OpenAI, Google) na ukaguzi wako wa sera mwenyewe katika proksi. Mfano: hitaji uthibitishaji wa schema ya JSON na uombe tena ikiwa batili.---## Uwezo wa Kuona na Uwekaji Kumbukumbu- Wezesha uwekaji kumbukumbu wa ombi/jibu na urekebishaji.- Hamisha metriki kwa Prometheus/Grafana au APM yako.- Fuatilia muda wa latency, tokeni, na gharama kwa kila kituo na mtumiaji.Hii inabadilisha "bahati nasibu ya modeli" kuwa huduma inayodhibitiwa na SLOs na bajeti.---## Mifumo ya Matumizi ya Ulimwengu Halisi1) Ustahimilivu wa wachuuzi wengi- Msingi: modeli ya haraka/bei rahisi; Rudisha nyuma: modeli ya usahihi wa hali ya juu kwenye 429/5xx.- Faida: muda bora wa kufanya kazi, udhibiti wa gharama, na ubora thabiti.2) Maboresho ya modeli ya bendera ya kipengele- Tumia uzani wa router kuweka kanari modeli mpya kwa 5% ya trafiki; fuatilia metriki; ongeza kasi wakati thabiti.3) Viwango vya bidhaa- Kiwango cha bure kimeelekezwa kwa modeli ndogo; Kiwango cha Pro kwa modeli za premium.4) Sajili na violezo vya haraka- Kati maagizo katika proksi ili huduma zirithi maboresho bila kupelekwa tena.5) Bili na bajeti za timu- Fuatilia matumizi kwa kila ufunguo wa API; tekeleza vikomo laini na vigumu kwa kila timu au bidhaa.---## Orodha ya Ukaguzi wa Usalama na Uzingatiaji- Hifadhi funguo za mtoa huduma katika kidhibiti chako cha siri; rejelea kupitia vigezo vya env katika usanidi.- Washa urekebishaji wa ombi na usafishaji wa PII katika kumbukumbu.- Tumia funguo za API kwa kila huduma kwa proksi; zungusha mara kwa mara.- Weka vikomo vya viwango na upendeleo kwa upana wa shirika.- Ongeza orodha za kuruhusu/kukataa kwa modeli na vituo.---## Utatuzi: Marekebisho ya Haraka- "Haijaidhinishwa" kupitia proksi: Angalia `auth.api_keys` na kwamba mteja wako anatumia `base_url` + ufunguo sahihi.- Model haipatikani: Hakikisha `model_list` ina jina rafiki unaloita.- Muda wa kumalizika: Ongeza `timeout` au uelekeze kwa eneo la mtoa huduma la latency ya chini.- Matokeo ya ajabu: Washa schema ya JSON + uthibitishaji; ongeza majaribio upya na kurudi nyuma.- Ongezeko la gharama: Washa uwekaji akiba; elekeza trafiki nyingi kwa modeli za bei rahisi; weka upendeleo kwa kila ufunguo.Kwa uingiaji wa kina na vipengele vya hivi karibuni, hati rasmi husasishwa mara kwa mara na inafaa kuweka alama. Mafunzo kama mwongozo wa DataCamp ni nzuri kwa mifumo ya moja kwa moja, na video ya kozi fupi ya mwanzo inaweza kukusaidia kuona dhana katika vitendo.---## Unganisha Yote Pamoja: Rejelea Mfumo wa Programu (Python FastAPI)```python# app.pyfrom fastapi import FastAPIfrom pydantic import BaseModelfrom litellm import completionimport osclass ChatReq(BaseModel):question: strapp = FastAPI@app.post("/ask")async def ask(req: ChatReq):resp = completion(model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),messages=.### Maswali Yanayoulizwa Mara kwa MaraQ1:LiteLLM ni nini na kwa nini uitumie badala ya SDK za moja kwa moja za watoa huduma?LiteLLM ni lango linalooana na OpenAI kwa 100+ LLM, linalokupa API moja na mfumo mmoja wa akili. Inapunguza kufungiwa kwa mchuuzi, hurahisisha uelekezaji, na huongeza vipengele vya ops kama vile uwekaji akiba, majaribio upya, na ufuatiliaji wa gharama.Q2:Ninawezaje kutumia LiteLLM na OpenAI SDK?Elekeza URL ya msingi ya SDK kwa proksi ya LiteLLM na utumie ufunguo wako wa API ya proksi. Msimbo wako unaweza kubaki sawa wakati proksi inabadilisha watoa huduma au modeli nyuma ya pazia.Q3:Je, LiteLLM inaweza kutiririsha majibu na kurudisha JSON?Ndiyo. Tumia `stream=True` kupata mitiririko ya tokeni, na `response_format` na schema ya JSON ili kutekeleza matokeo yaliyopangwa katika watoa huduma.Q4:Ninawezaje kudhibiti gharama katika watoa huduma tofauti wa LLM?Washa uwekaji kumbukumbu wa matumizi na ukadiriaji wa gharama, ongeza uwekaji akiba, weka vikomo vya viwango, na uelekeze trafiki nyingi kwa modeli za bei rahisi kupitia proksi. Fuatilia na dashibodi kwa bajeti na SLOs.Q5:Je, LiteLLM inafaa kwa timu za uzalishaji?Ndiyo. Proksi hutoa uthibitishaji, vikomo vya viwango, uelekezaji, uwezo wa kuona, na programu ya kati ya usalama. Imeundwa kama lango la LLM ambalo huweka kati utawala huku ikiweka programu yako kuwa inaoana na OpenAI.
Jinsi ya Kumiliki ChatPDF: Kupata Maarifa Haraka kutoka kwa Nyaraka Zenye Maelezo Mengi

Mbadala Bora ya X Auto-Translation kwa Nyaraka za Haraka na Sahihi

Tafsiri ya AI ya Samsung Haipatikani Iran? Njia Zaidi za Kutatua Tatizo

Zana za Tafsiri za Kiarabu: Mwongozo wa Kivitendo kwa Kazi ya Haraka na Sahihi

Mbadala Bora ya Grok kwa Utafiti wa Kina na Urejeleaji

Vipengele 15 Bora vya Jenereta ya Picha za AI Ambavyo Utaweza Kutumia