Päivitetty 25. syys 2025
7 min
/v1/chat/completions-päätepisteen luomisen.pip install litellmexport OPENAI_API_KEY=sk-...# Valinnainen: lisää tarjoajiaexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # tai "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=...- Käynnistä yllä oleva pikakoodi.- Tavoite: Tee ensimmäinen OpenAI-yhteensopiva pyyntö LiteLLM:n kautta.- Käytännön kehittäjä- Lue DataCamp-opas ja laajenna esimerkkejä suoratoistolla ja yrityksillä.- Lisää kaksi tarjoajaa ja testaa varajärjestelmiä.- Tiimi-/tuotantovastuuhenkilö- Tutki virallinen Aloittaminen-opas.- Käynnistä proxy, lisää havaittavuus ja kustannusseuranta.- Ota käyttöön käyttörajat ja henkilötietojen poisto.—## Syväluotaus: Kaavat, joita käytät viikoittain### OpenAI-yhteensopivuus rajapintasopimuksena- Käsittele OpenAI:n API-rakennetta sovelluksesi sopimuksena. Kaikki pyynnöt menevät LiteLLM-proxyn `/v1/*`-päätepisteisiin.- Vaihda malleja (esim. `gpt-4o` → `claude-3-5`) konfiguraation, ei koodin avulla.### Mallien reititys käyttötapauksen mukaan- Latenssiherkkä polku: reititä nopeille, edullisille malleille.- Päättelypolku: reititä korkealaatuisemmille malleille hakuvahvistettuun generointiin (RAG) tai työkalujen käyttöön.- Yksityisyyspolku: reititä paikallisille/Ollamalle henkilötietoja sisältäville segmenteille.### Kustannusten hallintakeinot- Merkitse pyynnöt `user_id`/`team`-tiedoilla.- Aseta budjetit tiimeittäin/malleittain.- Kirjaa tokenien käyttö keskitetysti ja hälytä poikkeamista.### Resilienssi- Ota käyttöön yritykset jitterillä.- Konfiguroi aikakatkaisut tarjoajakohtaisesti ja virtapiirikytkimet toistuvissa virheissä.- Määrittele tarjoajien prioriteetit ja eksplisiittiset varajärjestelmät.### Havaittavuus- Kerää pyyntö-/vastausdatan metatiedot, latenssihistogrammit ja malli/versio.- Poista salaisuudet/henkilötiedot lokeista.- Korreloi jäljet palveluiden välillä löytääksesi hitaat kutsut nopeasti.—## Esimerkkikonfiguraatio LiteLLM-proxylle (Tuotantovalmiina aloituksena)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Käytännönläheinen, esimerkkeihin perustuva artikkeli.- Viralliset LiteLLM-dokumentit Aloittaminen-oppaasta ja proxyn parhaista käytännöistä.—## Toimintasuunnitelma: Seuraavat 7 päivääsiPäivät 1–2: Tee Crash Course ja pikakäyttö; tee ensimmäinen proxyn kautta tehty pyyntö.Päivät 3–4: Lisää toinen tarjoaja ja suoratoisto; aseta aikakatkaisut, yritykset.Päivä 5: Käynnistä proxy konfiguraatiolla; reititä käyttötapauksen mukaan (latenssi vs päättely).Päivä 6: Lisää lokitus, kustannusseuranta ja tietojen poisto.Päivä 7: Kuormitustestaus; simuloitu tarjoajien virheet; varmista varajärjestelmät.—## Keskeiset opit- LiteLLM on nopein tie monitoimittajaisiin LLM-sovelluksiin ilman toimittajasidonnaisuutta.- Aloita OpenAI-yhteensopivalla rajapinnalla, nosta sitten governancea proxyn avulla.- Panosta varhaisessa vaiheessa reititykseen, resilienssiin ja havaittavuuteen — tarvitset niitä viikolla kaksi, et kuudennella kuukaudella.- Yllä olevat oppaat kattavat 80 % päivittäisestä käytöstä; loput ovat tuotteesi salainen ase.### Usein kysytyt kysymykset (FAQ)K1: Mikä on paras LiteLLM-opas aloittelijoille?Aloita LiteLLM Crash Course -videolla YouTubessa nopean visuaalisen kierroksen saamiseksi, ja lue sitten virallinen Aloittaminen-opas proxysta. DataCampin opas tarjoaa käytännön esimerkkejä, joita voi kopioida.K2: Kuinka käytän LiteLLM:ää OpenAI-yhteensopivana proxyna?Käynnistä LiteLLM proxy ja ohjaa SDK:n perusosoite proxyn `/v1`-päätepisteisiin. Pidä tarjoajatiedot LiteLLM-konfiguraatiossa, jotta sovelluskoodisi pysyy siirrettävänä.K3: Voiko LiteLLM reitittää automaattisesti OpenAI:n, Anthropicin ja Geminin välillä?Kyllä. Määrittele mallit ja reititystrategiat LiteLLM-konfiguraatiossa, jotta voit vaihtaa tarjoajien välillä latenssin, kustannusten tai laadun perusteella. Voit myös asettaa varajärjestelmiä luotettavuuden lisäämiseksi.K4: Kuinka otan käyttöön suoratoiston ja työkalufunktioiden kutsun LiteLLM:llä?Käytä OpenAI-yhteensopivaa API:a LiteLLM:n kautta ja ota käyttöön `stream=True` (tai SSE SDK:ssasi). Työkalukutsuille noudata OpenAI:n funktiokutsumuotoa — LiteLLM välittää kutsut kohdepalvelimelle.K5: Mikä on nopein tapa hallita kustannuksia LiteLLM:llä?Keskitä pyynnöt proxyn kautta, ota käyttöön käytön kirjaukset ja aseta avainkohtaiset käyttörajoitukset ja budjetit. Reititä eri työkuormat kustannustehokkaisiin malleihin ja lukitse versiot yllätyksien välttämiseksi.
Kuinka hallita ChatPDF:tä: Nopeammat oivallukset tiheistä asiakirjoista

Paras X-automaattikäännösvaihtoehto nopeisiin ja tarkkoihin asiakirjoihin

Samsungin tekoälykäännös ei saatavilla Iranissa? Käytännön kiertotavat

Persian-käännöstyökalut: käytännön opas nopeampaan ja tarkempaan työhön

Paras Grok-vaihtoehto syvälliseen, lähteisiin perustuvaan tutkimukseen

Top 15 AI-kuvageneraattorin ominaisuutta, joita tulet oikeasti käyttämään