Oppdatert Sep 25, 2025
7 min
/v1/chat/completions-endepunkt.pip install litellmexport OPENAI_API_KEY=sk-...# Valgfritt: flere leverandørerexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # eller "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Kjør quickstart-koden ovenfor.- Mål: Lag din første OpenAI-kompatible forespørsel via LiteLLM.- Praktisk utvikler- Les DataCamp-opplæringen og utvid eksemplene med streaming og retryer.- Legg til to leverandører og test fallback-mekanismer.- Team-/produksjonseier- Studer den offisielle Komme i gang-guiden.- Sett opp proxyen, legg til observabilitet og kostnadssporing.- Håndhev ratebegrensning og policy for maskering av PII.—## Dypdykk: Mønstre du bruker ukentlig### OpenAI-kompatibilitet som et grensesnittkontrakt- Behandle OpenAIs API-struktur som appens kontrakt. Alle forespørsler går til LiteLLM-proxyens `/v1/*` endepunkter.- Bytt modeller (f.eks. `gpt-4o` → `claude-3-5`) via konfigurasjon, ikke kode.### Modellruting etter brukstilfelle- Latenssensitiv vei: rute til raske, rimeligere modeller.- Resonneringsvei: rute til høykvalitetsmodeller for RAG eller verktøybruk.- Personvernvei: rute til lokal/Ollama for PII-segmenter.### Kostnadskontroll- Tag forespørsler med `user_id`/`team`.- Sett budsjetter per team/modell.- Logg token-bruk til en sentral database og varsle ved avvik.### Robusthet- Aktiver retry med jitter.- Konfigurer timeouts per leverandør og sikringsmekanismer ved gjentatte feil.- Definer leverandørprioriteter og eksplisitte fallback.### Observabilitet- Fang metadata om forespørsler/svar, latens-histogrammer og modell/versjon.- Maskér hemmeligheter/PII i logger.- Korreler spor på tvers av tjenester for å finne langsomme kall raskt.—## Eksempel på LiteLLM Proxy-konfigurasjon (Produksjonsklart utgangspunkt)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- En praktisk, eksempelbasert artikkel.- Den offisielle LiteLLM-dokumentasjonen for komme i gang og proxy beste praksis.—## Handlingsplan: Dine neste 7 dagerDag 1–2: Gjør crash course og quickstart; lag din første proxied forespørsel.Dag 3–4: Legg til en annen leverandør og streaming; sett timeouts, retryer.Dag 5: Sett opp proxy med konfigurasjon; rute etter brukstilfelle (latens vs. resonnering).Dag 6: Legg til logging, kostnadssporing og maskering.Dag 7: Lastetest; simuler leverandørfeil; verifiser fallback.—## Nøkkelpunkter- LiteLLM er den raskeste veien til multi-leverandør LLM-apper uten leverandørlåsning.- Start med et OpenAI-kompatibelt grensesnitt, så ta steget opp til proxy for styring.- Invester tidlig i ruting, robusthet og observabilitet — du trenger det i uke to, ikke i måned seks.- Opplæringene over dekker 80 % av det du bruker daglig; resten er produktets hemmelige ingrediens.### FAQQ1: Hva er den beste LiteLLM-opplæringen for nybegynnere?Start med LiteLLM Crash Course på YouTube for en rask, visuell gjennomgang, og les deretter den offisielle Komme i gang-guiden for proxyen. DataCamp-opplæringen gir praktiske eksempler du kan kopiere.Q2: Hvordan bruker jeg LiteLLM som en OpenAI-kompatibel proxy?Kjør LiteLLM-proxyen og sett SDK-ens base-URL til proxyens `/v1`-endepunkter. Hold leverandørdetaljer i LiteLLM-konfigurasjonen slik at app-koden forblir portabel.Q3: Kan LiteLLM automatisk rute mellom OpenAI, Anthropic og Gemini?Ja. Definer modeller og rutestrategier i LiteLLM-konfigurasjonen for å bytte leverandør basert på latens, kostnad eller kvalitet. Du kan også sette fallback-mekanismer for pålitelighet.Q4: Hvordan aktiverer jeg streaming og verktøy/funksjonskall med LiteLLM?Bruk OpenAI-kompatibel API via LiteLLM og aktiver `stream=True` (eller SSE i SDKen din). For verktøykall, følg OpenAIs funksjonskallformat — LiteLLM videresender til valgt leverandør.Q5: Hva er den raskeste måten å kontrollere kostnader med LiteLLM?Sentraliser forespørsler gjennom proxyen, aktiver bruklogging og håndhev ratebegrensninger og budsjetter per nøkkel. Rute ulik arbeidsmengde til kostnadseffektive modeller og lås versjoner for å unngå overraskelser.
Hvordan mestre ChatPDF: Raskere innsikt fra omfattende dokumenter

Det beste alternativet til X Auto-Translation for raske og nøyaktige dokumenter

Samsung AI-oversettelse utilgjengelig i Iran? Praktiske løsninger

Persiske oversettelsesverktøy: en praktisk guide til raskere og mer nøyaktig arbeid

Det beste alternativet til Grok for grundig, kildebasert forskning

Topp 15 funksjoner i AI-bildegeneratorer du faktisk vil bruke