Uppdaterad 25 sep 2025
7 min
/v1/chat/completions endpoint.pip install litellmexport OPENAI_API_KEY=sk-...# Valfritt: fler leverantörerexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # eller "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Kör snabbstartskoden ovan.- Mål: Gör din första OpenAI-kompatibla förfrågan via LiteLLM.- Praktisk utvecklare- Läs DataCamp-handledningen och bygg ut exempel med streaming och retries.- Lägg till två leverantörer och testa fallbacks.- Team-/produktionsansvarig- Studera den officiella Komma igång-guiden.- Starta proxyn, lägg till observabilitet och kostnadsspårning.- Upprätthåll rate limits och PII-redigeringspolicyer.—## Djupdykning: Mönster du använder varje vecka### OpenAI-kompatibilitet som gränssnittsavtal- Behandla OpenAIs API-struktur som din apps kontrakt. Alla förfrågningar går till din LiteLLM-proxys `/v1/*` endpoints.- Byt modeller (t.ex. `gpt-4o` → `claude-3-5`) via konfiguration, inte kod.### Modellruting efter användningsfall- Låglatensväg: routa till snabba, billigare modeller.- Resonemangs-väg: routa till högkvalitativa modeller för retrieval-augmented generation (RAG) eller verktygsanvändning.- Sekretess-väg: routa till lokal/Ollama för PII-segment.### Kostnadsskydd- Tagga förfrågningar med `user_id`/`team`.- Sätt budgetar per team/modell.- Logga tokenanvändning till ett centralt lager och varna vid avvikelser.### Motståndskraft- Aktivera retries med jitter.- Ställ in timeout per leverantör och circuit breakers vid upprepade fel.- Definiera leverantörsprioriteter och explicita fallbacks.### Observabilitet- Fånga metadata om förfrågningar/svar, latenstidshistogram och modell/version.- Redigera bort hemligheter/PII i loggar.- Korrelera spår mellan tjänster för att snabbt hitta långsamma anrop.—## Exempelkonfiguration för LiteLLM Proxy (Produktionsklar startpunkt)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- En praktisk, exempelbaserad artikel.- De officiella LiteLLM-dokumenten för att komma igång och proxy-bästa praxis.—## Handlingsplan: Dina nästa 7 dagarDag 1–2: Kör crash course och snabbstart; gör din första proxade förfrågan.Dag 3–4: Lägg till en andra leverantör och streaming; ställ in timeout och retries.Dag 5: Starta proxyn med konfiguration; routa efter användningsfall (latenstid vs resonemang).Dag 6: Lägg till loggning, kostnadsspårning och redigering.Dag 7: Belastningstest; simulera leverantörsfel; verifiera fallbacks.—## Viktiga lärdomar- LiteLLM är den snabbaste vägen till multi-leverantörers LLM-appar utan leverantörslåsning.- Börja med ett OpenAI-kompatibelt gränssnitt, och ta sedan steget till proxyn för styrning.- Investera tidigt i routing, motståndskraft och observabilitet – du behöver det vecka två, inte månad sex.- Handledningarna ovan täcker 80 % av det du använder dagligen; resten är ditt produkts hemliga ingrediens.### FAQQ1: Vilken är den bästa LiteLLM-handledningen för nybörjare?Börja med LiteLLM Crash Course på YouTube för en snabb visuell genomgång, läs sedan den officiella Komma igång-guiden för proxyn. DataCamp-handledningen ger praktiska exempel att kopiera.Q2: Hur använder jag LiteLLM som en OpenAI-kompatibel proxy?Kör LiteLLM-proxyn och peka ditt SDK:s bas-URL till proxyns `/v1` endpoints. Håll leverantörsdetaljer i LiteLLM-konfigurationen så att din applikationskod förblir portabel.Q3: Kan LiteLLM automatiskt routa mellan OpenAI, Anthropic och Gemini?Ja. Definiera modeller och routingstrategier i LiteLLM-konfigen för att växla mellan leverantörer efter latens, kostnad eller kvalitet. Du kan också sätta fallbacks för tillförlitlighet.Q4: Hur aktiverar jag streaming och verktygs-/funktionsanrop med LiteLLM?Använd OpenAI-kompatibla API:t via LiteLLM och aktivera `stream=True` (eller SSE i ditt SDK). För verktygsanrop, följ OpenAIs funktionsanropsformat – LiteLLM vidarebefordrar det till mål-leverantören.Q5: Vad är det snabbaste sättet att kontrollera kostnader med LiteLLM?Centralisera förfrågningar via proxyn, aktivera användningsloggning och upprätthåll rate limits och budgetar per nyckel. Routa olika arbetsbelastningar till kostnadsoptimerade modeller och lås versioner för att undvika överraskningar.
Så behärskar du ChatPDF: Snabbare insikter från täta dokument

Det bästa alternativet till X Auto-Translation för snabba och precisa dokument

Samsung AI-översättning otillgänglig i Iran? Praktiska lösningar

Persiska översättningsverktyg: en praktisk guide till snabbare och mer korrekt arbete

Det bästa alternativet till Grok för djup, refererad forskning

Topp 15 funktioner hos AI-bildgeneratorer du faktiskt kommer att använda