Opdateret den 25. sept. 2025
7 min
/v1/chat/completions endpoint.pip install litellmexport OPENAI_API_KEY=sk-...# Valgfrit: flere leverandørerexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # eller "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Kør quickstart-koden ovenfor.- Mål: Lav din første OpenAI-kompatible forespørgsel via LiteLLM.- Praktiske udviklere- Læs DataCamp-guiden og udvid eksempler med streaming og genforsøg.- Tilføj to leverandører og test fallback-mekanismer.- Hold- og produktionsansvarlige- Studér den officielle Kom Godt I Gang guide.- Opsæt proxy, tilføj observability og omkostningssporing.- Håndhæv rate limits og PII redaction-politikker.—## Dybdegående: Mønstre Du Vil Bruge Ugentligt### OpenAI Kompatibilitet som Et Interface-Kontrakt- Behandl OpenAI’s API-struktur som din app-kontrakt. Alle forespørgsler går til din LiteLLM proxy’s `/v1/*` endpoints.- Byt modeller (fx `gpt-4o` → `claude-3-5`) via konfiguration, ikke kode.### Model Routing Efter Brugsscenarie- Latenstid-følsom sti: route til hurtige, billigere modeller.- Reasoning-sti: route til højere kvalitetsmodeller til retrieval-augmented generation (RAG) eller værktøjsbrug.- Privatlivssti: route til lokale/Ollama til PII-segmenter.### Omkostningsbeskyttere- Tag forespørgsler med `user_id`/`team`.- Sæt budgetter per team/model.- Log token-brug centralt og alarmér ved afvigelser.### Robusthed- Aktivér genforsøg med jitter.- Konfigurer timeouts per leverandør og circuit breakers på gentagne fejl.- Definér leverandørprioriteter og eksplicitte fallback-muligheder.### Observability- Fang metadata for forespørgsler/svar, latenstidshistogrammer og model/version.- Rediger hemmeligheder/PII væk i logs.- Kobl traces på tværs af services for hurtigt at finde langsomme kald.—## Eksempel På LiteLLM Proxy Konfiguration (Produktionsklar Starter)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- En praktisk, eksempeldrevet artikel.- Den officielle LiteLLM dokumentation for kom godt i gang og proxy best practices.—## Handlingsplan: Dine Næste 7 DageDag 1–2: Gennemfør crash course og quickstart; lav din første proxiede forespørgsel.Dag 3–4: Tilføj en anden leverandør og streaming; sæt timeouts, retries.Dag 5: Opsæt proxy med konfiguration; route efter brugsscenarie (latenstid vs reasoning).Dag 6: Tilføj logging, omkostningssporing og redaction.Dag 7: Load-test; simuler leverandørfejl; verificer fallback.—## Vigtigste Læring- LiteLLM er den hurtigste vej til multi-leverandør LLM apps uden at blive låst fast til en enkelt leverandør.- Start med et OpenAI-kompatibelt interface, og opgrader derefter til proxyen for governance.- Invester tidligt i routing, robusthed og observability – du får brug for det i uge to, ikke måned seks.- Vejledningerne ovenfor dækker 80% af det, du skal bruge dagligt; resten er dine produkters hemmelige krydderi.### FAQQ1: Hvad er den bedste LiteLLM vejledning for begyndere?Start med LiteLLM Crash Course på YouTube for en hurtig visuel gennemgang, og læs derefter den officielle Kom Godt I Gang guide for proxyen. DataCamp-guiden giver praktiske eksempler, du kan prøve af.Q2: Hvordan bruger jeg LiteLLM som en OpenAI-kompatibel proxy?Kør LiteLLM proxyen og peg din SDK’s base-URL til proxyens `/v1` endpoints. Gem leverandørdetaljer i LiteLLM konfigurationen, så din applikationskode forbliver portabel.Q3: Kan LiteLLM automatisk route mellem OpenAI, Anthropic og Gemini?Ja. Definér modeller og routingstrategier i LiteLLM konfigurationen for at skifte mellem leverandører baseret på latenstid, pris eller kvalitet. Du kan også sætte fallback for pålidelighed.Q4: Hvordan aktiverer jeg streaming og værktøjs-/funktionskald med LiteLLM?Brug det OpenAI-kompatible API via LiteLLM og sæt `stream=True` (eller SSE i din SDK). For værktøjskald følg OpenAI funktion-kald formatet – LiteLLM sender det videre til den valgte leverandør.Q5: Hvad er den hurtigste måde at kontrollere omkostninger med LiteLLM?Centralisér forespørgsler gennem proxyen, aktiver brugerstyring og håndhæv rate limits og budgetter per nøgle. Route forskellige arbejdsbelastninger til omkostningseffektive modeller og fastlås versioner for at undgå overraskelser.
Sådan mestrer du ChatPDF: Få hurtigere indsigt i tætte dokumenter

Det bedste alternativ til X Auto-Translation for hurtige og præcise dokumenter

Samsung AI-oversættelse ikke tilgængelig i Iran? Praktiske løsninger

Persiske oversættelsesværktøjer: en praktisk guide til hurtigere og mere præcist arbejde

Det bedste Grok-alternativ til dybdegående, citeret forskning

Top 15 funktioner i AI-billedgeneratorer, du rent faktisk vil bruge