Actualitzat el 25 Set. 2025
7 min
/v1/chat/completions.pip install litellmexport OPENAI_API_KEY=sk-...# Opcional: més proveïdorsexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # or "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Executa el codi d'inici ràpid anterior.- Objectiu: fes la teva primera sol·licitud compatible amb OpenAI mitjançant LiteLLM.- Constructor pràctic- Llegeix el tutorial de DataCamp i estén els exemples amb transmissió i reintents.- Afegeix dos proveïdors i prova les alternatives.- Propietari de l'equip/producció- Estudia la guia oficial d'inici.- Activa el servidor intermediari, afegeix observabilitat i seguiment de costos.- Aplica límits de velocitat i polítiques de redacció de PII.—## Immersió profunda: patrons que utilitzaràs setmanalment### Compatibilitat amb OpenAI com a contracte d'interfície- Tracta la forma de l'API d'OpenAI com el contracte de la teva aplicació. Totes les sol·licituds van als punts finals `/v1/*` del teu servidor intermediari de LiteLLM.- Intercanvia models (per exemple, `gpt-4o` → `claude-3-5`) per configuració, no per codi.### Enrutament de models per cas d'ús- Ruta sensible a la latència: enruta a models ràpids i més barats.- Ruta de raonament: enruta a models de més qualitat per a la generació augmentada de recuperació (RAG) o l'ús d'eines.- Ruta de privadesa: enruta a local/Ollama per a segments PII.### Proteccions de costos- Etiqueta les sol·licituds amb `user_id`/`team`.- Estableix pressupostos per equip/model.- Registra l'ús de fitxes a un magatzem central i alerta sobre anomalies.### Resiliència- Habilita els reintents amb jitter.- Configura els temps d'espera per proveïdor i els tallacircuits en cas de fallades repetides.- Defineix les prioritats del proveïdor i les alternatives explícites.### Observabilitat- Captura metadades de sol·licitud/resposta, histogrames de latència i model/versió.- Redacta secrets/PII als registres.- Correlaciona els seguiments entre els serveis per trobar trucades lentes ràpidament.—## Exemple de configuració del servidor intermediari de LiteLLM (iniciador llest per a la producció)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Un article pràctic i basat en exemples.- La documentació oficial de LiteLLM per començar i les millors pràctiques del servidor intermediari.—## Pla d'acció: els teus propers 7 diesDia 1–2: fes el curs intensiu i l'inici ràpid; fes la teva primera sol·licitud proxy.Dia 3–4: afegeix un segon proveïdor i transmissió; estableix temps d'espera, reintents.Dia 5: activa el servidor intermediari amb la configuració; enruta per cas d'ús (latència vs raonament).Dia 6: afegeix registre, seguiment de costos i redacció.Dia 7: prova de càrrega; simula fallades del proveïdor; verifica les alternatives.—## Aspectes clau- LiteLLM és el camí més ràpid cap a aplicacions LLM multi-proveïdor sense bloqueig del proveïdor.- Comença amb una interfície compatible amb OpenAI, després puja de nivell al servidor intermediari per a la governança.- Inverteix aviat en l'encaminament, la resiliència i l'observabilitat; els necessitaràs a la segona setmana, no al sisè mes.- Els tutorials anteriors cobreixen el 80% del que utilitzaràs diàriament; la resta és la salsa secreta del teu producte.### Preguntes freqüentsP1: Quin és el millor tutorial de LiteLLM per a principiants?Comença amb el curs intensiu de LiteLLM a YouTube per a un recorregut visual ràpid, després llegeix la guia oficial d'inici per al servidor intermediari. El tutorial de DataCamp proporciona exemples pràctics que pots copiar.P2: Com utilitzo LiteLLM com a servidor intermediari compatible amb OpenAI?Executa el servidor intermediari de LiteLLM i apunta l'URL base del teu SDK als punts finals `/v1` del servidor intermediari. Mantén els detalls del proveïdor a la configuració de LiteLLM perquè el codi de la teva aplicació segueixi sent portàtil.P3: Pot LiteLLM enrutar entre OpenAI, Anthropic i Gemini automàticament?Sí. Defineix models i estratègies d'encaminament a la configuració de LiteLLM per canviar entre proveïdors per latència, cost o qualitat. També pots establir alternatives per a la fiabilitat.P4: Com habilito la transmissió i la trucada d'eines/funcions amb LiteLLM?Utilitza l'API compatible amb OpenAI mitjançant LiteLLM i habilita `stream=True` (o SSE al teu SDK). Per a la trucada d'eines, segueix el format de trucada de funció d'OpenAI; LiteLLM ho reenvia al proveïdor de destinació.P5: Quina és la manera més ràpida de controlar els costos amb LiteLLM?Centralitza les sol·licituds a través del servidor intermediari, habilita el registre d'ús i aplica límits de velocitat i pressupostos per clau. Enruta diferents càrregues de treball a models optimitzats per costos i fixa versions per evitar sorpreses.
Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

La millor alternativa a Grok per a una recerca profunda i citada

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs