Aggiornato il 25 set 2025
7 min
/v1/chat/completions.pip install litellmexport OPENAI_API_KEY=sk-...# Opzionale: altri fornitoriexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # o "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Esegui il codice quickstart sopra.- Obiettivo: fare la tua prima richiesta compatibile OpenAI tramite LiteLLM.- Per sviluppatori pratici- Leggi il tutorial DataCamp ed estendi con streaming e ritentativi.- Aggiungi due fornitori e testa i fallback.- Per responsabili di team/produzione- Studia la guida ufficiale Getting Started.- Avvia il proxy, aggiungi osservabilità e monitoraggio costi.- Applica limiti di velocità e policy di redazione dati sensibili.—## Approfondimento: schemi da usare ogni settimana### Compatibilità OpenAI come contratto d’interfaccia- Considera la forma API OpenAI come contratto per la tua app. Tutte le richieste vanno agli endpoint `/v1/*` del proxy LiteLLM.- Cambia modelli (es. `gpt-4o` → `claude-3-5`) tramite configurazione, non codice.### Instradamento modelli per caso d’uso- Percorso a bassa latenza: usa modelli veloci e meno costosi.- Percorso di ragionamento: usa modelli di qualità superiore per generazione aumentata da recupero o uso di strumenti.- Percorso privacy: usa modelli locali/Ollama per segmenti con dati sensibili.### Controlli di costo- Tagga le richieste con `user_id`/`team`.- Imposta budget per team/modello.- Registra l’uso dei token in un archivio centrale e avvisa per anomalie.### Resilienza- Attiva ritentativi con jitter.- Configura timeout per fornitore e circuit breaker su errori ripetuti.- Definisci priorità fornitori e fallback espliciti.### Osservabilità- Cattura metadati richieste/risposte, istogrammi di latenza e modello/versione.- Redigi segreti/dati sensibili nei log.- Correlaziona tracciamenti tra servizi per individuare rapidamente chiamate lente.—## Esempio di configurazione proxy LiteLLM (starter per produzione)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Un articolo pratico e ricco di esempi.- La documentazione ufficiale LiteLLM per l’avvio e le best practice del proxy.—## Piano d’azione: i tuoi prossimi 7 giorniGiorni 1–2: segui il crash course e quickstart; esegui la tua prima richiesta tramite proxy.Giorni 3–4: aggiungi un secondo fornitore e streaming; configura timeout e ritentativi.Giorno 5: avvia il proxy con configurazione; instrada per caso d’uso (latenza vs ragionamento).Giorno 6: aggiungi logging, monitoraggio dei costi e redazione dati.Giorno 7: esegui test di carico; simula guasti fornitori; verifica i fallback.—## Punti chiave- LiteLLM è la via più veloce per app LLM multi-fornitore senza vincoli di vendor lock-in.- Parti da un’interfaccia compatibile OpenAI, poi passa al proxy per la governance.- Investi presto in instradamento, resilienza e osservabilità — ti serviranno dalla seconda settimana, non al sesto mese.- I tutorial sopra coprono l’80% di ciò che userai quotidianamente; il resto è la tua ricetta segreta di prodotto.### FAQD1: Qual è il miglior tutorial LiteLLM per principianti?Inizia con il LiteLLM Crash Course su YouTube per una rapida panoramica visiva, poi leggi la guida ufficiale Getting Started per il proxy. Il tutorial DataCamp offre esempi pratici da copiare.D2: Come uso LiteLLM come proxy compatibile OpenAI?Avvia il proxy LiteLLM e punta la base URL del tuo SDK agli endpoint `/v1` del proxy. Tieni i dettagli dei fornitori nella configurazione LiteLLM per mantenere il codice dell’app portabile.D3: LiteLLM può instradare automaticamente tra OpenAI, Anthropic e Gemini?Sì. Definisci modelli e strategie di instradamento nella configurazione LiteLLM per cambiare fornitore in base a latenza, prezzo o qualità. Puoi anche impostare fallback per affidabilità.D4: Come abilito streaming e chiamate a funzioni/strumenti con LiteLLM?Usa l’API compatibile OpenAI tramite LiteLLM e attiva `stream=True` (o SSE nel tuo SDK). Per chiamate a funzioni, segui il formato OpenAI function-calling — LiteLLM lo inoltra al fornitore target.D5: Qual è il modo più rapido per controllare i costi con LiteLLM?Centralizza le richieste tramite proxy, attiva il logging degli usi e applica limiti per chiave e budget. Instrada i carichi verso modelli ottimizzati per costo e blocca versioni per evitare sorprese.
Come Padroneggiare ChatPDF: Approfondimenti Rapidi da Documenti Complessi

La migliore alternativa a X Auto-Translation per documenti rapidi e precisi

La traduzione AI di Samsung non disponibile in Iran? Soluzioni pratiche

Strumenti di traduzione persiana: una guida pratica per un lavoro più rapido e preciso

La migliore alternativa a Grok per ricerche approfondite e citate

Le 15 principali funzionalità dei generatori di immagini AI che userai davvero