Zaktualizowano 25 wrz 2025
7 min
/v1/chat/completions.pip install litellmexport OPENAI_API_KEY=sk-...# Opcjonalnie: więcej dostawcówexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # lub "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Uruchom kod szybkiego startu powyżej.- Cel: wykonaj pierwsze zapytanie kompatybilne z OpenAI przez LiteLLM.- Dla praktyków budujących- Przeczytaj samouczek DataCamp i rozbuduj przykłady o streaming i ponowne próby.- Dodaj dwóch dostawców i testuj mechanizmy fallback.- Dla właścicieli zespołów/produkcji- Przestudiuj oficjalny przewodnik Getting Started.- Uruchom proxy, dodaj obserwowalność i śledzenie kosztów.- Wdróż limity prędkości i polityki redakcji danych osobowych (PII).—## Dogłębna analiza: wzorce, które będziesz stosować co tydzień### Kompatybilność z OpenAI jako kontrakt interfejsu- Traktuj API OpenAI jako kontrakt aplikacji. Wszystkie żądania kieruj do endpointów `/v1/*` proxy LiteLLM.- Wymieniaj modele (np. `gpt-4o` → `claude-3-5`) w konfiguracji, a nie w kodzie.### Trasowanie modeli według zastosowania- Ścieżka niskiej latencji: kieruj do szybkich, tańszych modeli.- Ścieżka rozumowania: kieruj do modeli wyższej jakości dla generowania wspomaganego pobieraniem (RAG) lub użycia narzędzi.- Ścieżka prywatności: kieruj do modeli lokalnych/Ollama dla segmentów z danymi osobowymi.### Ochrona kosztów- Oznaczaj żądania `user_id` i `team`.- Ustawiaj budżety dla zespołów i modeli.- Loguj zużycie tokenów do centralnej bazy i alertuj na anomalie.### Odporność- Włącz ponowne próby z jitterem.- Konfiguruj timeouty na każdego dostawcę oraz ograniczniki obwodów na powtarzające się awarie.- Definiuj priorytety dostawców i jasne fallbacki.### Obserwowalność- Zbieraj metadane żądań/odpowiedzi, histogramy latencji, model i wersję.- Redaguj sekrety i dane osobowe w logach.- Koreluj ślady w usługach, aby szybko lokalizować wolne wywołania.—## Przykładowa konfiguracja LiteLLM Proxy (gotowa do produkcji)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Praktyczny, oparty na przykładach artykuł.- Oficjalna dokumentacja LiteLLM dotycząca startu i najlepszych praktyk proxy.—## Plan działania: Twoje następne 7 dniDzień 1–2: Zrób crash course i szybki start; wykonaj pierwsze zapytanie przez proxy.Dzień 3–4: Dodaj drugiego dostawcę i funkcję streamingu; ustaw timeouty, ponowne próby.Dzień 5: Uruchom proxy z konfiguracją; kieruj zapytania po zastosowaniach (latencja vs rozumowanie).Dzień 6: Dodaj logowanie, śledzenie kosztów i redakcję danych.Dzień 7: Test obciążeniowy; symuluj awarie dostawców; zweryfikuj fallbacki.—## Kluczowe wnioski- LiteLLM to najszybsza ścieżka do aplikacji multi-dostawczych LLM bez uzależnienia od jednego dostawcy.- Zacznij od interfejsu kompatybilnego z OpenAI, potem przejdź do proxy dla zarządzania i nadzoru.- Wczesna inwestycja w trasowanie, odporność i obserwowalność zaprocentuje już w drugim tygodniu, nie po pół roku.- Wymienione samouczki pokrywają 80% codziennego użycia; reszta to tajemnica Twojego produktu.### FAQQ1:Jaki jest najlepszy samouczek LiteLLM dla początkujących?Zacznij od LiteLLM Crash Course na YouTube dla szybkiego wizualnego przeglądu, potem przeczytaj oficjalny przewodnik Getting Started dotyczący proxy. Samouczek DataCamp zawiera praktyczne, kopiowalne przykłady.Q2: Jak używać LiteLLM jako proxy kompatybilnego z OpenAI?Uruchom proxy LiteLLM i skieruj bazowy URL SDK na endpointy `/v1` proxy. Szczegóły dostawców przechowuj w konfiguracji LiteLLM, aby kod aplikacji był przenośny.Q3: Czy LiteLLM może automatycznie trasować między OpenAI, Anthropic i Gemini?Tak. Zdefiniuj modele i strategie trasowania w konfiguracji LiteLLM, aby przełączać dostawców według latencji, kosztów lub jakości. Możesz też ustawić mechanizmy fallback dla niezawodności.Q4: Jak włączyć streaming i wywoływanie funkcji/narzędzi w LiteLLM?Używaj API kompatybilnego z OpenAI przez LiteLLM i włącz `stream=True` (lub SSE w SDK). Do wywoływania funkcji stosuj format OpenAI — LiteLLM przekazuje to do wybranego dostawcy.Q5: Jaki jest najszybszy sposób kontroli kosztów z LiteLLM?Centralizuj zapytania przez proxy, włącz logowanie użycia i egzekwuj limity prędkości oraz budżety per klucz. Kieruj różne obciążenia do modeli zoptymalizowanych kosztowo i utrzymuj stałe wersje, by uniknąć niespodzianek.
Jak opanować ChatPDF: szybsze uzyskiwanie informacji z obszernych dokumentów

Najlepsza alternatywa dla X Auto-Translation do szybkiego i dokładnego tłumaczenia dokumentów

Tłumaczenie AI Samsung niedostępne w Iranie? Praktyczne rozwiązania

Narzędzia do tłumaczenia perskiego: praktyczny przewodnik po szybszej i dokładniejszej pracy

Najlepsza alternatywa dla Grok do dogłębnych, cytowanych badań

15 najważniejszych funkcji generatora obrazów AI, które naprawdę wykorzystasz