Aktualizováno 25. zář 2025
7 min
/v1/chat/completions endpoint.pip install litellmexport OPENAI_API_KEY=sk-...# Volitelné: další poskytovateléexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # nebo "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Spusťte výše uvedený quickstart kód.- Cíl: Proveďte první požadavek kompatibilní s OpenAI přes LiteLLM.- Praktický vývojář- Přečtěte si DataCamp tutoriál a rozšiřte příklady o streamování a opakování požadavků.- Přidejte dva poskytovatele a otestujte záložní zdroje.- Vlastník týmu/produkce- Studujte oficiální průvodce Začínáme.- Nasadťe proxy, přidejte pozorovatelnost a sledování nákladů.- Vynucujte limity rychlosti a zásady pro redakci citlivých údajů.—## Hloubkově: Vzory, které budete používat týdně### OpenAI kompatibilita jako smlouva rozhraní- Vnímejte API OpenAI jako smlouvu vaší aplikace. Všechny požadavky putují na LiteLLM proxy `/v1/*` endpointy.- Měňte modely (např. `gpt-4o` → `claude-3-5`) pomocí konfigurace, nikoli kódu.### Směrování modelů podle použití- Cesta citlivá na latenci: směrujte na rychlé, levnější modely.- Cesta pro uvažování: směrujte na kvalitnější modely pro generování s využitím zdrojů (RAG) nebo nástroje.- Cesta soukromí: směrujte na lokální/Ollama modely pro segmenty s PII.### Ochrana nákladů- Označujte požadavky `user_id`/`team`.- Nastavte rozpočty podle týmu/modelu.- Logujte využití tokenů do centrální databáze a nastavte výstrahy na anomálie.### Odolnost- Povolit opakování s jitterem.- Nastavit timeouty pro poskytovatele a obvody (circuit breakers) při opakovaných selháních.- Definovat priority poskytovatelů a explicitní záložní plány.### Pozorovatelnost- Zachytávat metadata požadavků/odpovědí, histogramy latence a verze modelů.- Redigovat tajné a osobní informace v logu.- Korelovat trasování napříč službami pro rychlou detekci pomalých volání.—## Příklad konfigurace LiteLLM proxy (startovací nastavení pro produkci)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Praktický článek založený na příkladech.- Oficiální LiteLLM dokumentace pro začátečníky a osvědčené postupy pro proxy.—## Akční plán: Vašich dalších 7 dníDen 1–2: Projděte crash course a quickstart; proveďte první požadavek přes proxy.Den 3–4: Přidejte druhého poskytovatele a streamování; nastavte timeouty a opakování požadavků.Den 5: Nasadte proxy s konfigurací; směrujte požadavky podle scénáře (latence vs. uvažování).Den 6: Přidejte logování, sledování nákladů a redakci citlivých údajů.Den 7: Provádějte testy zátěže; simulujte selhání poskytovatelů; ověřte záložní plány.—## Hlavní poznatky- LiteLLM je nejrychlejší cesta k multi-provider LLM aplikacím bez vázání na jednoho dodavatele.- Začněte s OpenAI kompatibilním rozhraním a pak přejděte na proxy kvůli správě a řízení.- Investujte včas do směrování, odolnosti a pozorovatelnosti — budete je potřebovat už ve druhém týdnu, ne až za šest měsíců.- Návody výše pokrývají 80 % věcí, které budete denně používat; zbytek je tajná ingredience vašeho produktu.### Často kladené otázkyQ1: Jaký je nejlepší LiteLLM návod pro začátečníky?Začněte LiteLLM Crash Course na YouTube pro rychlý vizuální přehled, pak si přečtěte oficiální Začínáme s proxy. DataCamp průvodce nabízí praktické příklady k přímému použití.Q2: Jak používat LiteLLM jako proxy kompatibilní s OpenAI?Spusťte LiteLLM proxy a nastavte základní URL vašeho SDK na proxy `/v1` endpointy. Detaily poskytovatelů držte v konfiguraci LiteLLM, aby byl kód aplikace přenosný.Q3: Může LiteLLM automaticky směrovat mezi OpenAI, Anthropic a Gemini?Ano. Definujte modely a strategie směrování v konfiguraci LiteLLM pro přepínání podle latence, ceny nebo kvality. Můžete také nastavit záložní plány pro spolehlivost.Q4: Jak zapnout streamování a volání nástrojů/funkcí s LiteLLM?Použijte OpenAI-kompatibilní API přes LiteLLM a aktivujte `stream=True` (nebo SSE v SDK). Pro volání funkcí nebo nástrojů dodržujte formát OpenAI function-calling — LiteLLM je přepošle cílovému poskytovateli.Q5: Jak nejrychleji kontrolovat náklady s LiteLLM?Centralizujte požadavky přes proxy, povolte logování využití a vynucujte limity rychlosti a rozpočty na klíč. Směřujte různé zátěže na modely optimalizované podle nákladů a připněte verze, aby nedošlo k překvapením.
Jak zvládnout ChatPDF: Rychlejší přehledy z rozsáhlých dokumentů

Nejlepší alternativa k X Auto-Translation pro rychlé a přesné dokumenty

Samsung AI překlad není v Íránu dostupný? Praktická řešení

Nástroje pro překlad do perštiny: praktický průvodce rychlejší a přesnější prací

Nejlepší alternativa k Grok pro hluboký, citovaný výzkum

15 nejlepších funkcí generátoru obrázků s umělou inteligencí, které skutečně využijete