Aktualizované 25. sep 2025
7 min
/v1/chat/completions.pip install litellmexport OPENAI_API_KEY=sk-...# Voliteľné: viac poskytovateľovexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # alebo "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Spustite kód rýchleho štartu vyššie.- Cieľ: Uskutočnite svoju prvú s OpenAI kompatibilnú požiadavku cez LiteLLM.- Praktický tvorca- Prečítajte si DataCamp tutoriál a rozšírte príklady pomocou streamingu a opakovaných pokusov.- Pridajte dvoch poskytovateľov a otestujte prepínanie.- Vlastník tímu/produkcie- Preštudujte si oficiálny sprievodca Getting Started.- Zaveďte proxy, pridajte pozorovateľnosť a sledovanie nákladov.- Vynucujte limity rýchlosti a zásady redakcie PII.—## Hlboký ponor: Vzory, ktoré budete používať týždenne### Kompatibilita s OpenAI ako zmluvné rozhranie- Zaobchádzajte s tvarom OpenAI API ako so zmluvou vašej aplikácie. Všetky požiadavky smerujú na endpointy `/v1/*` vašej LiteLLM proxy.- Vymieňajte modely (napr. `gpt-4o` → `claude-3-5`) konfiguráciou, nie kódom.### Smerovanie modelu podľa prípadu použitia- Cesta citlivá na latenciu: smerujte na rýchle, lacnejšie modely.- Cesta odôvodňovania: smerujte na kvalitnejšie modely pre generovanie rozšírené o vyhľadávanie (RAG) alebo použitie nástrojov.- Cesta ochrany súkromia: smerujte na lokálne/Ollama pre segmenty PII.### Ochranné prvky nákladov- Označte požiadavky pomocou `user_id`/`team`.- Nastavte rozpočty pre každý tím/model.- Protokolujte využitie tokenov do centrálneho úložiska a upozorňujte na anomálie.### Odolnosť- Povoľte opakované pokusy s jitterom.- Konfigurujte časové limity pre každého poskytovateľa a ističe pri opakovaných zlyhaniach.- Definujte priority poskytovateľa a explicitné prepínanie.### Pozorovateľnosť- Zachytávajte metadáta požiadaviek/odpovedí, histogramy latencie a model/verziu.- Redigujte tajomstvá/PII v protokoloch.- Korelujte stopy medzi službami, aby ste rýchlo našli pomalé volania.—## Príklad konfigurácie LiteLLM Proxy (Štartér pripravený na produkciu)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Praktický článok založený na príkladoch.- Oficiálna dokumentácia LiteLLM pre začiatky a osvedčené postupy pre proxy.—## Akčný plán: Vašich nasledujúcich 7 dníDeň 1–2: Absolvujte crash course a rýchly štart; uskutočnite svoju prvú požiadavku cez proxy.Deň 3–4: Pridajte druhého poskytovateľa a streaming; nastavte časové limity, opakované pokusy.Deň 5: Zaveďte proxy s konfiguráciou; smerujte podľa prípadu použitia (latencia vs. odôvodňovanie).Deň 6: Pridajte protokolovanie, sledovanie nákladov a redakciu.Deň 7: Otestujte zaťaženie; simulujte zlyhania poskytovateľa; overte prepínanie.—## Kľúčové poznatky- LiteLLM je najrýchlejšia cesta k aplikáciám LLM s viacerými poskytovateľmi bez uzamknutia dodávateľa.- Začnite s s OpenAI kompatibilným rozhraním a potom prejdite na proxy pre správu.- Investujte včas do smerovania, odolnosti a pozorovateľnosti – budete ich potrebovať v druhom týždni, nie v šiestom mesiaci.- Vyššie uvedené tutoriály pokrývajú 80 % toho, čo budete denne používať; zvyšok je tajná prísada vášho produktu.### FAQOtázka 1: Aký je najlepší LiteLLM tutoriál pre začiatočníkov?Začnite s LiteLLM Crash Course na YouTube pre rýchly vizuálny návod a potom si prečítajte oficiálny sprievodca Getting Started pre proxy. DataCamp tutoriál poskytuje praktické príklady, ktoré si môžete skopírovať.Otázka 2: Ako používam LiteLLM ako s OpenAI kompatibilnú proxy?Spustite LiteLLM proxy a nasmerujte základnú URL adresu svojho SDK na endpointy `/v1` proxy. Podrobnosti o poskytovateľovi uchovávajte v konfigurácii LiteLLM, aby kód vašej aplikácie zostal prenosný.Otázka 3: Môže LiteLLM automaticky smerovať medzi OpenAI, Anthropic a Gemini?Áno. Definujte modely a stratégie smerovania v konfigurácii LiteLLM na prepínanie medzi poskytovateľmi podľa latencie, nákladov alebo kvality. Môžete tiež nastaviť prepínanie pre spoľahlivosť.Otázka 4: Ako povolím streaming a volanie nástrojov/funkcií pomocou LiteLLM?Použite s OpenAI kompatibilné API cez LiteLLM a povoľte `stream=True` (alebo SSE vo vašom SDK). Pre volanie nástrojov postupujte podľa formátu volania funkcií OpenAI – LiteLLM ho prepošle cieľovému poskytovateľovi.Otázka 5: Aký je najrýchlejší spôsob, ako kontrolovať náklady pomocou LiteLLM?Centralizujte požiadavky prostredníctvom proxy, povoľte protokolovanie používania a vynucujte limity rýchlosti a rozpočty pre každý kľúč. Smerujte rôzne pracovné zaťaženia na modely optimalizované pre náklady a pripnite verzie, aby ste sa vyhli prekvapeniam.
Ako zvládnuť ChatPDF: Rýchlejšie získavanie informácií z rozsiahlych dokumentov

Najlepšia alternatíva k X Auto-Translation pre rýchle a presné dokumenty

Samsung AI preklad nedostupný v Iráne? Praktické riešenia

Nástroje na preklad do perzštiny: praktický sprievodca pre rýchlejšiu a presnejšiu prácu

Najlepšia alternatíva k Grok pre hĺbkový a citovaný výskum

15 najlepších funkcií generátora obrázkov s umelou inteligenciou, ktoré budete skutočne používať