Atnaujinta 2025 m. rugsėjo 25 d.
7 min
/v1/chat/completions galinio taško sukūrimas.pip install litellmexport OPENAI_API_KEY=sk-...# Neprivaloma: daugiau tiekėjųexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # arba "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Paleiskite aukščiau pateiktą greitos pradžios kodą.- Tikslas: Atlikite pirmąjį su OpenAI suderinamą užklausą per LiteLLM.- Praktinis kūrėjas- Perskaitykite DataCamp vadovą ir išplėskite pavyzdžius transliacija ir pakartotiniais bandymais.- Pridėkite du tiekėjus ir išbandykite atsarginius variantus.- Komandos / gamybos savininkas- Išstudijuokite oficialų Pradžios vadovą.- Paleiskite tarpinį serverį, pridėkite stebėjimą ir išlaidų stebėjimą.- Užtikrinkite greičio apribojimus ir PII redagavimo politiką.—## Gilus panirimas: Modeliai, kuriuos naudosite kas savaitę### OpenAI Suderinamumas kaip sąsajos sutartis- Traktuokite OpenAI API formą kaip savo programos sutartį. Visos užklausos eina į jūsų LiteLLM tarpinio serverio `/v1/*` galinius taškus.- Keiskite modelius (pvz., `gpt-4o` → `claude-3-5`) pagal konfigūraciją, o ne kodą.### Modelio maršrutizavimas pagal naudojimo atvejį- Latentinei trukmei jautrus kelias: maršrutizuoti į greitus, pigesnius modelius.- Samprotavimo kelias: maršrutizuoti į aukštesnės kokybės modelius, skirtus išplėstiniam generavimui (RAG) arba įrankių naudojimui.- Privatumo kelias: maršrutizuoti į vietinį / Ollama PII segmentams.### Išlaidų apsaugos priemonės- Pažymėkite užklausas su `user_id` / `team`.- Nustatykite biudžetus kiekvienai komandai / modeliui.- Registruokite žetonų naudojimą į centrinę saugyklą ir įspėkite apie anomalijas.### Atsparumas- Įgalinkite pakartotinius bandymus su "jitter".- Konfigūruokite skirtuosius laikus kiekvienam tiekėjui ir grandinės pertraukiklius, esant pakartotiniams gedimams.- Apibrėžkite tiekėjų prioritetus ir aiškius atsarginius variantus.### Stebėjimas- Užfiksuokite užklausos / atsakymo metaduomenis, latentinio laiko histogramas ir modelį / versiją.- Redaguokite paslaptis / PII žurnaluose.- Susiekite sekimus tarp paslaugų, kad greitai rastumėte lėtus skambučius.—## LiteLLM tarpinio serverio konfigūracijos pavyzdys (paruoštas gamybai pradedantysis)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Praktiškas, pavyzdžiais pagrįstas straipsnis.- Oficialūs LiteLLM dokumentai, skirti pradžiai ir tarpinio serverio geriausiai praktikai.—## Veiksmų planas: Jūsų kitos 7 dienos1–2 dienos: Atlikite intensyvų kursą ir greitą pradžią; atlikite pirmąjį tarpinį užklausą.3–4 dienos: Pridėkite antrą tiekėją ir transliaciją; nustatykite skirtuosius laikus, pakartotinius bandymus.5 diena: Paleiskite tarpinį serverį su konfigūracija; maršrutizuokite pagal naudojimo atvejį (latentinis laikas prieš samprotavimą).6 diena: Pridėkite registravimą, išlaidų stebėjimą ir redagavimą.7 diena: Apkrovos testas; imituokite tiekėjo gedimus; patikrinkite atsarginius variantus.—## Pagrindiniai dalykai- LiteLLM yra greičiausias kelias į kelių tiekėjų LLM programas be tiekėjo įsipareigojimo.- Pradėkite nuo su OpenAI suderinamos sąsajos, tada pakilkite į tarpinį serverį, kad galėtumėte valdyti.- Anksti investuokite į maršrutizavimą, atsparumą ir stebėjimą – jums jų prireiks antrą savaitę, o ne šeštą mėnesį.- Aukščiau pateikti vadovai apima 80% to, ką naudosite kasdien; visa kita yra jūsų produkto slaptas padažas.### DUKQ1:Kuris yra geriausias LiteLLM vadovas pradedantiesiems?Pradėkite nuo LiteLLM intensyvaus kurso „YouTube“, kad gautumėte greitą vizualinę apžvalgą, tada perskaitykite oficialų Pradžios vadovą apie tarpinį serverį. DataCamp vadovas pateikia praktinių pavyzdžių, kuriuos galite kopijuoti.Q2:Kaip naudoti LiteLLM kaip su OpenAI suderinamą tarpinį serverį?Paleiskite LiteLLM tarpinį serverį ir nukreipkite savo SDK bazinį URL į tarpinio serverio `/v1` galinius taškus. Laikykite tiekėjo informaciją LiteLLM konfigūracijoje, kad jūsų programos kodas išliktų perkeliamas.Q3:Ar LiteLLM gali automatiškai maršrutizuoti tarp OpenAI, Anthropic ir Gemini?Taip. Apibrėžkite modelius ir maršrutizavimo strategijas LiteLLM konfigūracijoje, kad perjungtumėte tiekėjus pagal latentinį laiką, kainą ar kokybę. Taip pat galite nustatyti atsarginius variantus patikimumui.Q4:Kaip įgalinti transliaciją ir įrankių / funkcijų iškvietimą su LiteLLM?Naudokite su OpenAI suderinamą API per LiteLLM ir įgalinkite `stream=True` (arba SSE savo SDK). Norėdami iškviesti įrankius, vadovaukitės OpenAI funkcijų iškvietimo formatu – LiteLLM persiunčia jį tiksliniam tiekėjui.Q5:Koks yra greičiausias būdas kontroliuoti išlaidas su LiteLLM?Centralizuokite užklausas per tarpinį serverį, įgalinkite naudojimo registravimą ir užtikrinkite kiekvieno rakto greičio apribojimus ir biudžetus. Maršrutizuokite skirtingus darbo krūvius į išlaidų optimizuotus modelius ir prisekite versijas, kad išvengtumėte netikėtumų.
Kaip įvaldyti ChatPDF: Greitesnės įžvalgos iš sudėtingų dokumentų

Geriausia X automatinio vertimo alternatyva greitiems ir tiksliems dokumentams

„Samsung“ AI vertimas neprieinamas Irane? Praktiniai sprendimai

Persų kalbos vertimo įrankiai: praktiškas vadovas greitesniam ir tikslesniam darbui

Geriausia Grok alternatyva giluminiams, cituojamiems tyrimams

15 geriausių AI vaizdų generatoriaus funkcijų, kurias iš tikrųjų naudosite