Frissítve: 2025. szept 25.
7 perc
/v1/chat/completions végpont létrehozása.pip install litellmexport OPENAI_API_KEY=sk-...# Opcionális: további szolgáltatókexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # vagy "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Futtassa a fenti gyors kezdés kódot.- Cél: Tegye meg első OpenAI-kompatibilis kérését LiteLLM-en keresztül.- Gyakorlati fejlesztő- Olvassa el a DataCamp oktatóanyagot, és bővítse példáit streaminggel és újrapróbálkozással.- Adjon hozzá két szolgáltatót és tesztelje a visszaeséseket.- Csapat/termelési vezető- Tanulmányozza a hivatalos Kezdőt.- Állítsa fel a proxyt, és adja hozzá megfigyelés, költségkövetés funkciót.- Érvényesítsen aránykorlátokat és PII eltakarási szabályokat.—## Mélyebb elemzés: Minták, amelyeket hetente használni fog### OpenAI kompatibilitás, mint interfész szerződés- Az OpenAI API formátumát tekintse alkalmazása szerződésének. Minden kérés a LiteLLM proxy `/v1/*` végpontjára érkezik.- Modellváltás (pl. `gpt-4o` → `claude-3-5`) konfiguráció alapján, nem kód módosítással.### Modellirányítás használati eset szerint- Késésérzékeny útvonal: gyors, olcsó modellek felé irányítás.- Gondolkodó útvonal: magasabb minőségű modellek felé irányítás tárolóalapú generáláshoz vagy eszközhasználathoz.- Adatvédelmi útvonal: helyi/Ollama modellhez irányítás személyes adatokhoz.### Költségkorlátok- Kérjen címkézést `user_id`/`team` szerint.- Állítson be csapatonként/modellenként költségkeretet.- Tokenhasználat naplózása központi tárolóba, és rendellenességek esetén riasztás.### Ellenállóképesség- Engedélyezzen újrapróbálkozást késleltetéssel (jitter).- Időtúllépések szolgáltatónként, valamint áramkör megszakítók ismétlődő hibákhoz.- Szolgáltató prioritások és egyértelmű visszaesések definiálása.### Megfigyelhetőség- Kérések és válaszok metaadatainak, késési hisztogramok és modell/verzió információinak rögzítése.- Titkok és személyes adatok eltakarása a naplókban.- Keresztszolgáltatású trace-ek összekapcsolása a lassú hívások gyors azonosítására.—## Példa LiteLLM proxy konfiguráció (termelésre kész kezdő)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Egy gyakorlati, példákon alapuló cikk.- A hivatalos LiteLLM dokumentáció az induláshoz és a proxy ajánlott gyakorlatokhoz.—## Teendők: Az elkövetkező 7 nap1–2. nap: Vegye végig az alapozó kurzust és a gyors kezdést; tegye meg első proxyn keresztüli kérését.3–4. nap: Adjon hozzá második szolgáltatót és streaminget; állítsa be az időkorlátokat, újrapróbálkozásokat.5. nap: Állítsa fel a proxyt konfigurációval; útvonalakat állítson be használati eset szerint (késés vs gondolkodás).6. nap: Adjon hozzá naplózást, költségkövetést és eltakarási szabályokat.7. nap: Terhelés teszt; szolgáltatói hibák szimulálása; visszaesések ellenőrzése.—## Főbb tanulságok- A LiteLLM a leggyorsabb út a több szolgáltatós LLM alkalmazásokhoz, vendorfüggőség nélkül.- Induljon OpenAI-kompatibilis interfésszel, majd lépjen tovább a proxyra a kormányzás érdekében.- Fektessen be korán az útvonalkezelésbe, ellenállóképességbe és megfigyelhetőségbe – ezekre a második héten, nem az ötödik hónapban lesz szüksége.- A fenti oktatóanyagok lefedik a napi használat 80%-át; a többi a termék titkos receptje.### GYIKQ1: Melyik a legjobb LiteLLM oktatóanyag kezdőknek?Kezdje a LiteLLM Crash Course videóval a YouTube-on a gyors vizuális bemutatóért, majd olvassa el a hivatalos Kezdő útmutatót a proxyhoz. A DataCamp oktatóanyag gyakorlati példákat is ad, amelyeket másolhat.Q2: Hogyan használhatom a LiteLLM-et OpenAI-kompatibilis proxyként?Futtassa a LiteLLM proxyt, és irányítsa az SDK bázis-URL-jét a proxy `/v1` végpontjára. A szolgáltatói adatokat a LiteLLM konfigurációban tartsa, hogy az alkalmazás kódja hordozható maradjon.Q3: Tud-e a LiteLLM automatikusan útvonalat választani OpenAI, Anthropic és Gemini között?Igen. Határozza meg a modelleket és útvonalkezelési stratégiákat a LiteLLM konfigurációban, hogy késés, költség vagy minőség alapján váltson szolgáltatót. Ezen felül beállíthat visszaeséseket is a megbízhatóság érdekében.Q4: Hogyan engedélyezhetem a streaminget és a funkció/eszköz hívást LiteLLM-mel?Használja az OpenAI-kompatibilis API-t LiteLLM-en keresztül, és állítsa be a `stream=True` opciót (vagy SSE-t az SDK-ban). Az eszközhívásnál kövesse az OpenAI funkció-hívási formátumot – a LiteLLM továbbítja a cél szolgáltatóhoz.Q5: Mi a leggyorsabb módja a költségkontrollnak LiteLLM-vel?<a113>Központosítsa a kéréseket a proxy előtt, engedélyezze a használat naplózását, és állítson be kulcs-specifikus aránykorlátokat és költségkereteket. Különböző munkaterheléseket irányítson költséghatékony modellekre, és rögzítsen verziókat meglepetések elkerülése végett.
Hogyan sajátítsuk el a ChatPDF használatát: Gyorsabb betekintés sűrű dokumentumokból

A legjobb X automatikus fordítási alternatíva gyors és pontos dokumentumokhoz

Samsung AI fordítás nem elérhető Iránban? Gyakorlati megoldások

Perzsa fordító eszközök: gyakorlati útmutató a gyorsabb, pontosabb munkához

A legjobb Grok alternatíva mély, hivatkozott kutatáshoz

A 15 legfontosabb funkció, amit egy AI kép generátorban ténylegesen használni fogsz