What is the best LiteLLM tutorial for beginners?

Start with the LiteLLM Crash Course on YouTube for a quick visual walkthrough, then read the official Getting Started guide for the proxy. The DataCamp tutorial provides practical examples you can copy.

How do I use LiteLLM as an OpenAI-compatible proxy?

Run the LiteLLM proxy and point your SDK’s base URL to the proxy’s `/v1` endpoints. Keep provider details in the LiteLLM config so your application code stays portable.

Can LiteLLM route between OpenAI, Anthropic, and Gemini automatically?

Yes. Define models and routing strategies in the LiteLLM config to switch between providers by latency, cost, or quality. You can also set fallbacks for reliability.

How do I enable streaming and tool/function calling with LiteLLM?

Use the OpenAI-compatible API via LiteLLM and enable `stream=True` (or SSE in your SDK). For tool calling, follow the OpenAI function-calling format—LiteLLM forwards it to the target provider.

What’s the fastest way to control costs with LiteLLM?

Centralize requests through the proxy, enable usage logging, and enforce per-key rate limits and budgets. Route different workloads to cost-optimized models and pin versions to avoid surprises.

बेस्ट LiteLLM ट्यूटोरियल: LLM गेटवे में महारत हासिल करने के लिए आपका 2025 गाइड

यदि आप OpenAI, Azure OpenAI, Anthropic, Gemini, लोकल मॉडल और इनके बीच की सभी चीज़ों को एक साथ जोड़ रहे हैं, तो LiteLLM वह स्विस आर्मी नाइफ है जिसकी आपको तलाश थी। यह एक ड्रॉप-इन, OpenAI-कम्पेटिबल लेयर और प्रॉक्सी के रूप में काम करता है ताकि आपके ऐप्स एक भाषा बोल सकें, जबकि आप पर्दे के पीछे मॉडल, वेंडर और कीमतों को बदल सकते हैं। चुनौती? यह पता लगाना कि शुरुआत कहां से करें—और कौन से संसाधन वास्तव में आपके समय के लायक हैं।

यह व्यावहारिक, समाधान-उन्मुख गाइड 2025 में सर्वश्रेष्ठ LiteLLM ट्यूटोरियल को क्यूरेट करता है, आपको दिखाता है कि प्रत्येक संसाधन किसके लिए है और प्रोडक्शन का सबसे तेज़ मार्ग क्या है। हम त्वरित जीत, गहरे विश्लेषण और लड़ाई में आजमाए हुए पैटर्न को मिलाएंगे जिन्हें आप कॉपी कर सकते हैं।

अंत तक, आप जान जाएंगे कि कौन से LiteLLM ट्यूटोरियल पहले देखने या पढ़ने हैं, LiteLLM प्रॉक्सी को कैसे स्पिन अप करना है और OpenAI SDKs, स्ट्रीमिंग, रिट्राई, रेट लिमिट, मॉडल रूटिंग और ऑब्जरवेबिलिटी के साथ कैसे इंटीग्रेट करना है।

—

LiteLLM क्या है (और टीमें इसकी कसम क्यों खाती हैं)?

LiteLLM एक OpenAI-कम्पेटिबल API और SDK प्रदान करता है जो आपको इसकी अनुमति देता है:

एक इंटरफ़ेस के साथ कई प्रोवाइडर (OpenAI, Azure OpenAI, Anthropic, Google, Cohere, Together, Ollama, और भी) पर रूट करें।

ऑथ, लॉगिंग, कॉस्ट ट्रैकिंग और पॉलिसी को स्टैंडर्डाइज करने के लिए एक सेंट्रलाइज्ड प्रॉक्सी (LLM गेटवे) तैनात करें।

अपने ऐप को फिर से लिखे बिना मॉडल बदलें।

यदि आप मल्टी-LLM ऐप्स बना रहे हैं, तो LiteLLM कनेक्टिंग टिश्यू है। आधिकारिक डॉक्स मजबूत हैं, और कई थर्ड-पार्टी ट्यूटोरियल अब वास्तविक दुनिया के उपयोग के मामलों को कवर करते हैं।

—

2025 में 10 सर्वश्रेष्ठ LiteLLM ट्यूटोरियल

नीचे टॉप संसाधन दिए गए हैं, वे किसके लिए हैं और आप क्या सीखेंगे—स्पष्टता, पूर्णता और प्रोडक्शन प्रासंगिकता के आधार पर रैंक किए गए हैं।

1) LiteLLM क्रैश कोर्स | शुरुआती लोगों के लिए (वीडियो)

इसके लिए सर्वश्रेष्ठ: विजुअल लर्नर और डेवलपर जो एक घंटे से भी कम समय में एंड-टू-एंड सेटअप चाहते हैं।

यह अच्छा क्यों है: इंस्टॉलेशन, पाइथन SDK बेसिक्स और OpenAI-कम्पेटिबल कॉल को इंटीग्रेट करने के तरीके को कवर करता है, जिसमें स्ट्रीमिंग जैसी मुख्य सुविधाओं का टूर शामिल है।

यदि आपने पहले कभी LiteLLM का उपयोग नहीं किया है, तो यहां से शुरुआत करें।

देखें: LiteLLM क्रैश कोर्स | शुरुआती लोगों के लिए।

2) डेटाकैंप: LiteLLM - प्रैक्टिकल उदाहरणों के साथ एक गाइड (लेख)

इसके लिए सर्वश्रेष्ठ: डेवलपर जो कोड-फर्स्ट, कॉपी-पेस्ट उदाहरण पसंद करते हैं।

यह अच्छा क्यों है: “हेलो वर्ल्ड” से लेकर स्ट्रीमिंग रिस्पॉन्स तक चलता है, यह दिखाता है कि बेसिक API कॉल कैसे करें और अपने उपयोग पैटर्न को कैसे स्केल करें।

पढ़ें: LiteLLM: प्रैक्टिकल उदाहरणों के साथ एक गाइड।

3) आधिकारिक डॉक्स: LiteLLM गेटिंग स्टार्टेड (डॉक्स)

इसके लिए सर्वश्रेष्ठ: टीमें जो प्रॉक्सी/गेटवे, पॉलिसी और रूटिंग की ज़रूरतों के साथ प्रोडक्शन में जा रही हैं।

यह अच्छा क्यों है: प्रॉक्सी का उपयोग कब करना है, कई प्रोवाइडर को कैसे वायर अप करना है, मॉडल को कैसे कॉन्फ़िगर करना है और एक्सेस को कैसे सेंट्रलाइज करना है, इस पर स्पष्ट मार्गदर्शन।

पढ़ें: LiteLLM — गेटिंग स्टार्टेड।

4) LiteLLM प्रॉक्सी के साथ एक OpenAI-कम्पेटिबल API बनाएं

आप क्या सीखेंगे: LiteLLM प्रॉक्सी को लोकल रूप से स्पिन अप करना, कई प्रोवाइडर के लिए एनवायरनमेंट वैरिएबल सेट करना, एक एकीकृत /v1/chat/completions एंडपॉइंट बनाना।

यह क्यों मायने रखता है: अधिकांश प्रोडक्शन टीमें ऑब्जरवेबिलिटी और पॉलिसी को अनलॉक करने के लिए प्रॉक्सी पर स्टैंडर्डाइज करती हैं।

इसे आधिकारिक गेटिंग स्टार्टेड और अपनी पसंदीदा भाषा SDK के साथ पेयर करें।

5) मल्टी-प्रोवाइडर रूटिंग और फॉलबैक

आप क्या सीखेंगे: आउटेज या रेट लिमिट को हैंडल करने के लिए प्रोवाइडर लिस्ट, हेल्थ चेक और ऑटोमैटिक फॉलबैक कॉन्फ़िगर करें।

यह क्यों मायने रखता है: आपके ऐप को रेसिलिएंट रखता है। उदाहरण के लिए, GPT-4o को प्राइमरी रूट करें और यदि लेटेंसी स्पाइक होती है तो Claude 3.5 या Gemini पर फॉलबैक करें।

6) कॉस्ट कंट्रोल और यूसेज मॉनिटरिंग

आप क्या सीखेंगे: प्रति-रिक्वेस्ट कॉस्ट को लॉग कैसे करें, कोटा कैसे लागू करें और टीम/ऐप द्वारा यूसेज को कैसे टैग करें।

यह क्यों मायने रखता है: LiteLLM वेंडरों में आपका सिंगल पेन ऑफ ग्लास हो सकता है। आपके CFO के कहने से पहले अलर्ट और बजट जोड़ें।

7) स्ट्रीमिंग, टूल यूज़ और स्ट्रक्चर्ड आउटपुट

आप क्या सीखेंगे: सर्वर-सेंट इवेंट (SSE) स्ट्रीमिंग, फ़ंक्शन/टूल कॉलिंग और JSON स्कीमा आउटपुट को इम्प्लीमेंट करें।

यह क्यों मायने रखता है: मॉडर्न AI ऐप्स फास्ट, इंटरैक्टिव UX और रिलाएबल फ़ंक्शन कॉलिंग पर निर्भर करते हैं। LiteLLM अपने OpenAI-कम्पेटिबल इंटरफ़ेस के माध्यम से इन पैटर्न का समर्थन करता है।

8) लोकल + क्लाउड हाइब्रिड: LiteLLM के माध्यम से Ollama

आप क्या सीखेंगे: क्लाउड मॉडल को उपलब्ध रखते हुए LiteLLM को Ollama के माध्यम से लोकल मॉडल पर पॉइंट करें—फिर टास्क, लेटेंसी या कॉस्ट के आधार पर रूट करें।

यह क्यों मायने रखता है: प्राइवेट टास्क को लोकल रूप से चलाएं, कॉम्प्लेक्स प्रॉम्प्ट के लिए क्लाउड पर बर्स्ट करें।

9) रेट लिमिटिंग, रिट्राई और सर्किट ब्रेकर

आप क्या सीखेंगे: प्रति-मॉडल रेट लिमिट, एक्सपोनेंशियल बैकऑफ़ और फेल-फास्ट पैटर्न कॉन्फ़िगर करें।

यह क्यों मायने रखता है: थंडरिंग हर्ड को रोकें और लोड के तहत विश्वसनीयता में सुधार करें।

10) ऑब्जरवेबिलिटी: लॉग, ट्रेसेस और रिडेक्शन

आप क्या सीखेंगे: सभी प्रोवाइडर से लॉग और ट्रेसेस को सेंट्रलाइज करें, PII को रिडैक्ट करें और टेलीमेट्री को अपने पसंदीदा APM/एनालिटिक्स पर शिप करें।

यह क्यों मायने रखता है: बिना गेटवे के मल्टी-LLM ऐप्स को डीबग करना दर्दनाक है; LiteLLM इसे ट्रैक्टेबल बनाता है।

—

क्विकस्टार्ट: LiteLLM के साथ आपके पहले 15 मिनट

क्रैश कोर्स देखने और डॉक्स को स्किम करने के बाद इस फ्लो को फॉलो करें।

इंस्टॉल करें और की सेट करें

pip install litellm
export OPENAI_API_KEY=sk-...
# वैकल्पिक: अधिक प्रोवाइडर
export ANTHROPIC_API_KEY=...
export GOOGLE_API_KEY=...

वन-फाइल OpenAI-कम्पेटिबल चैट

from litellm import completion
resp = completion(
model="gpt-4o", # या "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"
messages=.
- ऊपर दिए गए क्विकस्टार्ट कोड को चलाएं।
- लक्ष्य: LiteLLM के माध्यम से अपना पहला OpenAI-कम्पेटिबल रिक्वेस्ट करें।
- प्रैक्टिकल बिल्डर
- डेटाकैंप ट्यूटोरियल पढ़ें और स्ट्रीमिंग और रिट्राई के साथ उदाहरणों को एक्सटेंड करें।
- दो प्रोवाइडर जोड़ें और फॉलबैक का परीक्षण करें।
- टीम/प्रोडक्शन ओनर
- आधिकारिक गेटिंग स्टार्टेड गाइड का अध्ययन करें।
- प्रॉक्सी को स्टैंड अप करें, ऑब्जरवेबिलिटी और कॉस्ट ट्रैकिंग जोड़ें।
- रेट लिमिट और PII रिडेक्शन पॉलिसी लागू करें।
—
## डीप डाइव: पैटर्न जिनका आप साप्ताहिक उपयोग करेंगे
### इंटरफ़ेस कॉन्ट्रैक्ट के रूप में OpenAI कम्पेटिबिलिटी
- OpenAI के API शेप को अपने ऐप कॉन्ट्रैक्ट के रूप में ट्रीट करें। सभी रिक्वेस्ट आपके LiteLLM प्रॉक्सी के `/v1/*` एंडपॉइंट पर जाती हैं।
- कोड से नहीं, बल्कि कॉन्फ़िग द्वारा मॉडल (`gpt-4o` → `claude-3-5`) स्वैप करें।
### यूज़ केस द्वारा मॉडल रूटिंग
- लेटेंसी-सेंसिटिव पाथ: तेज़, सस्ते मॉडल पर रूट करें।
- रीज़निंग पाथ: रिट्रीवल-ऑगमेंटेड जनरेशन (RAG) या टूल यूज़ के लिए उच्च-गुणवत्ता वाले मॉडल पर रूट करें।
- प्राइवेसी पाथ: PII सेगमेंट के लिए लोकल/Ollama पर रूट करें।
### कॉस्ट गार्डरेल
- `user_id`/`team` के साथ रिक्वेस्ट टैग करें।
- प्रति टीम/मॉडल बजट सेट करें।
- टोकन यूसेज को एक सेंट्रल स्टोर में लॉग करें और असामान्यताओं पर अलर्ट करें।
### रेसिलिएंस
- जिटर के साथ रिट्राई को इनेबल करें।
- प्रति प्रोवाइडर टाइमआउट और बार-बार होने वाली विफलताओं पर सर्किट ब्रेकर कॉन्फ़िगर करें।
- प्रोवाइडर प्राथमिकताओं और स्पष्ट फॉलबैक को परिभाषित करें।
### ऑब्जरवेबिलिटी
- रिक्वेस्ट/रिस्पॉन्स मेटाडेटा, लेटेंसी हिस्टोग्राम और मॉडल/वर्जन कैप्चर करें।
- लॉग में सीक्रेट/PII को रिडैक्ट करें।
- धीमी कॉल को जल्दी से खोजने के लिए सेवाओं में ट्रेसेस को कोरिलेट करें।
—
## उदाहरण LiteLLM प्रॉक्सी कॉन्फ़िग (प्रोडक्शन-रेडी स्टार्टर)
```yaml
# config.yaml
model_list:
- model_name: gpt-4o
litellm_params:
model: openai/gpt-4o
api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
litellm_params:
model: anthropic/claude-3-5-sonnet
api_key: ${ANTHROPIC_API_KEY}
- model_name: gemini-1.5-pro
litellm_params:
model: google/gemini-1.5-pro
api_key: ${GOOGLE_API_KEY}
defaults:
timeout: 30s
max_tokens: 1024
routing:
- name: low-latency
models: .
- एक प्रैक्टिकल, उदाहरण-संचालित लेख।
- शुरुआत करने और प्रॉक्सी बेस्ट प्रैक्टिस के लिए आधिकारिक LiteLLM डॉक्स।
—
## एक्शन प्लान: आपके अगले 7 दिन
दिन 1–2: क्रैश कोर्स और क्विकस्टार्ट करें; अपना पहला प्रॉक्सीड रिक्वेस्ट करें।
दिन 3–4: एक दूसरा प्रोवाइडर और स्ट्रीमिंग जोड़ें; टाइमआउट सेट करें, रिट्राई करें।
दिन 5: कॉन्फ़िग के साथ प्रॉक्सी को स्टैंड अप करें; यूज़ केस (लेटेंसी बनाम रीज़निंग) द्वारा रूट करें।
दिन 6: लॉगिंग, कॉस्ट ट्रैकिंग और रिडेक्शन जोड़ें।
दिन 7: लोड-टेस्ट; प्रोवाइडर विफलताओं को सिमुलेट करें; फॉलबैक को वेरिफाई करें।
—
## मुख्य बातें
- LiteLLM वेंडर लॉक-इन के बिना मल्टी-प्रोवाइडर LLM ऐप्स का सबसे तेज़ मार्ग है।
- एक OpenAI-कम्पेटिबल इंटरफ़ेस से शुरुआत करें, फिर गवर्नेंस के लिए प्रॉक्सी में लेवल अप करें।
- रूटिंग, रेसिलिएंस और ऑब्जरवेबिलिटी में जल्दी निवेश करें—आपको इनकी ज़रूरत महीने छह में नहीं, बल्कि सप्ताह दो में होगी।
- ऊपर दिए गए ट्यूटोरियल 80% कवर करते हैं जिनका आप दैनिक उपयोग करेंगे; बाकी आपके उत्पाद का गुप्त सॉस है।
### FAQ
Q1:शुरुआती लोगों के लिए सबसे अच्छा LiteLLM ट्यूटोरियल क्या है?
एक त्वरित विज़ुअल वॉकथ्रू के लिए YouTube पर LiteLLM क्रैश कोर्स से शुरुआत करें, फिर प्रॉक्सी के लिए आधिकारिक गेटिंग स्टार्टेड गाइड पढ़ें। डेटाकैंप ट्यूटोरियल प्रैक्टिकल उदाहरण प्रदान करता है जिन्हें आप कॉपी कर सकते हैं।
Q2:मैं LiteLLM को OpenAI-कम्पेटिबल प्रॉक्सी के रूप में कैसे उपयोग करूं?
LiteLLM प्रॉक्सी चलाएं और अपने SDK के बेस URL को प्रॉक्सी के `/v1` एंडपॉइंट पर पॉइंट करें। प्रोवाइडर डिटेल को LiteLLM कॉन्फ़िग में रखें ताकि आपका एप्लिकेशन कोड पोर्टेबल रहे।
Q3:क्या LiteLLM स्वचालित रूप से OpenAI, Anthropic और Gemini के बीच रूट कर सकता है?
हाँ। लेटेंसी, कॉस्ट या क्वालिटी के आधार पर प्रोवाइडर के बीच स्विच करने के लिए LiteLLM कॉन्फ़िग में मॉडल और रूटिंग रणनीतियों को परिभाषित करें। आप विश्वसनीयता के लिए फ़ॉलबैक भी सेट कर सकते हैं।
Q4:मैं LiteLLM के साथ स्ट्रीमिंग और टूल/फ़ंक्शन कॉलिंग को कैसे इनेबल करूं?
LiteLLM के माध्यम से OpenAI-कम्पेटिबल API का उपयोग करें और `stream=True` (या अपने SDK में SSE) इनेबल करें। टूल कॉलिंग के लिए, OpenAI फ़ंक्शन-कॉलिंग फ़ॉर्मेट का पालन करें—LiteLLM इसे टारगेट प्रोवाइडर को फ़ॉरवर्ड करता है।
Q5:LiteLLM के साथ कॉस्ट को कंट्रोल करने का सबसे तेज़ तरीका क्या है?
प्रॉक्सी के माध्यम से रिक्वेस्ट को सेंट्रलाइज करें, यूसेज लॉगिंग को इनेबल करें और प्रति-की रेट लिमिट और बजट लागू करें। अलग-अलग वर्कलोड को कॉस्ट-ऑप्टिमाइज़्ड मॉडल पर रूट करें और आश्चर्य से बचने के लिए वर्शन को पिन करें।