What is LiteLLM and why use it?

LiteLLM is an open-source gateway and SDK that lets you call 100+ LLMs through a single, OpenAI-compatible API. Use it to switch providers easily, set fallbacks, and centralize rate limits and cost tracking.

How does LiteLLM compare to OpenRouter?

LiteLLM is self-hostable and open-source, giving you private control with your own provider keys, while OpenRouter is a hosted aggregator. Choose LiteLLM for compliance and control, OpenRouter for quick access to many models.

Can LiteLLM replace LangChain or LlamaIndex?

No. LiteLLM focuses on model abstraction and routing. Pair it with LangChain or LlamaIndex if you need agents, chains, or RAG pipelines while keeping provider flexibility.

Does LiteLLM support fallbacks and retries?

Yes. You can define fallback chains so if one provider fails or rate-limits, LiteLLM automatically tries the next model, improving reliability for production workloads.

Is LiteLLM free to use?

LiteLLM is open-source, so there’s no license cost, but you’ll pay for the underlying model usage. If you run the proxy, factor in operational costs for hosting and monitoring.

LiteLLM पुनरावलोकन: एकाच गेटवेमार्फत प्रत्येक LLM वापरण्याचा सर्वात सोपा मार्ग

जर तुम्ही कधी तुमची अ‍ॅप्लिकेशन OpenAI कडून Anthropic, Google Gemini, किंवा स्थानिक मॉडेलवर स्विच केली असेल आणि स्ट्रीमिंग, पुनर्प्रयत्न, आणि टोकन योग्यरितीने मिळवण्यासाठी अर्धा कोड बदलला असेल, तर तुम्हाला LiteLLM सारख्या साधनांची गरज का असते हे माहीत असेल. हे पुनरावलोकन थेट मुद्द्यांवर लक्ष देते: LiteLLM काय चांगले करते, कुठे अडचण येते आणि 2025 मध्ये तुमच्या AI स्टॅकसाठी हे सर्वोत्तम abstraction आहे का.

आम्ही ते व्यावहारिक आणि उपाय-आधारित ठेवणार आहोत — LiteLLM कशासाठी वापरायचे, ते कसे सेट करायचे आणि कोणती बाब लक्षात ठेवायची.

LiteLLM म्हणजे काय?

LiteLLM हा एक खुला स्त्रोत (open-source) गेटवे आणि SDK आहे जो तुम्हाला 100+ LLMs ला एकाच OpenAI अनुकूल API द्वारे कॉल करण्याची परवानगी देतो. तुम्ही सहजपणे प्रदाते बदलू शकता, फेलओव्हर्स जोडू शकता, लॉगिंग आणि खर्च नियंत्रण एकत्र करू शकता, आणि तुमच्या अ‍ॅपच्या इनफरन्स पातळीला पुन्हा लिहिण्याची गरज नाही. याला तुम्ही 'universal adapter' समजा: एकाच इंटरफेसद्वारे अनेक मॉडेल.

मूळ कल्पना: "प्रत्येक मॉडेलला OpenAI च्या API प्रमाणे कॉल करा."

मोड: Python SDK म्हणून वापरा किंवा प्रॉक्सी/गेटवे सर्व्हर म्हणून चालवा.

वापर प्रकरणे: बहु-विक्रेता समर्थन, खर्चांची ताळमेळ, फेलओव्हर्सद्वारे विश्वासार्हता, केंद्रीकृत निरीक्षण.

## LiteLLM vs. OpenRouter

OpenRouter अनेक मॉडेल्सना एकच टोकन मागे ठेवतो आणि साधे राऊटिंग, सार्वजनिक दरमर्यादा, आणि मार्केटप्लेससारखे सार प्रदान करतो. LiteLLM मात्र खुला स्रोत आहे आणि सहसा तुमच्या इन्फ्रास्ट्रक्चरवर चालतो.

- नियंत्रण: LiteLLM तुम्हाला खासगी नियंत्रण देतो; OpenRouter हा होस्ट केलेला एकत्रकर्ता आहे.

- खर्च पारदर्शकता: LiteLLM मध्ये तुम्ही स्वतःचे प्रदाता कीज वापरता; OpenRouter मध्ये तुम्ही OpenRouter ला पैसे देता, ज्यात शुल्क जोडले जाऊ शकते.

- अनुपालन: LiteLLM चे स्व-होस्टिंग डेटा निवासी आणि अनुपालन सुलभ करू शकते.

TrueFoundry चा LiteLLM आणि OpenRouter यांचा तपशील हे धोरणात्मक फरक आणि योग्य उपयोग ठिकाणे दर्शवितो.

## LangChain आणि LlamaIndex शी तुलना

- LangChain: विस्तृत ऑर्केस्ट्रेशन फ्रेमवर्क (चेन, एजंट्स, टूल्स, मेमरी). तुम्ही LiteLLM ला LangChain मध्ये मॉडेल्स अॅब्स्ट्रॅक्ट करण्यासाठी वापरू शकता.

- LlamaIndex: डेटा-केंद्रित RAG फ्रेमवर्क. LiteLLM खालील LLM लेयर म्हणून काम करू शकतो.

- नेटिव्ह SDKs (OpenAI, Anthropic, Google): पूर्ण फीचर समतोलासाठी आणि नवीनतम वैशिष्ट्यांसाठी सर्वोत्तम; बहु-प्रदाता स्विचिंगसाठी कमी उपयुक्त.

जर तुम्हाला फक्त मॉडेल इंटरचेंजिबिलिटी व स्वच्छ शासन हवे असेल, तर LiteLLM हा खास साधन आहे. एजंट फ्रेमवर्क किंवा क्लिष्ट RAG पाइपलाइन्ससाठी, LiteLLM ला LangChain/LlamaIndex सोबत जोडा.

## कार्यक्षमता आणि विश्वासार्हता

- लेटन्सी: थेट कॉल्सच्या तुलनेत क्षुल्लक अतिरिक्त वेळ, पण राऊटिंग/प्रॉक्सी लॉजिक थोडा ओव्हरहेड आणते. यातून तुम्हाला फेलओव्हर्स आणि धोरण नियंत्रण मिळतात.

- विश्वासार्हता: केंद्रीकृत पुनर्प्रयत्न + प्रदाता फेलओव्हर्स उत्पादन अ‍ॅप्सची उपलब्धता सुधारतो.

- खर्च ऑप्टिमायझेशन: नियमित कामांसाठी स्वस्त मॉडेल निवडा; महत्त्वाच्या मार्गांसाठी प्रीमियम मॉडेल ठेवा.

टीप: लॉग आणि ट्रेसिंगसह इन्स्ट्रुमेंट करा. अनेक टीम्स LiteLLMच्या गेटवे लॉगस त्यांच्या निरीक्षण स्टॅककडे पाठवतात.

## सुरक्षा आणि अनुपालन विचार

- की व्यवस्थापन: प्रदाता की सुरक्षितपणे साठवा; पर्यावरणीय चल किंवा व्हॉल्ट वापरा.

- ऑडिटेबिलिटी: केंद्रीकृत प्रॉक्सी सर्व्हर क्वेरिज, प्रतिसाद मेटाडेटा आणि खर्च लॉग करतो.

- डेटा हाताळणी: स्व-होस्टिंग डेटा निवासी आणि खासगीपणा हमी सुधारते.

LiteLLM हे प्रत्येक LLM सोबत बोलण्याचा सर्वात सोपा मार्ग आहे का? एक व्यावहारिक आढावा

LiteLLM पुनरावलोकन: एकाच गेटवेमार्फत प्रत्येक LLM वापरण्याचा सर्वात सोपा मार्ग

LiteLLM म्हणजे काय?

## सुरक्षा आणि अनुपालन विचार

- ऑडिटेबिलिटी: केंद्रीकृत प्रॉक्सी सर्व्हर क्वेरिज, प्रतिसाद मेटाडेटा आणि खर्च लॉग करतो.