What is LiteLLM and why use it over direct provider SDKs?

LiteLLM is an OpenAI-compatible gateway for 100+ LLMs, giving you one API and one mental model. It reduces vendor lock-in, simplifies routing, and adds ops features like caching, retries, and cost tracking.

How do I use LiteLLM with the OpenAI SDK?

Point the SDK’s base URL to the LiteLLM proxy and use your proxy API key. Your code can stay the same while the proxy swaps providers or models behind the scenes.

Can LiteLLM stream responses and return JSON?

Yes. Use `stream=True` to get token streams, and `response_format` with JSON schema to enforce structured outputs across providers.

How do I control costs across different LLM providers?

Enable usage logging and cost estimation, add caching, set rate limits, and route bulk traffic to cheaper models via the proxy. Monitor with dashboards for budgets and SLOs.

Is LiteLLM suitable for production teams?

Yes. The proxy provides auth, rate limits, routing, observability, and safety middleware. It’s designed as an LLM gateway that centralizes governance while keeping your app OpenAI-compatible.

LiteLLM-ஐ எவ்வாறு பயன்படுத்துவது: எடுத்துக்காட்டுகள், நிபுணர் உதவிக்குறிப்புகள் மற்றும் உண்மையான உலக பணிப்பாய்வுகளுடன் கூடிய நடைமுறை வழிகாட்டி

ஒவ்வொரு மாதிரி API-யும் OpenAI-ஐப் போலவே செயல்பட வேண்டும் என்று நீங்கள் எப்போதாவது விரும்பினால், LiteLLM உங்களுக்கு மிகவும் பிடிக்கும். இது ஒரு இலகுரக நுழைவாயில் ஆகும், இது 100+ LLM-களை ஒரு OpenAI-க்கு இணக்கமான இடைமுகத்துடன் அழைக்க உங்களை அனுமதிக்கிறது—குறியீட்டில் உள்ளூரில் அல்லது குழுக்களிடையே நீங்கள் பகிரக்கூடிய ஒரு மைய ப்ராக்ஸி மூலம். இந்த பயிற்சியில், நிறுவுதல், அடிப்படை மற்றும் மேம்பட்ட பயன்பாடு, ஸ்ட்ரீமிங், பேட்சிங், மறுமுயற்சிகள், கேச்சிங், செலவு கண்காணிப்பு மற்றும் பாதுகாப்பு தடைகள் மற்றும் ரூட்டிங் ஆகியவற்றுடன் LiteLLM ப்ராக்ஸியை பயன்படுத்துதல் ஆகியவற்றை பார்க்கலாம். Python மற்றும் JavaScript எடுத்துக்காட்டுகள் மற்றும் உண்மையான உலக முறைகளையும் இதில் பார்ப்போம்.

குறிப்பிடத்தக்கது: நீங்கள் தூண்டுதல்களை விரைவாக முன்மாதிரி செய்ய, பல மாதிரிகள் முழுவதும் கேள்விகளைக் கேட்க மற்றும் முடிவுகளை ஒழுங்கமைக்க விரைவான வழியை விரும்பினால், Sider.AI உங்கள் LiteLLM அடிப்படையிலான அடுக்கை நீங்கள் இயக்கும்போது ஆராய்ச்சி மற்றும் மறு செய்கைக்கு ஒரு பயனுள்ள துணையாக இருக்கும். இது வெளியீடுகளை ஒப்பிட்டு, குறியீடாக்கும் முன் தூண்டுதல்களைச் செம்மைப்படுத்துவதன் மூலம் உங்கள் பணிப்பாய்வுக்கு உதவுகிறது.

நடைமுறைக்கு ஏற்ற மற்றும் தீர்வு சார்ந்த பாதையை நாங்கள் எடுத்துக்கொள்வோம், எனவே நீங்கள் நகலெடுத்து ஒட்டலாம்.

LiteLLM என்றால் என்ன (மற்றும் குழுக்கள் ஏன் பயன்படுத்துகின்றன)

பல மாதிரிகளுக்கான ஒரு API: OpenAI-பாணி செயல்பாடுகளைப் பயன்படுத்தி Anthropic, OpenAI, Google, Azure, Cohere, Mistral, Bedrock மற்றும் பலவற்றை அழைக்கவும்.

அதைப் பயன்படுத்த இரண்டு வழிகள்:

கிளையன்ட் SDK-கள் (Python/JS): ஸ்கிரிப்டுகள், சேவையகங்கள், நோட்புக்குகளில் விரைவான பயன்பாடு.

ப்ராக்ஸி (LLM நுழைவாயில்): ரூட்டிங், அங்கீகாரம், உள்நுழைவு, செலவுக் கட்டுப்பாடுகள் மற்றும் கண்காணிப்புக்கான மையப்படுத்தப்பட்ட சேவை.

உடனடி இணக்கத்தன்மை: உங்கள் பயன்பாட்டை மீண்டும் எழுதாமல் மாதிரிகளை மாற்றவும்.

செயல்பாட்டு அம்சங்கள்: மறுமுயற்சிகள், நேர வரம்புகள், ஸ்ட்ரீமிங், பேட்சிங், கேச்சிங், ட்ரேசிங் மற்றும் செலவு அறிக்கை ஆகியவை பெட்டியிலிருந்து வெளியேறும் அம்சங்கள்.

நீங்கள் இப்போதுதான் தொடங்குகிறீர்கள் என்றால், விரைவான மன மாதிரிக்கு அதிகாரப்பூர்வ தொடக்க ஆவணங்களைப் பார்வையிடவும். அனுபவப்பூர்வமான எடுத்துக்காட்டுகளுக்கு, DataCamp பயிற்சி படிப்படியான குறியீட்டுடன் ஒரு சிறந்த துணையாக இருக்கும். நீங்கள் வீடியோவை விரும்பினால், தொடக்க நட்பு விபத்து பாடமும் உள்ளது.

விரைவான தொடக்கம்: நிறுவி உங்கள் முதல் அழைப்பை விடுங்கள்

நிறுவு

# Python
pip install litellm
# Node.js
npm install litellm

சுற்றுச்சூழல் மாறிகள்

# எடுத்துக்காட்டு: OpenAI + Anthropic + Mistral ஐப் பயன்படுத்துதல்
export OPENAI_API_KEY=sk-...
export ANTHROPIC_API_KEY=sk-ant-...
export MISTRAL_API_KEY=sk-mis-...

Python: சிறிய அரட்டை முடித்தல்

from litellm import completion
resp = completion(
model="gpt-4o-mini", # அல்லது "anthropic/claude-3-5-sonnet", "mistral/mistral-large"
messages=.
---
## ஸ்ட்ரீமிங், கருவிகள் மற்றும் JSON பயன்முறை
### ஸ்ட்ரீமிங் பதில்கள்
```python
from litellm import completion
for chunk in completion(
model="gpt-4o-mini",
messages=.
### செலவு மற்றும் டோக்கன் பயன்பாடு
LiteLLM டோக்கன் பயன்பாட்டைக் கண்காணித்து, ஒவ்வொரு கோரிக்கை, மாதிரி அல்லது திட்டத்திற்கான செலவை மதிப்பிட முடியும். ப்ராக்ஸி மூலம், பயன்பாட்டை பதிவுகள், டாஷ்போர்டுகள் அல்லது பில்லிங் சிங்க்கிற்கு ஏற்றுமதி செய்யலாம். வெவ்வேறு விலை நிர்ணயம் கொண்ட விற்பனையாளர்களை நீங்கள் கலக்கும்போது இது விலைமதிப்பற்றது.
---
## LiteLLM ப்ராக்ஸி (LLM நுழைவாயில்)
நீங்கள் ஒரு குழுவாகவோ அல்லது தளமாகவோ இருந்தால், ப்ராக்ஸி உண்மையான வல்லமை: ரூட்டிங், அங்கீகாரம், வீத வரம்புகள், உள்நுழைவு மற்றும் கண்காணிப்புடன் கூடிய மைய சேவை. உங்கள் பயன்பாட்டுக் குறியீடு அரிதாகவே மாறும்படி, OpenAI API மேற்பரப்பைப் பயன்படுத்தி நீங்கள் அதனுடன் தொடர்பு கொள்கிறீர்கள்.
### ப்ராக்ஸியைத் தொடங்கவும்
```bash
# எளிய உள்ளூர் இயக்கம்
litellm --port 4000

இயல்பாக, இது /v1/chat/completions போன்ற OpenAI-க்கு இணக்கமான எண்ட்பாயிண்ட்களை வெளிப்படுத்துகிறது. உங்கள் இருக்கும் OpenAI கிளையண்டை ` -க்கு சுட்டவும், நீங்கள் தயாராகிவிட்டீர்கள்.

வழங்குநர்கள் மற்றும் விசைகளை உள்ளமைக்கவும்

config.yaml-ஐ உருவாக்கவும்:

model_list:
- model_name: gpt-4o-mini
litellm_params:
model: openai/gpt-4o-mini
api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
litellm_params:
model: anthropic/claude-3-5-sonnet
api_key: ${ANTHROPIC_API_KEY}
router:
strategy: simple_weighted
routes:
- model: gpt-4o-mini
weight: 0.6
- model: claude-3-5-sonnet
weight: 0.4
rate_limits:
requests_per_minute: 120
logging:
level: info
sink: stdout
auth:
api_keys:
- key: svc-app-123

உள்ளமைவுடன் இயக்கவும்:

litellm --config config.yaml --port 4000

OpenAI SDK-களிலிருந்து ப்ராக்ஸியைப் பயன்படுத்தவும் (குறியீடு மாற்றங்கள் இல்லை)

from openai import OpenAI
client = OpenAI(base_url=" api_key="svc-app-123")
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=.
---
## மேம்பட்ட ரூட்டிங்: தாமதம், செலவு அல்லது நம்பகத்தன்மை
போன்ற ரூட்டிங் உத்திகளை நீங்கள் செயல்படுத்தலாம்:
- A/B மாதிரிகளுக்கு ஏற்ற எடையுள்ள ரவுண்ட்-ராபின்
- பிராந்தியத்தின்படி குறைந்த தாமதம் முதலில்
- முக்கியமான எண்ட்பாயிண்ட்களுக்கு செலவு குறைந்த ரூட்டிங்
- வழங்குநர்கள் முழுவதும் பிழை ஏற்படும்போது பின்வாங்குதல்/மறுமுயற்சி
ரூட்டர் கொள்கையின் மூலம், "மலிவானதை விரும்புங்கள், கடினமான தூண்டுதல்களுக்கு பிரீமியத்திற்கு பின்வாங்குங்கள்" என்று நீங்கள் கூறலாம். இது அதிக கிடைக்கும் தன்மையையும் கணிக்கக்கூடிய பட்ஜெட்களையும் வழங்குகிறது.
---
## பாதுகாப்புக் கட்டுப்பாடுகள், மிதப்படுத்தல் மற்றும் பாதுகாப்பு
PII-ஐ அகற்ற, பாதுகாப்பு வடிப்பான்களைச் செயல்படுத்த அல்லது வாடிக்கையாளர்களுக்குத் திரும்பும் முன் வெளியீடுகளை மிதப்படுத்த முன் மற்றும் பிந்தைய செயலாக்க இடைத்தரகர்களைச் சேர்க்கவும். வழங்குநர்-சொந்த மிதப்படுத்தலை (எ.கா., OpenAI, Google) ப்ராக்ஸியில் உங்கள் சொந்த கொள்கை சோதனைகளுடன் இணைக்கவும். எடுத்துக்காட்டு: JSON ஸ்கீமா சரிபார்ப்பு தேவை மற்றும் தவறானதாக இருக்கும்போது மீண்டும் கேட்கவும்.
---
## கண்காணிப்பு மற்றும் பதிவு
- திருத்தத்துடன் கோரிக்கை/பதில் பதிவை இயக்கவும்.
- அளவீடுகளை Prometheus/Grafana அல்லது உங்கள் APM-க்கு ஏற்றுமதி செய்யவும்.
- எண்ட்பாயிண்ட் மற்றும் பயனரின் மூலம் தாமதம், டோக்கன்கள் மற்றும் செலவைக் கண்காணிக்கவும்.
இது “மாதிரி ரூலட்” ஐ SLO-கள் மற்றும் பட்ஜெட்களுடன் கூடிய நிர்வகிக்கப்பட்ட சேவையாக மாற்றுகிறது.
---
## உண்மையான உலக பயன்பாட்டு முறைகள்
1) பல விற்பனையாளர் மீள்திறன்
- முதன்மை: வேகமான/மலிவான மாதிரி; பின்வாங்குதல்: 429/5xx இல் அதிக துல்லியமான மாதிரி.
- நன்மைகள்: சிறந்த இயக்க நேரம், செலவுக் கட்டுப்பாடு மற்றும் நிலையான தரம்.
2) அம்சம் கொடி மாதிரி மேம்படுத்தல்கள்
- ஒரு புதிய மாதிரியை போக்குவரத்தில் 5% ஆக கேனரி செய்ய ரூட்டர் எடைகளைப் பயன்படுத்தவும்; அளவீடுகளை கண்காணிக்கவும்; நிலையானதாக இருக்கும்போது அதிகரிக்கவும்.
3) தயாரிப்பு அடுக்குகள்
- சிறிய மாதிரிகளுக்கு இலவச அடுக்கு ரூட்; பிரீமியம் மாதிரிகளுக்கு Pro அடுக்கு.
4) தூண்டுதல் பதிவேடுகள் மற்றும் வார்ப்புருக்கள்
- தூண்டுதல்களை ப்ராக்ஸியில் மையப்படுத்துங்கள், இதனால் சேவைகள் மறுபயன்படுத்தல்கள் இல்லாமல் மேம்பாடுகளைப் பெறுகின்றன.
5) குழு பில்லிங் மற்றும் பட்ஜெட்கள்
- API விசையின் மூலம் செலவழிப்பதைக் கண்காணிக்கவும்; ஒவ்வொரு குழு அல்லது தயாரிப்புக்கும் மென்மையான மற்றும் கடினமான வரம்புகளை செயல்படுத்தவும்.
---
## பாதுகாப்பு மற்றும் இணக்க சரிபார்ப்பு பட்டியல்
- உங்கள் ரகசிய மேலாளரில் வழங்குநர் விசைகளை சேமிக்கவும்; உள்ளமைவில் env vars மூலம் குறிப்பு.
- பதிவுகளில் கோரிக்கை திருத்தம் மற்றும் PII ஸ்க்ரப்பிங்கை இயக்கவும்.
- ப்ராக்ஸிக்கு சேவைக்கு API விசைகளைப் பயன்படுத்தவும்; தவறாமல் சுழற்று.
- நிறுவனம் முழுவதும் வீத வரம்புகள் மற்றும் ஒதுக்கீடுகளை அமைக்கவும்.
- மாதிரிகள் மற்றும் எண்ட்பாயிண்ட்களுக்கான அனுமதிப் பட்டியல்கள்/மறுப்புப் பட்டியல்களைச் சேர்க்கவும்.
---
## சரிசெய்தல்: விரைவான திருத்தங்கள்
- ப்ராக்ஸி வழியாக “அங்கீகரிக்கப்படாதது”: `auth.api_keys` மற்றும் உங்கள் கிளையன்ட் `base_url` + சரியான விசையைப் பயன்படுத்துகிறதா என்பதைச் சரிபார்க்கவும்.
- மாதிரி கண்டுபிடிக்கப்படவில்லை: `model_list` நீங்கள் அழைக்கும் நட்பு பெயரை வைத்திருப்பதை உறுதிப்படுத்தவும்.
- நேர வரம்புகள்: `timeout` ஐ அதிகரிக்கவும் அல்லது குறைந்த தாமதம் உள்ள வழங்குநர் பகுதிக்கு ரூட் செய்யவும்.
- வினோதமான வெளியீடுகள்: JSON ஸ்கீமா + சரிபார்ப்பை இயக்கவும்; மறுமுயற்சிகள் மற்றும் பின்வாங்கல்களைச் சேர்க்கவும்.
- செலவு அதிகரிப்பு: கேச்சிங்கை இயக்கவும்; மொத்த போக்குவரத்தை மலிவான மாதிரிகளுக்கு அனுப்பவும்; விசைக்கு ஒதுக்கீடுகளை அமைக்கவும்.
ஆழமான ஆழங்கள் மற்றும் சமீபத்திய அம்சங்களுக்கு, அதிகாரப்பூர்வ ஆவணங்கள் அடிக்கடி புதுப்பிக்கப்படுகின்றன மற்றும் புக்மார்க் செய்வது மதிப்பு. DataCamp வழிகாட்டி போன்ற பயிற்சிகள் அனுபவப்பூர்வமான முறைகளுக்கு சிறந்தவை, மேலும் தொடக்க விபத்து பாட வீடியோ செயல்பாட்டில் உள்ள கருத்துகளைப் பார்க்க உதவும்.
---
## அனைத்தையும் ஒன்றாக இணைக்கவும்: குறிப்பு பயன்பாட்டு எலும்புக்கூடு (Python FastAPI)
```python
# app.py
from fastapi import FastAPI
from pydantic import BaseModel
from litellm import completion
import os
class ChatReq(BaseModel):
question: str
app = FastAPI
@app.post("/ask")
async def ask(req: ChatReq):
resp = completion(
model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"),
messages=.
### FAQ
Q1:LiteLLM என்றால் என்ன, நேரடி வழங்குநர் SDK-களை விட ஏன் அதைப் பயன்படுத்த வேண்டும்?
LiteLLM என்பது 100+ LLM-களுக்கான OpenAI-க்கு இணக்கமான நுழைவாயில் ஆகும், இது உங்களுக்கு ஒரு API மற்றும் ஒரு மன மாதிரியை வழங்குகிறது. இது விற்பனையாளர் பூட்டை குறைக்கிறது, ரூட்டிங்கை எளிதாக்குகிறது மற்றும் கேச்சிங், மறுமுயற்சிகள் மற்றும் செலவு கண்காணிப்பு போன்ற ஆபரேஷன் அம்சங்களை சேர்க்கிறது.
Q2:OpenAI SDK உடன் LiteLLM ஐ எவ்வாறு பயன்படுத்துவது?
SDK-யின் அடிப்படை URL ஐ LiteLLM ப்ராக்ஸிக்கு சுட்டி, உங்கள் ப்ராக்ஸி API விசையைப் பயன்படுத்தவும். பின்னணியில் ப்ராக்ஸி வழங்குநர்கள் அல்லது மாதிரிகளை மாற்றும்போது உங்கள் குறியீடு அப்படியே இருக்கும்.
Q3:LiteLLM பதில்களை ஸ்ட்ரீம் செய்து JSON ஐத் திருப்பித் தர முடியுமா?
ஆம். டோக்கன் ஸ்ட்ரீம்களைப் பெற `stream=True` ஐப் பயன்படுத்தவும், மேலும் வழங்குநர்கள் முழுவதும் கட்டமைக்கப்பட்ட வெளியீடுகளைச் செயல்படுத்த JSON ஸ்கீமாவுடன் `response_format` ஐப் பயன்படுத்தவும்.
Q4:வெவ்வேறு LLM வழங்குநர்கள் முழுவதும் செலவுகளை நான் எவ்வாறு கட்டுப்படுத்துவது?
பயன்பாட்டுப் பதிவு மற்றும் செலவு மதிப்பீட்டை இயக்கவும், கேச்சிங்கைச் சேர்க்கவும், வீத வரம்புகளை அமைக்கவும், மொத்த போக்குவரத்தை ப்ராக்ஸி மூலம் மலிவான மாதிரிகளுக்கு அனுப்பவும். பட்ஜெட் மற்றும் SLO-களுக்கான டாஷ்போர்டுகளுடன் கண்காணிக்கவும்.
Q5:LiteLLM உற்பத்தி குழுக்களுக்கு ஏற்றதா?
ஆம். ப்ராக்ஸி அங்கீகாரம், வீத வரம்புகள், ரூட்டிங், கண்காணிப்பு மற்றும் பாதுகாப்பு இடைத்தரகர்களை வழங்குகிறது. இது உங்கள் பயன்பாட்டை OpenAI-க்கு இணக்கமாக வைத்திருக்கும் அதே நேரத்தில் நிர்வாகத்தை மையப்படுத்த ஒரு LLM நுழைவாயிலாக வடிவமைக்கப்பட்டுள்ளது.