What is the best LiteLLM tutorial for beginners?

Start with the LiteLLM Crash Course on YouTube for a quick visual walkthrough, then read the official Getting Started guide for the proxy. The DataCamp tutorial provides practical examples you can copy.

How do I use LiteLLM as an OpenAI-compatible proxy?

Run the LiteLLM proxy and point your SDK’s base URL to the proxy’s `/v1` endpoints. Keep provider details in the LiteLLM config so your application code stays portable.

Can LiteLLM route between OpenAI, Anthropic, and Gemini automatically?

Yes. Define models and routing strategies in the LiteLLM config to switch between providers by latency, cost, or quality. You can also set fallbacks for reliability.

How do I enable streaming and tool/function calling with LiteLLM?

Use the OpenAI-compatible API via LiteLLM and enable `stream=True` (or SSE in your SDK). For tool calling, follow the OpenAI function-calling format—LiteLLM forwards it to the target provider.

What’s the fastest way to control costs with LiteLLM?

Centralize requests through the proxy, enable usage logging, and enforce per-key rate limits and budgets. Route different workloads to cost-optimized models and pin versions to avoid surprises.

সেরা LiteLLM টিউটোরিয়াল: ২০২৫ এ আপনার LLM গেটওয়ে মাস্টার করার গাইড

আপনি যদি OpenAI, Azure OpenAI, Anthropic, Gemini, লোকাল মডেল এবং এদের মাঝের সব কিছুকে একসঙ্গে ব্যবহার করেন, LiteLLM হল সেই সুইস আর্মি নাইফ যা আপনার খুঁজতে ছিল। এটি একটি ওপেনএআই-সাপোর্টেড লেয়ার এবং প্রক্সি হিসেবে কাজ করে, যাতে আপনার অ্যাপস এক ভাষায় কথা বলতে পারে আর আপনি পেছনে মডেল, ভেন্ডর এবং মূল্য নির্ধারণ বদলাতে পারেন। চ্যালেঞ্জ? কোথা থেকে শুরু করবেন এবং কোন রিসোর্সগুলো আসলেই আপনার সময়ের যোগ্য।

এই প্রায়োগিক ও সমাধানমুখী গাইড ২০২৫ এর সেরা LiteLLM টিউটোরিয়ালগুলো নির্বাচন করেছে, দেখায় প্রতিটি রিসোর্স কার জন্য এবং উৎপাদনে দ্রুত পৌঁছানোর পথ। আমরা দ্রুত সাফল্য, গভীর বিশ্লেষণ এবং পরীক্ষিত প্যাটার্নগুলো মিশিয়ে দেব যা আপনি অনুকরণ করতে পারেন।

শেষে, আপনি ঠিক বুঝে যাবেন প্রথম কোন LiteLLM টিউটোরিয়াল দেখবেন বা পড়বেন, LiteLLM প্রক্সি কীভাবে চালু করবেন এবং OpenAI SDK, স্ট্রিমিং, রিট্রাই, রেট লিমিট, মডেল রাউটিং এবং অবজার্ভেবিলিটির সাথে কীভাবে ইন্টিগ্রেট করবেন।

—

LiteLLM কী (এবং কেন দলগুলো এর উপর ভরসা করে)?

LiteLLM একটি OpenAI-সাপোর্টেড API এবং SDK প্রদান করে যা আপনাকে দেয়:

একটি ইন্টারফেস দিয়ে অনেক প্রোভাইডারে (OpenAI, Azure OpenAI, Anthropic, Google, Cohere, Together, Ollama এবং আরও) রাউট করার সুযোগ।

কেন্দ্রীভূত প্রক্সি (LLM গেটওয়ে) স্থাপন করে অথেন্টিকেশন, লগিং, খরচ ট্র্যাকিং এবং পলিসি স্ট্যান্ডার্ডাইজ করার সুযোগ।

অ্যাপ্লিকেশন পরিবর্তন না করে মডেল বদলানোর স্বাধীনতা।

যদি আপনি বহু-LLM অ্যাপ তৈরি করে থাকেন, LiteLLM হচ্ছে সেই সংযোগকারী টিস্যু। অফিসিয়াল ডকুমেন্টেশন ভালো এবং অনেক থার্ড-পার্টি টিউটোরিয়াল এখন বাস্তব জীবনের ব্যবহারের কেস নিয়ে আলোচনা করে।

—

২০২৫ এর ১০টি সেরা LiteLLM টিউটোরিয়াল

নিচে শীর্ষ রিসোর্সগুলো, কার জন্য, কী শিখবেন তা গুরুত্ব, সম্পূর্ণতা এবং প্রোডাকশনের প্রাসঙ্গিকতা অনুযায়ী তালিকাভুক্ত করা হয়েছে।

১) LiteLLM ক্র্যাশ কোর্স | সম্পূর্ণ নতুনদের জন্য (ভিডিও)

সেরা: যারা ভিজ্যুয়াল লার্নার এবং এক ঘণ্টার মধ্যে সম্পূর্ণ সেটআপ চান এমন ডেভেলপারদের জন্য।

কেন এটি ভালো: ইনস্টলেশন, পাইথন SDK এর বেসিক এবং OpenAI-সাপোর্টেড কল ইন্টিগ্রেশন কভার করে, স্ট্রিমিংয়ের মতো মূল ফিচারগুলোর ট্যুর দেয়।

যদি আপনি আগে কখনো LiteLLM ব্যবহার না করে থাকেন তবে এখান থেকে শুরু করুন।

দেখুন: LiteLLM ক্র্যাশ কোর্স | সম্পূর্ণ নতুনদের জন্য।

২) DataCamp: LiteLLM — বাস্তব উদাহরণসহ একটি গাইড (আর্টিকল)

সেরা: ডেভেলপার যারা কোড-ভিত্তিক, অনুলিপি-পেস্ট উদাহরণ পছন্দ করেন।

কেন এটি ভালো: 'হ্যালো ওয়ার্ল্ড' থেকে স্ট্রিমিং রেসপন্স পর্যন্ত ধাপে ধাপে নির্দেশনা দেয়, মূল API কল এবং ব্যবহার ধরণ উন্নয়নের উপায় দেখায়।

পড়ুন: LiteLLM: বাস্তব উদাহরণসহ একটি গাইড।

৩) অফিসিয়াল ডক: LiteLLM শুরু করার জন্য (ডকুমেন্ট)

সেরা: দল যারা প্রক্সি/গেটওয়ে, পলিসি এবং রাউটিং এর সাথে প্রোডাকশনে যাওয়ার জন্য।

কেন এটি ভালো: কখন প্রক্সি ব্যবহার করবেন, কিভাবে একাধিক প্রোভাইডার যুক্ত করবেন, মডেল কনফিগার করবেন এবং কেন্দ্রীভূত এক্সেস করবেন তার স্পষ্ট নির্দেশনা দেয়।

পড়ুন: LiteLLM — Getting Started।

৪) LiteLLM প্রক্সি দিয়ে OpenAI-সাপোর্টেড API তৈরি করুন

শিখবেন: কীভাবে LiteLLM প্রক্সি লোকালি চালু করবেন, একাধিক প্রোভাইডারের জন্য এনভায়রনমেন্ট ভ্যারিয়েবল সেট করবেন, একটি একক /v1/chat/completions এন্ডপয়েন্ট তৈরি করবেন।

কেন এটি গুরুত্বপূর্ণ: অধিকাংশ প্রোডাকশন দল অবজার্ভেবিলিটি এবং পলিসি আনলক করতে প্রক্সি ব্যবহার করে।

এটি অফিসিয়াল Getting Started এবং আপনার পছন্দের ল্যাঙ্গুয়েজ SDK এর সাথে মিলিয়ে ব্যবহার করুন।

৫) মাল্টি-প্রোভাইডার রাউটিং এবং ফ্যালব্যাকস

শিখবেন: প্রোভাইডার লিস্ট, হেলথ চেক এবং অটোমেটিক ফ্যালব্যাক কনফিগারেশন যেগুলো আউটেজ বা রেট লিমিট সামলাবে।

কেন এটি গুরুত্বপূর্ণ: আপনার অ্যাপকে শক্তিশালী রাখে। উদাহরণস্বরূপ, প্রাইমারি রাউট GPT-4o এর দিকে এবং ফ্যালব্যাক হিসেবে Claude 3.5 বা Gemini ব্যবহার করুন যখন লেটেন্সি বেশি হয়।

৬) খরচ নিয়ন্ত্রণ ও ব্যবহার মনিটরিং

শিখবেন: প্রতিটি অনুরোধের খরচ লগ করা, কোটা প্রয়োগ এবং দল/অ্যাপ অনুযায়ী ট্যাগিং।

কেন এটি গুরুত্বপূর্ণ: LiteLLM আপনার একক দৃষ্টিপথ হতে পারে সব ভেন্ডারের জন্য। CFO’র আগে অ্যালার্ট এবং বাজেট যোগ করুন।

৭) স্ট্রিমিং, টুল ব্যবহার এবং স্ট্রাকচার্ড আউটপুট

শিখবেন: সার্ভার-সেন্ট ইভেন্ট (SSE) স্ট্রিমিং, ফাংশন/টুল কলিং এবং JSON স্কিমা আউটপুট ইমপ্লিমেন্ট করবেন।

কেন এটি গুরুত্বপূর্ণ: আধুনিক AI অ্যাপ দ্রুত এবং ইন্টারেক্টিভ UX ও নির্ভরযোগ্য ফাংশন কলিং এর উপর ভিত্তি করে। LiteLLM এর OpenAI-সাপোর্টেড ইন্টারফেস এই প্যাটার্নগুলো সাপোর্ট করে।

৮) লোকাল + ক্লাউড হাইব্রিড: Ollama মাধ্যমে LiteLLM

শিখবেন: কিভাবে LiteLLM কে Ollama দিয়ে লোকাল মডেলের দিকে নির্দেশ করবেন এবং ক্লাউড মডেল বজায় রাখবেন—তারপর কাজ, লেটেন্সি বা খরচ অনুযায়ী রাউট করবেন।

কেন এটি গুরুত্বপূর্ণ: লোকাল এ প্রাইভেট কাজ চালান এবং জটিল প্রম্পটের জন্য ক্লাউডে ঝাঁপ দিন।

৯) রেট লিমিটিং, রিট্রাই এবং সার্কিট ব্রেকার

শিখবেন: প্রতি মডেল রেট লিমিট, এক্সপোনেনশিয়াল ব্যাকঅফ এবং ফেইল-ফাস্ট প্যাটার্ন কনফিগার করবেন।

কেন এটি গুরুত্বপূর্ণ: বিশৃঙ্খলা প্রতিরোধ করে এবং লোডের মধ্যে নির্ভরযোগ্যতা বাড়ায়।

১০) অবজার্ভেবিলিটি: লগ, ট্রেস এবং রিডাকশন

শিখবেন: সকল প্রোভাইডারের লগ ও ট্রেস কেন্দ্রীকরণ, PII রিড্যাক্ট এবং আপনার পছন্দের APM/অ্যানালিটিক্সে টেলিমেট্রি পাঠানো।

কেন এটি গুরুত্বপূর্ণ: গেটওয়েমুক্ত বহু-LLM অ্যাপ ডিবাগ করা বিষাক্ত; LiteLLM এ এটি সোজা হয়।

—

দ্রুত শুরু করুন: LiteLLM এর সাথে আপনার প্রথম ১৫ মিনিট

ক্র্যাশ কোর্স দেখার এবং ডকুমেন্টেশন স্কিম করার পর এই ফ্লো অনুসরণ করুন।

ইনস্টল করুন এবং কী সেট করুন

pip install litellm
export OPENAI_API_KEY=sk-...
# ঐচ্ছিক: আরও প্রোভাইডার
export ANTHROPIC_API_KEY=...
export GOOGLE_API_KEY=...

এক-ফাইল OpenAI-সাপোর্টেড চ্যাট

from litellm import completion
resp = completion(
model="gpt-4o", # অথবা "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"
messages=.
- উপরের দ্রুত শুরু কোড রান করুন।
- লক্ষ্য: LiteLLM দিয়ে আপনার প্রথম OpenAI-কমপ্যাটিবল অনুরোধ তৈরি করুন।
- প্রায়োগিক নির্মাতা
- DataCamp টিউটোরিয়াল পড়ুন এবং স্ট্রিমিং ও রিট্রাই এর সঙ্গে উদাহরণগুলি বাড়ান।
- দুইটি প্রোভাইডার যোগ করুন এবং ফ্যালব্যাক পরীক্ষা করুন।
- দল/প্রোডাকশন মালিক
- অফিসিয়াল Getting Started গাইড পড়ুন।
- প্রক্সি চালু করুন, অবজার্ভেবিলিটি এবং খরচ ট্র্যাকিং যোগ করুন।
- রেট লিমিট ও PII রিড্যাকশন পলিসি প্রয়োগ করুন।
—
## গভীর বিশ্লেষণ: সাপ্তাহিক ব্যবহৃত প্যাটার্ন
### OpenAI সঙ্গতিপূর্ণতা একটি ইন্টারফেস চুক্তি হিসেবে
- OpenAI API এর গঠন আপনার অ্যাপের চুক্তি হিসেবে বিবেচনা করুন। সমস্ত অনুরোধ আপনার LiteLLM প্রক্সির `/v1/*` এন্ডপয়েন্টে যাবে।
- কনফিগারেশন দ্বারা (যেমন `gpt-4o` থেকে `claude-3-5`) মডেল বদলান, কোড নয়।
### ব্যবহারভিত্তিক মডেল রাউটিং
- লেটেন্সি সংবেদনশীল পথে দ্রুত এবং সাশ্রয়ী মডেল ব্যবহারের জন্য রাউট করুন।
- যুক্তি সংবলিত পথে রেট্রিভাল-অগমেন্টেড জেনারেশন (RAG) বা টুল ব্যবহারের জন্য উচ্চমানের মডেলে রাউট করুন।
- গোপনীয়তা রক্ষা করার জন্য লোকাল/Ollama মডেলে রাউট করুন।
### খরচ নিয়ন্ত্রণ
- `user_id`/`team` দিয়ে অনুরোধ ট্যাগ করুন।
- দল/মডেল অনুযায়ী বাজেট সেট করুন।
- টোকেন ব্যবহার কেন্দ্রীয়ভূত স্টোরে লগ করুন এবং অস্বাভাবিকতা সম্পর্কে সতর্ক থাকুন।
### স্থিতিশীলতা
- জিটার সহ রিট্রাই সক্ষম করুন।
- প্রোভাইডার অনুযায়ী টাইমআউট এবং পুনরাবৃত্ত ব্যর্থতায় সার্কিট ব্রেকার কনফিগার করুন।
- প্রোভাইডার অগ্রাধিকার এবং স্পষ্ট ফ্যালব্যাক নির্ধারণ করুন।
### অবজার্ভেবিলিটি
- অনুরোধ/প্রতিক্রিয়া মেটাডেটা, লেটেন্সি হিস্টোগ্রাম, মডেল/ভার্সন ক্যাপচার করুন।
- লগে গোপন তথ্য/PII রিড্যাক্ট করুন।
- সার্ভিস জুড়ে ট্রেসেস সমন্বয় করে ধীর কল দ্রুত খুঁজে বের করুন।
—
## উদাহরণ LiteLLM প্রক্সি কনফিগ (প্রোডাকশন-রেডি স্টার্টার)
```yaml
# config.yaml
model_list:
- model_name: gpt-4o
litellm_params:
model: openai/gpt-4o
api_key: ${OPENAI_API_KEY}
- model_name: claude-3-5-sonnet
litellm_params:
model: anthropic/claude-3-5-sonnet
api_key: ${ANTHROPIC_API_KEY}
- model_name: gemini-1.5-pro
litellm_params:
model: google/gemini-1.5-pro
api_key: ${GOOGLE_API_KEY}
defaults:
timeout: 30s
max_tokens: 1024
routing:
- name: low-latency
models: .
- একটি প্রায়োগিক, উদাহরণ-ভিত্তিক আর্টিকল।
- অফিসিয়াল LiteLLM ডকুমেন্টেশন শুরু এবং প্রক্সি সেরা অনুশীলন।
—
## কর্মপরিকল্পনা: আপনার পরবর্তী ৭ দিন
দিন ১–২: ক্র্যাশ কোর্স ও দ্রুত শুরু করুন; আপনার প্রথম প্রক্সিওড অনুরোধ তৈরি করুন।
দিন ৩–৪: দ্বিতীয় প্রোভাইডার ও স্ট্রিমিং যোগ করুন; টাইমআউট, রিট্রাই সেট করুন।
দিন ৫: কনফিগ সহ প্রক্সি চালু করুন; ব্যবহারভিত্তিক রাউটিং করুন (লেটেন্সি বনাম যুক্তি)।
দিন ৬: লগিং, খরচ ট্র্যাকিং ও রিডাকশন যোগ করুন।
দিন ৭: লোড টেস্ট করুন; প্রোভাইডার ব্যর্থতা সিমুলেট করুন; ফ্যালব্যাক যাচাই করুন।
—
## মূল বিষয়সমূহ
- LiteLLM হচ্ছে বহুভেন্ডার LLM অ্যাপসের জন্য দ্রুততম পথ, ভেন্ডর লক-ইন ছাড়াই।
- OpenAI-সাপোর্টেড ইন্টারফেস দিয়ে শুরু করুন, তারপর গভর্নেন্সের জন্য প্রক্সির দিকে উন্নীত করুন।
- রাউটিং, স্থিতিশীলতা এবং অবজার্ভেবিলিটিতে আগেই বিনিয়োগ করুন—এইগুলো সপ্তাহ দুইয়ে দরকার হবে, নয় মাস পরে নয়।
- উপরের টিউটোরিয়ালগুলো দৈনন্দিন ব্যবহারের ৮০% কভার করে; বাকিটা আপনার প্রোডাক্টের গোপন সুষম।
### প্রায়শই জিজ্ঞাসিত প্রশ্ন (FAQ)
Q1: নতুনদের জন্য সেরা LiteLLM টিউটোরিয়াল কোনটি?
দ্রুত ভিজ্যুয়াল ওয়াকথ্রু জন্য YouTube এর LiteLLM ক্র্যাশ কোর্স দিয়ে শুরু করুন, তারপর প্রক্সি এর অফিসিয়াল Getting Started গাইড পড়ুন। DataCamp টিউটোরিয়াল অনুলিপি-পেস্টযোগ্য বাস্তব উদাহরণ দেয়।
Q2: কিভাবে LiteLLM কে OpenAI-সাপোর্টেড প্রক্সি হিসেবে ব্যবহার করবো?
LiteLLM প্রক্সি চালান এবং SDK এর বেস URL প্রক্সির `/v1` এন্ডপয়েন্টে নির্দেশ করুন। LiteLLM কনফিগে প্রোভাইডার ডিটেইল রাখুন যাতে অ্যাপ্লিকেশন কোড পোর্টেবল থাকে।
Q3: LiteLLM কি OpenAI, Anthropic এবং Gemini এর মধ্যে স্বয়ংক্রিয় রাউটিং করতে পারে?
হ্যাঁ। LiteLLM কনফিগে মডেল এবং রাউটিং স্ট্র্যাটেজি নির্ধারণ করে লেটেন্সি, খরচ বা গুণমানে ভেন্ডার বদলাতে পারবেন। নির্ভরযোগ্যতার জন্য ফ্যালব্যাকও সেট করতে পারেন।
Q4: LiteLLM দিয়ে কিভাবে স্ট্রিমিং এবং টুল/ফাংশন কলিং সক্রিয় করবো?
LiteLLM এর OpenAI-সাপোর্টেড API ব্যবহার করুন এবং `stream=True` চালু করুন (বা SDK তে SSE)। টুল কলিং এর জন্য OpenAI ফাংশন-কলিং ফরম্যাট অনুসরণ করুন—LiteLLM এটিকে টার্গেট প্রোভাইডারে ফরওয়ার্ড করে।
Q5: LiteLLM দিয়ে খরচ দ্রুত নিয়ন্ত্রণের সবচেয়ে ভালো উপায় কী?
প্রক্সি মাধ্যমে অনুরোধ কেন্দ্রীকরণ করুন, ব্যবহার লগিং চালু করুন এবং প্রতি কী রেট লিমিট ও বাজেট প্রয়োগ করুন। বিভিন্ন ওয়ার্কলোড খরচ-সাশ্রয়ী মডেলে রাউট করুন এবং ভার্সন ফিক্স করে অপ্রত্যাশিত ঘটনা এড়ান।