Güncellendi: 25 Eyl 2025
6 dk
# Pythonpip install litellm# Node.jsnpm install litellm# Örnek: OpenAI + Anthropic + Mistral kullanımıexport OPENAI_API_KEY=sk-...export ANTHROPIC_API_KEY=sk-ant-...export MISTRAL_API_KEY=sk-mis-...from litellm import completionresp = completion(model="gpt-4o-mini", # veya "anthropic/claude-3-5-sonnet", "mistral/mistral-large"messages=.---## Akış, Araçlar ve JSON Modu### Akış Yanıtları```pythonfrom litellm import completionfor chunk in completion(model="gpt-4o-mini",messages=.### Maliyet ve Token KullanımıLiteLLM, istek, model veya proje bazında token kullanımını takip eder ve maliyet tahmini yapar. Proxy ile kullanım verilerini loglara, panolara veya faturalama alıcılarına aktarabilirsiniz. Farklı fiyatlandırmaya sahip sağlayıcıları karıştırırken bu çok değerlidir.---## LiteLLM Proxy (LLM Geçidi)Eğer bir ekip veya platformsanız, proxy gerçek süper güçtür: yönlendirme, yetkilendirme, hızlimiti, kayıt tutma ve gözlemlenebilirlik sağlar. OpenAI API yüzeyi ile etkileşerek uygulama kodunuzda neredeyse hiç değişiklik yapmadan kullanabilirsiniz.### Proxy Başlatma```bash# en basit yerel çalıştırmalitellm --port 4000/v1/chat/completions. Mevcut OpenAI istemcinizi ` adresine yönlendirin ve kullanıma hazırsınız.config.yaml oluşturun:model_list:- model_name: gpt-4o-minilitellm_params:model: openai/gpt-4o-miniapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}router:strategy: simple_weightedroutes:- model: gpt-4o-miniweight: 0.6- model: claude-3-5-sonnetweight: 0.4rate_limits:requests_per_minute: 120logging:level: infosink: stdoutauth:api_keys:- key: svc-app-123litellm --config config.yaml --port 4000from openai import OpenAIclient = OpenAI(base_url=" api_key="svc-app-123")resp = client.chat.completions.create(model="gpt-4o-mini",messages=.---## İleri Yönlendirme: Gecikme, Maliyet veya GüvenilirlikŞu yönlendirme stratejilerini uygulayabilirsiniz:- Modelleri A/B için ağırlıklı döngü- Bölgeye göre en düşük gecikmeli öncelik- Kritik olmayan uç noktalar için maliyet odaklı yönlendirme- Sağlayıcılar arasında hata durumunda geri dönüş/yinelemeBir yönlendirme politikasıyla “ucuz tercih et, zor istemlerde premium’a geç” diyebilirsiniz. Bu yüksek erişilebilirlik ve öngörülebilir bütçe sağlar.---## Guardrail, Moderasyon ve Güvenlikİstemciye dönmeden önce PII temizleme, güvenlik filtreleri uygulama veya çıktı moderasyonu için ön ve sonrası işleme ara yazılımı ekleyin. Sağlayıcıya özgü moderasyon (örneğin OpenAI, Google) ile proxy’de kendi politika kontrollerinizi birleştirin. Örnek: JSON şema doğrulaması zorunlu kılın ve geçersizse soruyu tekrar sorun.---## Gözlemlenebilirlik ve Kayıt Tutma- İstek/yanıt kayıtlarını gizleyerek etkinleştirin.- Metrikleri Prometheus/Grafana veya APM’nize aktarın.- Gecikme, token ve maliyeti uç nokta ve kullanıcı bazında izleyin.Bu sayede “model ruleti” SLO ve bütçeleri olan yönetilen bir hizmete dönüşür.---## Gerçek Dünya Kullanım Desenleri1) Çoklu sağlayıcı dayanıklılığı- Birincil: hızlı/ucuz model; Yedek: 429/5xx durumunda yüksek doğruluklu model.- Faydalar: daha iyi çalışma süresi, maliyet kontrolü ve stabil kalite.2) Özellik bayrağı ile model yükseltmeleri- Yönlendirici ağırlıkları kullanarak yeni modeli %5 trafik için test edin; metrikleri takip edin; stabil olur olmaz genişletin.3) Ürün kademeleri- Ücretsiz katman küçük modellere; Pro katman premium modellere yönlendirildi.4) İstem kayıtları ve şablonları- İstemleri proxy’de merkezileştirerek hizmetlerin yeniden dağıtımlara gerek kalmadan gelişmelerden faydalanmasını sağlayın.5) Ekip faturalama ve bütçeleri- API anahtarı bazında harcamaları takip edin; takım veya ürün için yumuşak ve sert limitler uygulayın.---## Güvenlik ve Uygunluk Kontrol Listesi- Sağlayıcı anahtarlarını gizli yöneticiye depolayın; yapılandırmada ortam değişkenleriyle referans verin.- Kayıtlarda istek gizleme ve PII temizleme özelliklerini açın.- Proxy için servis bazlı API anahtarları kullanın; düzenli olarak değiştirin.- Kurum çapında hız limitleri ve kota belirleyin.- Modeller ve uç noktalar için izinli/engelli listeleri ekleyin.---## Sorun Giderme: Hızlı Çözümler- Proxy üzerinden "Unauthorized" hatası: `auth.api_keys` ve istemcinizin doğru `base_url` ile anahtar kullandığını kontrol edin.- Model bulunamadı: Çağırdığınız isimlerin `model_list` içinde olduğundan emin olun.- Zaman aşımı: `timeout` değerini artırın veya daha düşük gecikmeli bölgeye yönlendirin.- Garip çıktı: JSON şema ve doğrulamayı etkinleştirin; yeniden denemeler ve geri dönüş ekleyin.- Maliyet artışları: Önbellekleme açın; toplu trafiği daha ucuz modellere yönlendirin; anahtar bazlı kotalar belirleyin.Daha derin bilgiler ve en yeni özellikler için resmi dokümanlar sık güncellenmekte ve favorilerinize eklemeye değer. DataCamp rehberleri pratik desenler için harika, başlangıç videosu ise kavramların sahnede nasıl göründüğünü anlamanıza yardımcı olur.---## Hepsini Bir Araya Getirin: Referans Uygulama İskeleti (Python FastAPI)```python# app.pyfrom fastapi import FastAPIfrom pydantic import BaseModelfrom litellm import completionimport osclass ChatReq(BaseModel):question: strapp = FastAPI()@app.post("/ask")async def ask(req: ChatReq): resp = completion( model=os.getenv("DEFAULT_MODEL", "gpt-4o-mini"), messages=[{"role": "user", "content": req.question}], ) return resp### SSSQ1: LiteLLM nedir ve neden doğrudan sağlayıcı SDK’ları yerine kullanırım?LiteLLM, 100’den fazla LLM için OpenAI uyumlu bir geçittir; size tek API ve tek düşünce modeli sunar. Sağlayıcı bağımlılığını azaltır, yönlendirmeyi basitleştirir ve önbellekleme, yeniden deneme, maliyet takibi gibi operasyonel özellikler ekler.Q2: LiteLLM’yi OpenAI SDK ile nasıl kullanırım?SDK’nın base_url’sini LiteLLM proxy’sine yönlendirin ve proxy’nin API anahtarını kullanın. Kodunuz aynı kalırken arka planda proxy sağlayıcıları veya modelleri değiştirir.Q3: LiteLLM yanıtları akış halinde gönderebilir ve JSON dönebilir mi?Evet. `stream=True` parametresi ile token akışı alınabilir ve JSON şeması ile yapısal çıktı zorunlu kılınabilir.Q4: Farklı LLM sağlayıcılar arasında maliyetleri nasıl kontrol ederim?Kullanım kayıtlarını ve maliyet tahminini etkinleştirin, önbellekleme ekleyin, hız limitleri koyun ve büyük trafiği ucuz modellere yönlendirin. Panolarla bütçeleri ve SLO’ları izleyin.
ChatPDF'i Ustalaştırma Rehberi: Yoğun Belgelerden Daha Hızlı İçgörüler

Hızlı ve Doğru Dokümanlar İçin En İyi X Otomatik Çeviri Alternatifi

Samsung AI Çeviri İran'da Kullanılamıyor mu? Pratik Çözümler

Farsça Çeviri Araçları: Daha Hızlı ve Doğru Çalışma İçin Pratik Rehber

Derin ve Kaynak Gösterimli Araştırmalar için En İyi Grok Alternatifi

Yapay Zeka Görsel Oluşturucunun Gerçekten Kullanacağınız En İyi 15 Özelliği