Aktualisiert am 25. Sept. 2025
7 min
/v1/chat/completions Endpunkt erstellt.pip install litellmexport OPENAI_API_KEY=sk-...# Optional: weitere Anbieterexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # oder "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- Führen Sie den obigen Schnellstartcode aus.- Ziel: Ihre erste OpenAI-kompatible Anfrage via LiteLLM stellen.- Praktische Anwender- Lesen Sie das DataCamp-Tutorial und erweitern Sie Beispiele mit Streaming und Wiederholungen.- Fügen Sie zwei Anbieter hinzu und testen Sie Fallbacks.- Team/Produktions-Verantwortliche- Studieren Sie die offizielle Getting-Started-Anleitung.- Starten Sie den Proxy, fügen Sie Observability und Kostenverfolgung hinzu.- Setzen Sie Ratenbegrenzungen und PII-Redaktionsrichtlinien durch.—## Deep Dive: Muster, die Sie wöchentlich verwenden werden### OpenAI-Kompatibilität als Schnittstellenvertrag- Behandeln Sie OpenAIs API-Form als Vertrag Ihrer App. Alle Anfragen gehen an die `/v1/*` Endpunkte Ihres LiteLLM Proxys.- Modelle (z. B. `gpt-4o` → `claude-3-5`) per Konfiguration, nicht Code wechseln.### Modell-Routing je Anwendungsfall- Latenzempfindlicher Pfad: Route zu schnellen, günstigeren Modellen.- Reasoning-Pfad: Route zu höherwertigen Modellen für Retrieval-Augmented Generation (RAG) oder Tool-Nutzung.- Datenschutz-Pfad: Route zu lokalen/Ollama-Modellen für PII-Abschnitte.### Kosten-Schutzmaßnahmen- Markieren Sie Anfragen mit `user_id`/`team`.- Legen Sie Budgets pro Team/Modell fest.- Protokollieren Sie Token-Nutzung zentral und alarmieren Sie bei Anomalien.### Resilienz- Aktivieren Sie Wiederholungen mit Jitter.- Konfigurieren Sie Zeitüberschreitungen pro Anbieter und Circuit Breaker bei wiederholten Fehlern.- Definieren Sie Anbieterprioritäten und explizite Fallbacks.### Observability- Erfassen Sie Anfrage/Antwort-Metadaten, Latenz-Histogramme und Modell/Version.- Schwärzen Sie Geheimnisse/PII in Logs.- Korrelieren Sie Traces über Services, um langsame Aufrufe schnell zu finden.—## Beispiel LiteLLM Proxy Konfiguration (Produktionsreife Starter-Konfig)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- Ein praxisnaher, beispielorientierter Artikel.- Die offiziellen LiteLLM Docs für Einstieg und Proxy Best Practices.—## Aktionsplan: Ihre nächsten 7 TageTag 1–2: Absolvieren Sie den Crash-Kurs und Schnellstart; stellen Sie Ihre erste proxierte Anfrage.Tag 3–4: Fügen Sie einen zweiten Anbieter und Streaming hinzu; setzen Sie Timeouts, Wiederholungen.Tag 5: Stellen Sie den Proxy mit Konfiguration bereit; routen Sie nach Anwendungsfall (Latenz vs. Reasoning).Tag 6: Fügen Sie Protokollierung, Kostenverfolgung und Redaktion hinzu.Tag 7: Lasttest; simulieren Sie Anbieterfehler; verifizieren Sie Fallbacks.—## Zentrale Erkenntnisse- LiteLLM ist der schnellste Weg zu Multi-Anbieter-LLM-Apps ohne Vendor Lock-in.- Starten Sie mit einer OpenAI-kompatiblen Schnittstelle, dann steigen Sie auf den Proxy für Governance um.- Investieren Sie früh in Routing, Resilienz und Observability – Sie brauchen es in Woche zwei, nicht erst in Monat sechs.- Die obigen Tutorials decken 80% dessen ab, was Sie täglich nutzen; der Rest ist das Geheimrezept Ihres Produkts.### FAQF1: Welches ist das beste LiteLLM Tutorial für Anfänger?Starten Sie mit dem LiteLLM Crash Kurs auf YouTube für eine schnelle visuelle Einführung, dann lesen Sie die offizielle Getting-Started-Anleitung für den Proxy. Das DataCamp-Tutorial bietet praxisnahe Beispiele zum Nachbauen.F2: Wie verwende ich LiteLLM als OpenAI-kompatiblen Proxy?Starten Sie den LiteLLM Proxy und richten Sie die Basis-URL Ihres SDKs auf die `/v1`-Endpunkte des Proxys. Halten Sie Anbieterdetails in der LiteLLM-Konfiguration, damit Ihr Anwendungscode portabel bleibt.F3: Kann LiteLLM automatisch zwischen OpenAI, Anthropic und Gemini routen?Ja. Definieren Sie Modelle und Routing-Strategien in der LiteLLM-Konfiguration, um je nach Latenz, Kosten oder Qualität zwischen Anbietern zu wechseln. Sie können auch Fallbacks für mehr Zuverlässigkeit festlegen.F4: Wie aktiviere ich Streaming und Tool/Funktionsaufrufe mit LiteLLM?Nutzen Sie die OpenAI-kompatible API über LiteLLM und setzen Sie `stream=True` (oder SSE in Ihrem SDK). Für Tool-Aufrufe folgen Sie dem OpenAI Function-Calling-Format – LiteLLM leitet dies an den Zielanbieter weiter.F5: Was ist der schnellste Weg, Kosten mit LiteLLM zu kontrollieren?Zentralisieren Sie Anfragen über den Proxy, aktivieren Sie Nutzungsprotokollierung und setzen Sie pro Schlüssel Ratenbegrenzungen und Budgets durch. Routen Sie verschiedene Workloads zu kostenoptimierten Modellen und fixieren Sie Versionen, um Überraschungen zu vermeiden.
Wie man ChatPDF meistert: Schnellere Einblicke in umfangreiche Dokumente

Die beste Alternative zu X Auto-Translation für schnelle und präzise Dokumente

Samsung KI-Übersetzung in Iran nicht verfügbar? Praktische Lösungen

Persische Übersetzungstools: Ein praktischer Leitfaden für schnellere und präzisere Arbeit

Die beste Grok-Alternative für tiefgehende, zitierte Forschung

Die 15 wichtigsten Funktionen von KI-Bildgeneratoren, die Sie wirklich nutzen werden