What is LiteLLM and why use it?

LiteLLM is an open-source gateway and SDK that lets you call 100+ LLMs through a single, OpenAI-compatible API. Use it to switch providers easily, set fallbacks, and centralize rate limits and cost tracking.

How does LiteLLM compare to OpenRouter?

LiteLLM is self-hostable and open-source, giving you private control with your own provider keys, while OpenRouter is a hosted aggregator. Choose LiteLLM for compliance and control, OpenRouter for quick access to many models.

Can LiteLLM replace LangChain or LlamaIndex?

No. LiteLLM focuses on model abstraction and routing. Pair it with LangChain or LlamaIndex if you need agents, chains, or RAG pipelines while keeping provider flexibility.

Does LiteLLM support fallbacks and retries?

Yes. You can define fallback chains so if one provider fails or rate-limits, LiteLLM automatically tries the next model, improving reliability for production workloads.

Is LiteLLM free to use?

LiteLLM is open-source, so there’s no license cost, but you’ll pay for the underlying model usage. If you run the proxy, factor in operational costs for hosting and monitoring.

Revisió de LiteLLM: la manera més senzilla d’accedir a tots els LLM des d’una única porta d’entrada

Si alguna vegada heu hagut de canviar bruscament la vostra app d’OpenAI a Anthropic, Google Gemini o a un model local—i heu hagut d’adaptar gairebé tot el codi només per aconseguir streaming, reintents i gestió de tokens correctament—ja sabeu per què existeixen eines com LiteLLM. Aquesta revisió va directa al gra: què fa bé LiteLLM, on té dificultats i si és l’abstracció ideal per a la vostra pila d’intel·ligència artificial el 2025.

Serem pràctics i orientats a solucions: per a què usar LiteLLM, com configurar-lo i què cal tenir en compte.

Què és LiteLLM?

LiteLLM és una porta d’entrada i SDK de codi obert que us permet cridar més de 100 LLMs a través d’una única API compatible amb OpenAI. Podeu canviar de proveïdor, afegir fallbacks i unificar la gestió de logs i control de costos sense haver de reescriure la capa d’inferència de la vostra app. Penseu-hi com un adaptador universal per LLMs: una interfície, molts models.

Idea principal: "Crida qualsevol model com si fos l’API d’OpenAI."

Modes: ús com SDK de Python o com servidor proxy/porta d’entrada.

Casos d’ús: suport multi-proveïdor, arbitratge de costos, fiabilitat amb fallbacks, observabilitat centralitzada.

## LiteLLM vs. OpenRouter

OpenRouter agrega molts models sota un únic token i ofereix un routing senzill, límits públics i un entorn similar a un marketplace. LiteLLM, en canvi, és de codi obert i sovint funciona a la vostra infraestructura.

- Control: LiteLLM us dóna control privat; OpenRouter és un agregador allotjat.

- Transparència en costos: Amb LiteLLM, porteu les vostres claus de proveïdor; amb OpenRouter, pagueu a OpenRouter, que pot incloure tarifes addicionals.

- Compliment: allotjar LiteLLM internament pot simplificar la residència i el compliment de dades.

L’anàlisi de TrueFoundry sobre LiteLLM vs OpenRouter destaca aquestes diferències estratègiques i quan és millor cada opció.

## Comparació amb LangChain i LlamaIndex

- LangChain: marc d’orquestració més ampli (cadenes, agents, eines, memòria). Pots usar LiteLLM dins de LangChain per abstraure models.

- LlamaIndex: marc orientat a dades per a RAG. LiteLLM pot actuar com la capa LLM subjacent.

- SDKs natius (OpenAI, Anthropic, Google): Millor per a funcionalitats completes i novetats; pitjor per canvi de proveïdor.

Si només necessites intercanviabilitat de models i governança neta, LiteLLM és l’eina especialitzada. Per a agents o pipelines RAG complexes, combina LiteLLM amb LangChain o LlamaIndex.

## Rendiment i fiabilitat

- Latència: La sobrecàrrega és mínima respecte a crides directes, però el routing i proxy sumen un petit cost. A canvi, guanyes fallbacks i controls de polítiques.

- Fiabilitat: Reintents centralitzats i fallback milloren el temps actiu per a apps de producció.

- Optimització de costos: Encamina models econòmics per tasques rutinàries; reserva models premium per camins crítics.

Consell: usa logs i tracing. Molts equips redirigeixen els logs de LiteLLM a les seves pilars d’observabilitat.

## Seguretat i consideracions de compliment

- Gestió de claus: Desa les claus de proveïdor de manera segura; usa variables d’entorn o vaults.

- Auditabilitat: El proxy central registra consultes, metadades de respostes i despesa.

- Gestió de dades: L’auto allotjament ajuda amb la residència de dades i garanties de privadesa.