LiteLLM ಪರ್ಯಾಯಗಳು: 2025 ರಲ್ಲಿ ಯಾವುದನ್ನು ಬಳಸಬೇಕು?
ನೀವು LLM API ಕರೆಗಳನ್ನು ಪ್ರಮಾಣೀಕರಿಸಲು ಮತ್ತು ಪೂರೈಕೆದಾರರಲ್ಲಿ ಟ್ರಾಫಿಕ್ ಅನ್ನು ರೂಟ್ ಮಾಡಲು LiteLLM ಅನ್ನು ಬಳಸುತ್ತಿದ್ದರೆ, ನೀವು ಒಬ್ಬಂಟಿಯಲ್ಲ. ಇದು ಒಂದು ಬುದ್ಧಿವಂತ ಕಲ್ಪನೆ: OpenAI, Anthropic, Google, Azure ಮತ್ತು ಅದರಾಚೆಗಿನ ಒಂದು API ಇಂಟರ್ಫೇಸ್. ಆದರೆ ತಂಡಗಳು ವಿಸ್ತಾರವಾದಂತೆ, ಅವರಿಗೆ ಆಳವಾದ ವೀಕ್ಷಣೆ, ಬಿಗಿಯಾದ ದರ ನಿಯಂತ್ರಣ, ಬಳಕೆಯ ವಿಶ್ಲೇಷಣೆ, ಸೂಕ್ಷ್ಮವಾದ ನೀತಿಗಳು ಅಥವಾ ಎಂಟರ್ಪ್ರೈಸ್-ಗ್ರೇಡ್ ವಿಶ್ವಾಸಾರ್ಹತೆ ಬೇಕಾಗುತ್ತದೆ—ಇವುಗಳನ್ನು ಹಗುರವಾದ ಲೈಬ್ರರಿಯು ಯಾವಾಗಲೂ ನೀಡುವುದಿಲ್ಲ. ಇಲ್ಲಿಯೇ LiteLLM ಪರ್ಯಾಯಗಳು ಬರುತ್ತವೆ.
ಈ ಮಾರ್ಗದರ್ಶಿಯಲ್ಲಿ, ಮಾದರಿ ರೂಟಿಂಗ್, ಕ್ಯಾಶಿಂಗ್, ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಆಡಳಿತಕ್ಕಾಗಿ ಸರಿಯಾದ ಸ್ಟಾಕ್ ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಲು, ನಾವು ಪ್ರಾಯೋಗಿಕ LiteLLM ಪರ್ಯಾಯಗಳನ್ನು ಅನ್ವೇಷಿಸುತ್ತೇವೆ—ಓಪನ್-ಸೋರ್ಸ್ ಗೇಟ್ವೇಗಳು ಮತ್ತು ರೂಟರ್ಗಳಿಂದ ಎಂಟರ್ಪ್ರೈಸ್ ವೈಶಿಷ್ಟ್ಯಗಳೊಂದಿಗೆ ಹೋಸ್ಟ್ ಮಾಡಿದ ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳವರೆಗೆ.
ಗಮನಿಸಬೇಕಾದ ಅಂಶ: ಸಾರ್ವಜನಿಕ ಹೋಲಿಕೆ ಪುಟಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿದ್ದರೂ, ಕೆಲವು LiteLLM ಅನ್ನು ವಿಶಾಲವಾದ AI ಪ್ಲಾಟ್ಫಾರ್ಮ್ ವರ್ಗಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತವೆ, ಆದ್ದರಿಂದ ಒಂದು ಟೂಲ್ ನಿಜವಾಗಿಯೂ ಡ್ರಾಪ್-ಇನ್ ಪರ್ಯಾಯವೇ ಅಥವಾ ಸಂಪೂರ್ಣವಾಗಿ ವಿಭಿನ್ನವಾದ ಲೇಯರ್ ಆಗಿದೆಯೇ ಎಂದು ಯಾವಾಗಲೂ ಪರಿಶೀಲಿಸಿ.
ನಾವು ಇದನ್ನು ಬಳಕೆಯ ಸಂದರ್ಭಗಳು, ಸಾಮರ್ಥ್ಯಗಳು ಮತ್ತು ಟ್ರೇಡ್-ಆಫ್ಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತೇವೆ ಮತ್ತು ಸ್ಥಿತಿಸ್ಥಾಪಕತ್ವದ, ವೆಚ್ಚ-ಪರಿಣಾಮಕಾರಿ LLM ಗೇಟ್ವೇ ಅನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸಲು ಸಲಹೆಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತೇವೆ.
ತ್ವರಿತ ಪ್ರೈಮರ್: LiteLLM ಏನು ಪರಿಹರಿಸುತ್ತದೆ (ಮತ್ತು ಏನು ಪರಿಹರಿಸುವುದಿಲ್ಲ)
LiteLLM ನಿಮಗೆ ಬಹು LLM ಪೂರೈಕೆದಾರರು ಮತ್ತು ಮಾದರಿಗಳಿಗೆ ಏಕೀಕೃತ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ನೀಡುತ್ತದೆ. ಇದು ಯಾವುದಕ್ಕಾಗಿ ಸೂಕ್ತವಾಗಿದೆ:
- ವಿನಂತಿ/ಪ್ರತಿಕ್ರಿಯೆ ಸ್ಕೀಮಾಗಳನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸುವುದು
- ಕನಿಷ್ಠ ಕೋಡ್ ಬದಲಾವಣೆಗಳೊಂದಿಗೆ ಪೂರೈಕೆದಾರರು/ಮಾದರಿಗಳ ನಡುವೆ ಬದಲಾಯಿಸುವುದು
- ಮೂಲ ರಿಟ್ರೈಗಳು ಮತ್ತು ಫಾಲ್ಬ್ಯಾಕ್ಗಳು
ಆದರೆ ತಂಡಗಳು ಯಾವಾಗ ಇದನ್ನು ಮೀರಿ ಬೆಳೆಯುತ್ತವೆ:
- ಕೇಂದ್ರೀಕೃತ ಬಳಕೆಯ ವಿಶ್ಲೇಷಣೆ, ಪ್ರತಿ-ಕೀ ಕೋಟಾಗಳು ಮತ್ತು ವೆಚ್ಚ ಟ್ರ್ಯಾಕಿಂಗ್
- ಪೂರೈಕೆದಾರರು/ಮಾದರಿಗೆ ಅನುಗುಣವಾಗಿ ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ದರ ಮಿತಿಗಳು ಮತ್ತು ಟ್ರಾಫಿಕ್ ಶೇಪಿಂಗ್
- ಸರ್ಕ್ಯೂಟ್ ಬ್ರೇಕಿಂಗ್, ಆರೋಗ್ಯ ತಪಾಸಣೆ ಮತ್ತು ದೊಡ್ಡ ಪ್ರಮಾಣದಲ್ಲಿ ಸ್ವಯಂಚಾಲಿತ ಫೇಲ್ಓವರ್
- ಪ್ರಾಂಪ್ಟ್/ವರ್ಷನ್ ಆಡಳಿತ, A/B ಪರೀಕ್ಷೆ, ಇವಾಲ್ಸ್ ಮತ್ತು ಗಾರ್ಡ್ರೈಲ್ಸ್
- ನಿರಂತರ ಕ್ಯಾಶಿಂಗ್, ವಿಷಯ ನೀತಿಗಳು ಮತ್ತು ರೆಡ್ ಟೀಮಿಂಗ್
ಇಲ್ಲಿಯೇ ಪರ್ಯಾಯಗಳು ಬರುತ್ತವೆ.
LiteLLM ಪರ್ಯಾಯಗಳ ವಿಧಗಳು
- ಹೋಸ್ಟ್ ಮಾಡಿದ LLM ಗೇಟ್ವೇಗಳು & ರೂಟರ್ಗಳು: ಸಂಪೂರ್ಣವಾಗಿ ನಿರ್ವಹಿಸಲಾದ ಸೇವೆಗಳು ಅನೇಕ ಪೂರೈಕೆದಾರರಿಗೆ ಪ್ರಾಕ್ಸಿ ಆಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ, ವಿಶ್ಲೇಷಣೆ, ಕ್ಯಾಶಿಂಗ್, ದರ ಮಿತಿಗಳು ಮತ್ತು ತಂಡದ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸೇರಿಸುತ್ತವೆ.
- ಓಪನ್-ಸೋರ್ಸ್ ಗೇಟ್ವೇಗಳು/ಸರ್ವಿಂಗ್: OSS ಪರಿಕರಗಳೊಂದಿಗೆ ನಿಮ್ಮ ಸ್ವಂತ ನಿಯಂತ್ರಣ ಪ್ಲೇನ್ ಅನ್ನು ನಿರ್ಮಿಸಿ, ನಂತರ ಅದರ ಮೇಲೆ ವೀಕ್ಷಣೆ ಮತ್ತು ನೀತಿಗಳನ್ನು ಸೇರಿಸಿ.
- ವೀಕ್ಷಣೆ/ವಿಶ್ಲೇಷಣೆ ಲೇಯರ್ಗಳು: ನಿಮ್ಮ ಪ್ರಸ್ತುತ ಕ್ಲೈಂಟ್ ಲೈಬ್ರರಿಯನ್ನು ಇರಿಸಿ ಆದರೆ ಶಕ್ತಿಯುತ ವಿಶ್ಲೇಷಣೆ, ಇವಾಲ್ಸ್ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆ ಸ್ಟಾಕ್ ಅನ್ನು ಸೇರಿಸಿ.
- ಸಂಪೂರ್ಣ MLOps/LLMOps ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳು: ನಿಮಗೆ ಫೈನ್-ಟ್ಯೂನಿಂಗ್, ವೆಕ್ಟರ್ ಸ್ಟೋರ್ಗಳು, ವರ್ಕ್ಫ್ಲೋಗಳು ಅಥವಾ ಎಂಟರ್ಪ್ರೈಸ್ ಆಡಳಿತವೂ ಅಗತ್ಯವಿದ್ದರೆ.
ಸಮುದಾಯ ಪಟ್ಟಿಗಳು ಲ್ಯಾಂಡ್ಸ್ಕೇಪ್ ಅನ್ನು ಮ್ಯಾಪ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ, ಆದರೂ ಅವು ವರ್ಗಗಳು ಮತ್ತು ಪ್ರಬುದ್ಧತೆಯ ಮಟ್ಟವನ್ನು ಮಿಶ್ರಣ ಮಾಡುತ್ತವೆ.
ಉತ್ತಮ LiteLLM ಪರ್ಯಾಯಗಳು (ಸನ್ನಿವೇಶದ ಪ್ರಕಾರ)
ಸಂಸ್ಥೆಗಳು ದೊಡ್ಡದಾದಂತೆ ಸಾಮಾನ್ಯವಾಗಿ ಅಳವಡಿಸಿಕೊಳ್ಳುವ ಪರ್ಯಾಯಗಳ ಪ್ರಾಯೋಗಿಕ ಪಟ್ಟಿ ಕೆಳಗಿದೆ. ಇವುಗಳನ್ನು ಪ್ರಾಥಮಿಕ ಕೆಲಸದ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಲಾಗಿದೆ ಆದ್ದರಿಂದ ನೀವು ಅವುಗಳನ್ನು ನಿಮ್ಮ ಅಗತ್ಯಗಳಿಗೆ ಹೊಂದಿಸಬಹುದು.
1) ಮಲ್ಟಿ-ಪ್ರೊವೈಡರ್ ಗೇಟ್ವೇಗಳು & ಮಾಡೆಲ್ ರೂಟರ್ಗಳು
- OpenRouter: ಒಂದು ಜನಪ್ರಿಯ ಹೋಸ್ಟ್ ಮಾಡಿದ ಗೇಟ್ವೇ, ಇದು ಅನೇಕ ಪೂರೈಕೆದಾರರನ್ನು (OpenAI, Anthropic, Google, ಓಪನ್-ಸೋರ್ಸ್ ಮಾದರಿಗಳು) ಅಮೂರ್ತಗೊಳಿಸುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ ಏಕ-ಪೂರೈಕೆದಾರ ಸೆಟಪ್ನಿಂದ ಬಳಕೆ ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ಪ್ರತಿ-ಕೀ ನಿಯಂತ್ರಣಗಳೊಂದಿಗೆ ಬಹು-ಪೂರೈಕೆದಾರ ರೂಟಿಂಗ್ಗೆ ಸರಳ ವಲಸೆಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
- Eden AI: ಅನೇಕ AI API ಗಳನ್ನು (LLM ಗಳು, ಅನುವಾದ, ಭಾಷಣ, OCR) ಒಂದು ಬಿಲ್ಲಿಂಗ್ ಮತ್ತು ಒಂದು ಇಂಟರ್ಫೇಸ್ನ ಹಿಂದೆ ಒಟ್ಟುಗೂಡಿಸುತ್ತದೆ—ನೀವು LLM ಗಳಿಗಿಂತ ಹೆಚ್ಚಿನದನ್ನು ಬಯಸಿದರೆ ಸೂಕ್ತವಾಗಿದೆ.
- Vellum: ದೃಢವಾದ ಪ್ರಯೋಗ ಟ್ರ್ಯಾಕಿಂಗ್, ರೂಟಿಂಗ್ ನೀತಿಗಳು ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ವರ್ಕ್ಫ್ಲೋಗಳೊಂದಿಗೆ ಪ್ರಾಂಪ್ಟ್ ಮತ್ತು ಮಾದರಿ ನಿರ್ವಹಣೆಯ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದೆ. ಹೆಚ್ಚು ಪುನರಾವರ್ತಿಸುವ ತಂಡಗಳಿಗೆ ಬಲವಾಗಿದೆ.
- Baseten: ಪ್ರಾಥಮಿಕವಾಗಿ ತೀರ್ಮಾನ ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಆಗಿದ್ದರೂ, ಇದು ಉತ್ಪಾದನಾ ವಿಶ್ವಾಸಾರ್ಹತೆ, ಸ್ಕೇಲಿಂಗ್ ಮತ್ತು ವೀಕ್ಷಣೆಯೊಂದಿಗೆ ಮಾದರಿಗಳನ್ನು (ಓಪನ್-ಸೋರ್ಸ್ ಸೇರಿದಂತೆ) ನಿಯೋಜಿಸಲು ಮತ್ತು ಸರ್ವ್ ಮಾಡಲು ಬೆಂಬಲಿಸುತ್ತದೆ.
- Laminar: ನೀತಿ-ಚಾಲಿತ ಮಾದರಿ ಆಯ್ಕೆ, ಸುರಕ್ಷತಾ ಫಿಲ್ಟರ್ಗಳು ಮತ್ತು ಆಡಳಿತದ ಕಡೆಗೆ ಗಮನಹರಿಸಿದೆ—ಅನುಸರಣೆ ಮತ್ತು ವಿಷಯ ನೀತಿ ಮುಖ್ಯವಾಗಿರುವಲ್ಲಿ ಉಪಯುಕ್ತವಾಗಿದೆ.
ಯಾವಾಗ ಆಯ್ಕೆ ಮಾಡಬೇಕು: ನಿಮಗೆ LiteLLM ನ ಸರಳತೆ ಬೇಕು, ಆದರೆ ಡ್ಯಾಶ್ಬೋರ್ಡ್ಗಳು, ವಿನಂತಿ ಲಾಗ್ಗಳು, ದರ ಮಿತಿಗಳು, ಕ್ಯಾಶಿಂಗ್ ಮತ್ತು ಎಂಟರ್ಪ್ರೈಸ್ ವೈಶಿಷ್ಟ್ಯಗಳೊಂದಿಗೆ ಬಾಕ್ಸ್ನಿಂದ ಹೊರಗೆ.
2) ವೀಕ್ಷಣೆ, ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಇವಾಲ್ಸ್ ಲೇಯರ್ಗಳು
- LangFuse: ಟ್ರೇಸಿಂಗ್, ಪ್ರಾಂಪ್ಟ್/ವರ್ಷನ್ ವಿಶ್ಲೇಷಣೆ, ಲೇಟೆನ್ಸಿ ಮತ್ತು ವೆಚ್ಚದ ಒಳನೋಟಗಳಿಗೆ ಅತ್ಯುತ್ತಮವಾಗಿದೆ. ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮತ್ತು A/B ಗಳನ್ನು ರನ್ ಮಾಡಲು ಯಾವುದೇ ಗೇಟ್ವೇ ಜೊತೆಗೆ ಚೆನ್ನಾಗಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ.
- Helicone: ವಿನಂತಿ/ಪ್ರತಿಕ್ರಿಯೆ ಮೆಟಾಡೇಟಾ, ವೆಚ್ಚಗಳು, ಲೇಟೆನ್ಸಿಯನ್ನು ಸೆರೆಹಿಡಿಯುವ ಮತ್ತು ಭಾರೀ ಇನ್ಸ್ಟ್ರುಮೆಂಟೇಶನ್ ಇಲ್ಲದೆ ಡ್ಯಾಶ್ಬೋರ್ಡ್ಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುವ ಹೋಸ್ಟ್ ಮಾಡಿದ ವಿಶ್ಲೇಷಣೆ ಪ್ರಾಕ್ಸಿ.
- PromptLayer: ಪ್ರಾಂಪ್ಟ್ಗಳು, ವರ್ಷನ್ಗಳು ಮತ್ತು ಪ್ರಯೋಗದ ಫಲಿತಾಂಶಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ; ಪ್ರಾಂಪ್ಟ್ ಪುನರಾವರ್ತನೆಗಳಾದ್ಯಂತ ಸಂತಾನೋತ್ಪತ್ತಿ ಮತ್ತು ಸಹಯೋಗದ ಅಗತ್ಯವಿರುವ ತಂಡಗಳಿಗೆ ಉಪಯುಕ್ತವಾಗಿದೆ.
ಯಾವಾಗ ಆಯ್ಕೆ ಮಾಡಬೇಕು: ನೀವು LiteLLM (ಅಥವಾ ನಿಮ್ಮ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಕ್ಲೈಂಟ್) ಅನ್ನು ಇರಿಸಿಕೊಳ್ಳಲು ಬಯಸುತ್ತೀರಿ ಆದರೆ ಆಳವಾದ ಗೋಚರತೆ, ಮಾಪನ ಮತ್ತು ಆಡಳಿತವನ್ನು ಸೇರಿಸಲು ಬಯಸುತ್ತೀರಿ.
3) ಓಪನ್-ಸೋರ್ಸ್ ಸರ್ವಿಂಗ್ & ಸೆಲ್ಫ್-ಹೋಸ್ಟೆಡ್ ಕಂಟ್ರೋಲ್ ಪ್ಲೇನ್ಗಳು
- BentoML: ಉತ್ಪಾದನೆಯಲ್ಲಿ ಮಾದರಿಗಳನ್ನು ಪ್ಯಾಕೇಜ್ ಮಾಡಲು, ಸರ್ವ್ ಮಾಡಲು ಮತ್ತು ಸ್ಕೇಲ್ ಮಾಡಲು ಒಂದು ಪ್ರಬುದ್ಧ ಚೌಕಟ್ಟು. ನೀವು ಬಿಗಿಯಾದ ನಿಯಂತ್ರಣ ಮತ್ತು ಆನ್-ಪ್ರೆಮ್/ಏರ್-ಗ್ಯಾಪ್ಡ್ ನಿಯೋಜನೆಯನ್ನು ಬಯಸಿದಾಗ ಸೂಕ್ತವಾಗಿದೆ.
- Ray Serve / Anyscale: ನೀವು ದೊಡ್ಡ ಪ್ರಮಾಣದಲ್ಲಿ ಅನೇಕ ಕಸ್ಟಮ್ ಅಥವಾ OSS ಮಾದರಿಗಳನ್ನು ಸರ್ವ್ ಮಾಡುತ್ತಿದ್ದರೆ, Ray Serve ಪ್ರೋಗ್ರಾಮೆಬಲ್ ರೂಟಿಂಗ್, ಆಟೋಸ್ಕೇಲಿಂಗ್ ಮತ್ತು ಹೆಚ್ಚಿನ ಥ್ರೋಪುಟ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ.
- Beam / Banana: ತ್ವರಿತ ನಿಯೋಜನೆ ಹರಿವುಗಳೊಂದಿಗೆ ಸರ್ವರ್ಲೆಸ್-ಶೈಲಿಯ ಮಾದರಿ ಹೋಸ್ಟಿಂಗ್, ಕನಿಷ್ಠ ಕಾರ್ಯಾಚರಣೆಗಳೊಂದಿಗೆ ಕಸ್ಟಮ್ ಮಾದರಿಗಳನ್ನು ರನ್ ಮಾಡಲು ಬಯಸುವ ತಂಡಗಳಿಗೆ ಸೂಕ್ತವಾಗಿದೆ.
- Ollama: ಓಪನ್-ಸೋರ್ಸ್ ಮಾದರಿಗಳ ಸ್ಥಳೀಯ/ಎಡ್ಜ್ ತೀರ್ಮಾನಕ್ಕೆ ಉತ್ತಮವಾಗಿದೆ; ಗೇಟ್ವೇ ಅನ್ನು ಅನುಕರಿಸಲು ನಿಮ್ಮ ಸ್ವಂತ ರಿವರ್ಸ್ ಪ್ರಾಕ್ಸಿ ಮತ್ತು ಮೆಟ್ರಿಕ್ಗಳೊಂದಿಗೆ ಸಂಯೋಜಿಸಿ.
ಯಾವಾಗ ಆಯ್ಕೆ ಮಾಡಬೇಕು: ನಿಮಗೆ ಅನುಸರಣೆಗಾಗಿ ಸ್ವಯಂ-ಹೋಸ್ಟ್ ಅಗತ್ಯವಿದೆ, OSS ಮಾದರಿಗಳನ್ನು ರನ್ ಮಾಡಲು ಬಯಸುತ್ತೀರಿ ಅಥವಾ ನಿಮ್ಮ ಸ್ವಂತ ಇನ್ಫ್ರಾದಲ್ಲಿ ಕಸ್ಟಮ್ ರೂಟಿಂಗ್ ಲಾಜಿಕ್ ಮತ್ತು SLA ಗಳು ಬೇಕಾಗುತ್ತವೆ.
4) ವರ್ಕ್ಫ್ಲೋ, ನೀತಿಗಳು ಮತ್ತು ಎಂಟರ್ಪ್ರೈಸ್ ಆಡಳಿತ ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳು
- Vellum (ಮತ್ತೆ): ಪ್ರಯೋಗ ನಿರ್ವಹಣೆ, ಇವಾಲ್ಸ್ ಮತ್ತು ನೀತಿ-ಚಾಲಿತ ರೂಟಿಂಗ್ಗೆ ಬಲವಾಗಿದೆ.
- Laminar (ಮತ್ತೆ): ಸುರಕ್ಷತೆ, ಗಾರ್ಡ್ರೈಲ್ಸ್ ಮತ್ತು ಮಾದರಿ ನೀತಿಗಳನ್ನು ಒತ್ತಿಹೇಳುತ್ತದೆ.
- Vertex AI, watsonx, ಇತ್ಯಾದಿ: ದೊಡ್ಡ ಕ್ಲೌಡ್ ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳು ಕೆಲವೊಮ್ಮೆ ಡೈರೆಕ್ಟರಿಗಳಲ್ಲಿ LiteLLM "ಪರ್ಯಾಯಗಳಾಗಿ" ಕಾಣಿಸಿಕೊಳ್ಳುತ್ತವೆ, ಆದರೆ ಅವುಗಳು ಬಹಳ ವಿಭಿನ್ನ ವ್ಯಾಪ್ತಿಯನ್ನು ಹೊಂದಿರುವ ವಿಶಾಲವಾದ ಪರಿಸರ ವ್ಯವಸ್ಥೆಗಳಾಗಿವೆ.
ಯಾವಾಗ ಆಯ್ಕೆ ಮಾಡಬೇಕು: ನೀವು ತಂಡಗಳಾದ್ಯಂತ ಪ್ರಮಾಣೀಕರಿಸುತ್ತಿದ್ದೀರಿ, ಆಡಿಟ್ ಟ್ರೇಲ್ಗಳು, ನೀತಿ ಜಾರಿ ಮತ್ತು ಪುನರಾವರ್ತಿತ ಬಿಡುಗಡೆಗಳು ಬೇಕಾಗುತ್ತವೆ.
ಸರಿಯಾದ ಪರ್ಯಾಯವನ್ನು ಹೇಗೆ ಆಯ್ಕೆ ಮಾಡುವುದು
ಶಬ್ದವನ್ನು ಕತ್ತರಿಸಲು ಈ ಚೆಕ್ಲಿಸ್ಟ್ ಬಳಸಿ:
- ಪೂರೈಕೆದಾರರು ಮತ್ತು ಮಾದರಿಗಳು: ಇದು OpenAI, Anthropic, Google, Azure OpenAI, Cohere, ಓಪನ್-ಸೋರ್ಸ್ ಮಾದರಿಗಳು ಮತ್ತು ನಿಮ್ಮ ಪ್ರದೇಶದ ಅವಶ್ಯಕತೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆಯೇ?
- ದರ ಮಿತಿಗಳು & ಕೋಟಾಗಳು: ಪ್ರತಿ-ಮಾದರಿ ಮತ್ತು ಪ್ರತಿ-ಕೀ ಥ್ರೊಟ್ಲಿಂಗ್, ಬರ್ಸ್ಟ್ ಕಂಟ್ರೋಲ್ ಮತ್ತು ಬ್ಯಾಕ್ಆಫ್ ತಂತ್ರಗಳು.
- ವಿಶ್ವಾಸಾರ್ಹತೆ: ಜಿಟ್ಟರ್, ಸರ್ಕ್ಯೂಟ್ ಬ್ರೇಕರ್ಗಳು, ಆರೋಗ್ಯ ತಪಾಸಣೆ, ಪೂರೈಕೆದಾರರ ಫೇಲ್ಓವರ್ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಡಿಗ್ರೇಡೇಶನ್ನೊಂದಿಗೆ ರಿಟ್ರೈಗಳು.
- ಕ್ಯಾಶಿಂಗ್: ಲೇಟೆನ್ಸಿ ಮತ್ತು ವೆಚ್ಚವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಸೆಮ್ಯಾಂಟಿಕ್ ಅಥವಾ ಪ್ರಾಂಪ್ಟ್-ನಾರ್ಮಲೈಸ್ಡ್ ಕ್ಯಾಶಿಂಗ್. ಕ್ಯಾಶ್ ಅಮಾನ್ಯೀಕರಣ ಮತ್ತು TTL ನಿಯಂತ್ರಣಗಳು.
- ವೀಕ್ಷಣೆ: ಟ್ರೇಸ್ಗಳು, ಪ್ರಾಂಪ್ಟ್ ವರ್ಷನ್ಗಳು, ಟೋಕನ್ ಬಳಕೆ, ಲೇಟೆನ್ಸಿ ಪರ್ಸೆಂಟೈಲ್ಗಳು, ತಂಡ ಮತ್ತು ವೈಶಿಷ್ಟ್ಯದ ಮೂಲಕ ವೆಚ್ಚದ ವಿಭಜನೆಗಳು.
- ಆಡಳಿತ & ಸುರಕ್ಷತೆ: ರಿಡಾಕ್ಷನ್, PII ನಿರ್ವಹಣೆ, ವಿಷಯ ಫಿಲ್ಟರ್ಗಳು, ಜೈಲ್ಬ್ರೇಕ್ ರಕ್ಷಣೆ ಮತ್ತು ನೀತಿ ಜಾರಿ.
- ಇವಾಲ್ಸ್ & ಪ್ರಯೋಗ: ಪ್ರಾಂಪ್ಟ್/ವರ್ಷನ್ ಪ್ರಯೋಗಗಳು, ರಿಗ್ರೆಶನ್ ಪರೀಕ್ಷೆಗಳು ಮತ್ತು ಆಫ್ಲೈನ್/ಆನ್ಲೈನ್ ಇವಾಲ್ಸ್.
- ಡೇಟಾ ರೆಸಿಡೆನ್ಸಿ & ಅನುಸರಣೆ: SOC 2, HIPAA, GDPR; ಅಗತ್ಯವಿದ್ದಾಗ ಸ್ವಯಂ-ಹೋಸ್ಟ್ ಮಾಡಿದ ಆಯ್ಕೆಗಳು.
- ಬೆಲೆ & ಊಹಿಸಬಹುದಾದ ಸಾಮರ್ಥ್ಯ: ಪ್ರತಿ-ವಿನಂತಿ ಅಥವಾ ಪ್ರತಿ-ಸೀಟ್ ಬೆಲೆ ನಿಗದಿಪಡಿಸುವಲ್ಲಿ ಪಾರದರ್ಶಕತೆ; ಅನಿಯಂತ್ರಿತ ವೆಚ್ಚವನ್ನು ತಪ್ಪಿಸಲು ಮಿತಿಗಳು.
- ಡೆವಲಪರ್ ಅನುಭವ: SDK ಗಳು, ಕನಿಷ್ಠ ಮಾರಾಟಗಾರ ಲಾಕ್-ಇನ್, ಸುಲಭ ವಲಸೆ ಮಾರ್ಗಗಳು.
ಉದಾಹರಣೆ ಆರ್ಕಿಟೆಕ್ಚರ್ಗಳು
ಫ್ಲೆಕ್ಸಿಬಿಲಿಟಿಯನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ LiteLLM ಅನ್ನು ಬದಲಿಸಲು ಅಥವಾ ಹೆಚ್ಚಿಸಲು ಮೂರು ಸಾಮಾನ್ಯ ಮಾದರಿಗಳು ಇಲ್ಲಿವೆ.
- ಹೋಸ್ಟ್ ಮಾಡಿದ ಗೇಟ್ವೇ + ವಿಶ್ಲೇಷಣೆ ಲೇಯರ್
- ಬಹು-ಪೂರೈಕೆದಾರ ರೂಟಿಂಗ್, ದರ ಮಿತಿ ಮತ್ತು ಕ್ಯಾಶಿಂಗ್ಗಾಗಿ OpenRouter ಅಥವಾ Eden AI ಅನ್ನು ಬಳಸಿ.
- ಟ್ರೇಸಿಂಗ್, ಡ್ಯಾಶ್ಬೋರ್ಡ್ಗಳು ಮತ್ತು ವೆಚ್ಚ ವಿಶ್ಲೇಷಣೆಗಾಗಿ LangFuse ಅಥವಾ Helicone ಅನ್ನು ಸೇರಿಸಿ.
- ಫಲಿತಾಂಶ: ಹೊಂದಿಸಲು ತ್ವರಿತ, ಬಲವಾದ ಗೋಚರತೆ, ಕನಿಷ್ಠ ಕೋಡ್ ಬದಲಾವಣೆಗಳು.
- OSS ನಲ್ಲಿ ಸ್ವಯಂ-ಹೋಸ್ಟ್ ಮಾಡಿದ ಗೇಟ್ವೇ
- ಏಕ ರಿವರ್ಸ್ ಪ್ರಾಕ್ಸಿಯ ಹಿಂದೆ OSS ಮತ್ತು ಪೂರೈಕೆದಾರ-ಬೆಂಬಲಿತ ಎಂಡ್ಪಾಯಿಂಟ್ಗಳನ್ನು ಹೋಸ್ಟ್ ಮಾಡಲು BentoML ಅಥವಾ Ray Serve ಅನ್ನು ಬಳಸಿ.
- ವೀಕ್ಷಣೆಗಾಗಿ LangFuse ಅನ್ನು ಮತ್ತು ಆಡಳಿತಕ್ಕಾಗಿ ಆಂತರಿಕ ನೀತಿ ಎಂಜಿನ್ ಅನ್ನು (ಉದಾ., OPA) ಸೇರಿಸಿ.
- ಫಲಿತಾಂಶ: ಗರಿಷ್ಠ ನಿಯಂತ್ರಣ ಮತ್ತು ಅನುಸರಣೆ; ಹೆಚ್ಚಿನ ಇನ್ಫ್ರಾ ಕೆಲಸ.
- ದೇವ್ ವೇಗಕ್ಕಾಗಿ LiteLLM (ಅಥವಾ ಅಂತಹುದೇ ತೆಳುವಾದ ಕ್ಲೈಂಟ್) ಅನ್ನು ಇರಿಸಿ.
- ಪ್ರಯೋಗಗಳು, ಇವಾಲ್ಸ್ ಮತ್ತು ನೀತಿ ರೂಟಿಂಗ್ಗಾಗಿ Vellum ಅನ್ನು ಬಳಸಿ; ವಿಶ್ಲೇಷಣೆಗಾಗಿ Helicone/LangFuse ಅನ್ನು ಬಳಸಿ.
- ಫಲಿತಾಂಶ: ಗೇಟ್ವೇಗೆ ಬದ್ಧವಾಗುವ ಮೊದಲು ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಪೂರೈಕೆದಾರರನ್ನು ಆಪ್ಟಿಮೈಜ್ ಮಾಡಿ.
ವಲಸೆ ಸಲಹೆಗಳು: LiteLLM ನಿಂದ ಪರ್ಯಾಯಕ್ಕೆ
- ಟ್ರಾಫಿಕ್ ಅನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ ಮೂಲಕ ಪ್ರಾರಂಭಿಸಿ. ಹೊಸ ಗೇಟ್ವೇ/ಸೇವೆಗೆ ಸಣ್ಣ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣವನ್ನು ಕಳುಹಿಸಿ ಮತ್ತು ಲೇಟೆನ್ಸಿ, ಟೋಕನ್ ವೆಚ್ಚಗಳು ಮತ್ತು ದೋಷ ದರಗಳನ್ನು ಹೋಲಿಕೆ ಮಾಡಿ.
- ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸಿ. ನಿಮ್ಮ ಕೆಳಗಿನ ಕೋಡ್ ಒಂದೇ ಫೀಲ್ಡ್ಗಳು ಮತ್ತು ದೋಷ ಸಮಾನ್ಯಗಳನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
- ರೂಟಿಂಗ್ ನಿಯಮಗಳನ್ನು ಬಾಹ್ಯಗೊಳಿಸಿ. ಅಪ್ಲಿಕೇಶನ್ ಕೋಡ್ನಿಂದ ಮಾದರಿ ಆಯ್ಕೆ ಮತ್ತು ನೀತಿಗಳನ್ನು ಗೇಟ್ವೇ ಅಥವಾ ಕಾನ್ಫಿಗ್ಗೆ ಸರಿಸಿ.
- ಬೇಗನೆ ಉಪಕರಣವನ್ನು ಸೇರಿಸಿ. ಮೊದಲ ದಿನದಿಂದ ಟ್ರೇಸಿಂಗ್ ಮತ್ತು ವೆಚ್ಚ ಟ್ರ್ಯಾಕಿಂಗ್ ಅನ್ನು ಸೇರಿಸಿ—ಹಿಮ್ಮುಖ ಗೋಚರತೆ ನೋವಿನಿಂದ ಕೂಡಿದೆ.
- ಫಾಲ್ಬ್ಯಾಕ್ ಲಾಜಿಕ್ ಅನ್ನು ಸೇರಿಸಿ. ಗೇಟ್ವೇ ಇದ್ದರೂ, ನಿರ್ಣಾಯಕ ಮಾರ್ಗಗಳಿಗಾಗಿ ಕ್ಲೈಂಟ್-ಸೈಡ್ ಫಾಲ್ಬ್ಯಾಕ್ಗಳನ್ನು ಇರಿಸಿ.
ಸಮುದಾಯ ಒಳನೋಟ ಎಲ್ಲಿ ಸಹಾಯ ಮಾಡುತ್ತದೆ
ಡೆವಲಪರ್ ಫೋರಮ್ಗಳು ಮತ್ತು ಕ್ಯುರೇಟೆಡ್ ಪಟ್ಟಿಗಳು ಕಡಿಮೆ-ತಿಳಿದಿರುವ ಆದರೆ ಭರವಸೆಯ ಪರಿಕರಗಳನ್ನು ಮೇಲ್ಮೈಗೆ ತರಬಹುದು. ಉದಾಹರಣೆಗೆ, ಪರ್ಯಾಯಗಳನ್ನು (ಅಥವಾ ಇತರ ಭಾಷೆಗಳಿಗೆ ಪೋರ್ಟ್ಗಳನ್ನು) ಪರಿಗಣಿಸುವ ಡೆವಲಪರ್ಗಳು ಸಮುದಾಯ ಥ್ರೆಡ್ಗಳಲ್ಲಿ ಇದೇ ರೀತಿಯ ಲೈಬ್ರರಿಗಳು ಮತ್ತು ವಿಧಾನಗಳನ್ನು ಚರ್ಚಿಸುತ್ತಾರೆ. ಮತ್ತು ಸಮಗ್ರ LLMOps ಪಟ್ಟಿಗಳು ಒಂದೇ ಸ್ಥಳದಲ್ಲಿ ಗೇಟ್ವೇಗಳು, ವೀಕ್ಷಣೆ ಪರಿಕರಗಳು ಮತ್ತು ಸರ್ವಿಂಗ್ ಫ್ರೇಮ್ವರ್ಕ್ಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತವೆ.
ಶಿಫಾರಸು ಮಾಡಲಾದ ಶಾರ್ಟ್ಲಿಸ್ಟ್ (ಗುರಿಯ ಪ್ರಕಾರ)
- ವೇಗದ ಡ್ರಾಪ್-ಇನ್: OpenRouter ಅಥವಾ Eden AI
- ಉತ್ತಮ ವಿಶ್ಲೇಷಣೆ ಆಡ್-ಆನ್: LangFuse ಅಥವಾ Helicone
- ಬಿಗಿಯಾದ ಆಡಳಿತ/ನೀತಿ ನಿಯಂತ್ರಣ: Vellum ಅಥವಾ Laminar
- ಸ್ವಯಂ-ಹೋಸ್ಟ್, ಹೆಚ್ಚಿನ ನಿಯಂತ್ರಣ: BentoML ಅಥವಾ Ray Serve
- ಸ್ಥಳೀಯ/ಎಡ್ಜ್ ಪ್ರಯೋಗಗಳು: Ollama
ಮೂಲಕ, ನಿಮ್ಮ ತಂಡವು ಪ್ರಾಂಪ್ಟ್ಗಳಲ್ಲಿ ಹೆಚ್ಚು ಸಹಕರಿಸಿದರೆ ಮತ್ತು Chrome/Edge ನಲ್ಲಿ ದೈನಂದಿನ ಕೋಪೈಲಟ್ ಅಗತ್ಯವಿದ್ದರೆ, Sider.AI ಒಂದು ಸ್ಥಳದಲ್ಲಿ ಸಂದರ್ಭವನ್ನು ಇಟ್ಟುಕೊಂಡು ಪರಿಕರಗಳಾದ್ಯಂತ ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಬರೆಯಲು, ಪರೀಕ್ಷಿಸಲು ಮತ್ತು ಪರಿಷ್ಕರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ರೂಟರ್ ಅಲ್ಲ, ಆದರೆ ಇದು ಪ್ರಾಂಪ್ಟ್ ಪುನರಾವರ್ತನೆ ಮತ್ತು ತ್ವರಿತ ವಿಷಯ ವರ್ಕ್ಫ್ಲೋಗಳಿಗೆ ಅದ್ಭುತವಾಗಿದೆ ಮತ್ತು ನೀವು ಅದನ್ನು ಇಲ್ಲಿ ಪ್ರಯತ್ನಿಸಬಹುದು: ಪ್ರಮುಖ ಟೇಕ್ಅವೇಗಳು
- ಮಾದರಿ ಕರೆಗಳನ್ನು ಏಕೀಕರಿಸಲು LiteLLM ಉತ್ತಮವಾಗಿದೆ, ಆದರೆ ಹೆಚ್ಚಿನ ತಂಡಗಳಿಗೆ ಅಂತಿಮವಾಗಿ ಬಲವಾದ ರೂಟಿಂಗ್, ವಿಶ್ಲೇಷಣೆ, ಆಡಳಿತ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹತೆ ಬೇಕಾಗುತ್ತದೆ.
- ನೀವು ಹೋಸ್ಟ್ ಮಾಡಿದ ಗೇಟ್ವೇ, OSS ನಿಯಂತ್ರಣ ಪ್ಲೇನ್ ಅಥವಾ ವಿಶ್ಲೇಷಣೆ/ಇವಾಲ್ಸ್ ಲೇಯರ್ ಅನ್ನು ಬಯಸುತ್ತೀರಾ ಎಂದು ನಿರ್ಧರಿಸಿ—ಪ್ರತಿಯೊಂದೂ ವಿಭಿನ್ನ ನೋವನ್ನು ಪರಿಹರಿಸುತ್ತದೆ.
- ಕಿರಿದಾದ ಗುರಿಯೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ (ಉದಾ., ದರ ಮಿತಿಗಳು + ವೆಚ್ಚ ಟ್ರ್ಯಾಕಿಂಗ್) ಮತ್ತು ನಿಮ್ಮ ಬಳಕೆ ಪ್ರಬುದ್ಧವಾದಂತೆ ವಿಸ್ತರಿಸಿ.
- ಟ್ರಾಫಿಕ್ ಅನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ ಮೂಲಕ, ಸಂಪೂರ್ಣವಾಗಿ ಉಪಕರಣವನ್ನು ಸೇರಿಸುವ ಮೂಲಕ ಮತ್ತು ರೂಟಿಂಗ್ ನಿಯಮಗಳನ್ನು ಬಾಹ್ಯಗೊಳಿಸುವ ಮೂಲಕ ವಲಸೆಯನ್ನು ಕಡಿಮೆ-ಅಪಾಯಕಾರಿಯಾಗಿ ಇರಿಸಿ.
FAQ
Q1: ಬಹು-ಪೂರೈಕೆದಾರ ರೂಟಿಂಗ್ಗಾಗಿ ಉತ್ತಮ LiteLLM ಪರ್ಯಾಯ ಯಾವುದು?
ನೀವು ಬಳಕೆಯ ನಿಯಂತ್ರಣಗಳೊಂದಿಗೆ ಪೂರೈಕೆದಾರರಾದ್ಯಂತ ರೂಟ್ ಮಾಡಲು ಹೋಸ್ಟ್ ಮಾಡಿದ ಗೇಟ್ವೇ ಅನ್ನು ಬಯಸಿದರೆ OpenRouter ಮತ್ತು Eden AI ಬಲವಾದ ಆಯ್ಕೆಗಳಾಗಿವೆ. ಅವು ಸರಳ ಸೆಟಪ್ ಅನ್ನು ನೀಡುತ್ತವೆ ಮತ್ತು ಏಕ API ಮೇಲ್ಮೈಯನ್ನು ಇಟ್ಟುಕೊಂಡು ಬಿಲ್ಲಿಂಗ್ ಅನ್ನು ಕ್ರೋಢೀಕರಿಸುತ್ತವೆ.
Q2: ನನ್ನ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ LiteLLM ಸೆಟಪ್ಗೆ ನಾನು ವಿಶ್ಲೇಷಣೆಯನ್ನು ಹೇಗೆ ಸೇರಿಸುವುದು?
LangFuse ಅಥವಾ Helicone ನಂತಹ ವೀಕ್ಷಣೆ ಲೇಯರ್ ಅನ್ನು ಸೇರಿಸಿ. ಅವು ಟ್ರೇಸ್ಗಳು, ಟೋಕನ್ ಬಳಕೆ, ಲೇಟೆನ್ಸಿ ಮತ್ತು ವೆಚ್ಚದ ಡೇಟಾವನ್ನು ಸೆರೆಹಿಡಿಯುತ್ತವೆ ಆದ್ದರಿಂದ ನಿಮ್ಮ ಕ್ಲೈಂಟ್ ಅನ್ನು ಪುನಃ ಬರೆಯದೆ ನೀವು ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಮಾದರಿಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಬಹುದು.
Q3: ಸ್ವಯಂ-ಹೋಸ್ಟಿಂಗ್ ಮತ್ತು ಅನುಸರಣೆಗಾಗಿ ಯಾವ LiteLLM ಪರ್ಯಾಯ ಉತ್ತಮವಾಗಿದೆ?
ಕಸ್ಟಮೈಸ್ ಮಾಡಬಹುದಾದ ರೂಟಿಂಗ್ನೊಂದಿಗೆ ಸ್ವಯಂ-ಹೋಸ್ಟ್ ಮಾಡಿದ, ಉತ್ಪಾದನಾ-ದರ್ಜೆಯ ಸರ್ವಿಂಗ್ಗಾಗಿ BentoML ಅಥವಾ Ray Serve ಬಲವಾದ ಆಯ್ಕೆಗಳಾಗಿವೆ. ವೀಕ್ಷಣೆಗಾಗಿ ಅವುಗಳನ್ನು LangFuse ನೊಂದಿಗೆ ಮತ್ತು ಆಡಳಿತಕ್ಕಾಗಿ ನಿಮ್ಮ ಸ್ವಂತ ನೀತಿ ಎಂಜಿನ್ನೊಂದಿಗೆ ಜೋಡಿಸಿ.
Q4: ನಾನು LiteLLM ಅನ್ನು ಇಟ್ಟುಕೊಂಡು ವಿಶ್ವಾಸಾರ್ಹತೆ ಮತ್ತು ಆಡಳಿತವನ್ನು ಸುಧಾರಿಸಬಹುದೇ?
ಹೌದು. ದೇವ್ ವೇಗಕ್ಕಾಗಿ LiteLLM ಅನ್ನು ಇರಿಸಿ ಮತ್ತು ನೀತಿ ರೂಟಿಂಗ್ ಮತ್ತು ಇವಾಲ್ಸ್ಗಾಗಿ Vellum ಅನ್ನು ಮತ್ತು ವಿಶ್ಲೇಷಣೆಗಾಗಿ Helicone ಅಥವಾ LangFuse ಅನ್ನು ಸೇರಿಸಿ. ಕಾಲಾನಂತರದಲ್ಲಿ, ಅಗತ್ಯವಿದ್ದರೆ ನೀವು ರೂಟಿಂಗ್ ಅನ್ನು ಗೇಟ್ವೇಗೆ ವಲಸೆ ಮಾಡಬಹುದು.
Q5: ಕನಿಷ್ಠ ಅಪಾಯದೊಂದಿಗೆ ನಾನು LiteLLM ನಿಂದ ಹೇಗೆ ವಲಸೆ ಹೋಗುವುದು?
ಹೊಸ ಗೇಟ್ವೇಗೆ ಟ್ರಾಫಿಕ್ನ ಸಣ್ಣ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣವನ್ನು ಪ್ರತಿಬಿಂಬಿಸಿ, ಮೆಟ್ರಿಕ್ಗಳನ್ನು ಹೋಲಿಕೆ ಮಾಡಿ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸಿ. ರೂಟಿಂಗ್ ನೀತಿಗಳನ್ನು ಕಾನ್ಫಿಗ್ಗೆ ಬಾಹ್ಯಗೊಳಿಸಿ, ವಿನಂತಿಗಳನ್ನು ಬೇಗನೆ ಉಪಕರಣಕ್ಕೆ ಸೇರಿಸಿ ಮತ್ತು ಕ್ಲೈಂಟ್-ಸೈಡ್ ಫಾಲ್ಬ್ಯಾಕ್ಗಳನ್ನು ಇರಿಸಿ.