અપડેટ કરવામાં આવ્યું છે 25 સપ્ટે. 2025
7 મિનિટ
/v1/chat/completions એન્ડપોઇન્ટ બનાવવી.pip install litellmexport OPENAI_API_KEY=sk-...# વૈકલ્પિક: વધુ પ્રદાતાexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # અથવા "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- ઉપરોક્ત ઝડપી પ્રારંભ કોડ ચલાવો.- લક્ષ્ય: LiteLLM મારફતે તમારી પ્રથમ OpenAI-સંમત વિનંતી બનાવવી.- વ્યવહારુ નિર્માતા- DataCamp ટ્યુટોરિયલ વાંચો અને સ્ટ્રીમિંગ અને રિટ્રાઇઝ સાથે ઉદાહરણોને વિસ્તૃત કરો.- બે પ્રદાતા ઉમેરો અનેFallbacks તપાસો.- ટીમ/ઉત્પાદન માલિક- અધિકૃત શરૂઆત માર્ગદર્શિકા અભ્યાસ કરો.- પ્રોક્સી સેટ કરો, અવલોકનતા અને ખર્ચ ટ્રેકિંગ ઉમેરો.- દર મર્યાદા અને PII રિડેશન નીતિઓ લાગૂ કરો.—## ઊંડી સમજ: તમે સાપ્તાહિક ઉપયોગ માટે પેટર્નસ### OpenAI સંબંધિત ઈન્ટરફેસ કરાર તરીકે- OpenAI ના API ફોર્મેટને તમારા ઍપના કરાર તરીકે જોવો. બધી વિનંતીઓ LiteLLM પ્રોક્સીના `/v1/*` એન્ડપોઇન્ટ્સ પર જ રહેવી જોઈએ.- કોન્ફિગરેશન સાથે મોડેલો બદલો (જેમ `gpt-4o` → `claude-3-5`), કોડ દર્શાવ્યા સિવાય.### ઉપયોગ કેસ પ્રમાણે મોડેલ રૂટિંગ- વિલંબ પ્રભાવિત રસ્તો: ઝડપદાર, સસ્તા મોડેલો તરફ રૂટ કરવો.- વિચારશીલ માર્ગ: retrieval-augmented generation (RAG) અથવા ટૂલ ઉપયોગ માટે ઉચ્ચ ગુણવત્તાવાળા મોડેલો માટે રૂટ કરવો.- ગોપનીય માર્ગ: PII વિભાગો માટે સ્થાનિક/Ollama માટે રૂટ કરવો.### ખર્ચ માટે સુરક્ષા- વિનંતીઓને `user_id`/`team` સાથે ટેગ કરો.- ટીમ/મોડેલ માટે બજેટ સેટ કરો.- ટોકન ઉપયોગ કેન્દ્રિય સ્ટોરમાં લોગ કરો અને અસામાન્ય પર એલર્ટ કરો.### મજબૂતી- જિટર સાથે રિટ્રાઇઝ ચાલુ કરો.- પ્રદાતા દીઠ સમય મર્યાદા અને વારંવારની નિષ્ફળતાઓ માટે સર્કિટ બ્રેકર્સ સેટ કરો.- પ્રદાતા પ્રાથમિકતાઓ અને સ્પષ્ટFallbacks નિર્ધારિત કરો.### અવલોકન- વિનંતી/જવાબ મેટાડેટા, વિલંબ હિસ્ટોગ્રામ્સ, મોડેલ/સંસ્કરણ કબ્જો કરો.- લોગ્સમાં રહસ્યો/PII રિડેક્ટ કરો.- સર્વિસીસ વચ્ચે ટ્રેસ નિયત કરી ધીમી કોલ ઝડપથી શોધો.—## ઉદાહરણ LiteLLM પ્રોક્સી કોન્ફિગ (પ્રોડક્શન-માર્ગદર્શક સ્ટાર્ટર)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- એક વ્યવહારુ, ઉદાહરણ આધારિત લેખ.- શરૂઆત અને પ્રોક્સી શ્રેષ્ઠ પ્રથા માટે અધિકૃત LiteLLM દસ્તાવેજો.—## પગલાં યોજના: તમારું આગામી 7 દિવસદિન 1-2: ક્રેશ કોર્સ અને ઝડપી પ્રારંભ કરો; તમારું પહેલું પ્રોક્સી વિનંતી બનાવો.દિન 3-4: બીજો પ્રદાતા ઉમેરો અને સ્ટ્રીમિંગ; સમય મર્યાદા અને રિટ્રાઇઝ સેટ કરો.દિન 5: કોન્ફિગ સાથે પ્રોક્સી ચલાવો; ઉપયોગ કેસ (વિલંબ વિરુદ્ધ વિચારશીલતા) પ્રમાણે રૂટ કરો.દિન 6: લોગિંગ, ખર્ચ ટ્રેકિંગ અને રિડેશન ઉમેરો.દિન 7: લોડ-ટેસ્ટ કરો; પ્રદાતા નિષ્ફળતાના અનુસંધાન કરો અનેFallbacks ચકાસો.—## મુખ્ય મુદ્દા- LiteLLM વિના વિક્રેતાના બાંધી પડેલા મલ્ટી-પ્રદાતા LLM ઍપ્સ માટે સૌથી ઝડપી માર્ગ છે.- OpenAI-સંગ્રહિત ઈન્ટરફેસથી શરૂ કરો, પછી રાજ્ય પાટણ માટે પ્રોક્સી સાથે આગળ વધો.- રૂટિંગ, મજબૂતી અને અવલોકનતા માં વહેલી રોકાણ કરો — તમને આ સપ્તાહ 2 માં જરૂર પડશે, માસ 6 માં નહીં.- ઉપરના ટ્યુટોરિયલ્સ દરરોજ ઉપયોગ માટે 80% આવરી લે છે; બાકી તમારી પ્રોડક્ટોનું ગુપ્ત મિશ્રણ છે.### વારંવાર પુછાતા પ્રશ્નો (FAQ)Q1: શરુઆત માટે શ્રેષ્ઠ LiteLLM ટ્યુટોરિયલ કયો છે?YouTube પર LiteLLM ક્રેશ કોર્સથી શરૂ કરો જે ઝડપી દૃશ્ય માર્ગદર્શિકા આપે છે, પછી અધિકૃત પ્રોક્સી શરૂઆત માર્ગદર્શિકા વાંચો. DataCamp ટ્યુટોરિયલ વ્યવહારુ ઉદાહરણો પૂરા પાડે છે કે જેમને તમે નકલ કરવા માટે લઈ શકો.Q2: હું LiteLLM ને OpenAI-સંમત પ્રોક્સી તરીકે કેવી રીતે વાપરૂં?LiteLLM પ્રોક્સી ચલાવો અને તમારા SDK ના સ્વતંત્ર URL ને પ્રોક્સીના `/v1` એન્ડપોઇન્ટના તરફ સૂચવો. પ્રદાતા વિગતો LiteLLM કન્ફિગરેશનમાં રાખો જેથી તમારું ઍપ કોડ પોર્ટેબલ રહે.Q3: શું LiteLLM ઓટોમેટિક રીતે OpenAI, Anthropic, અને Gemini વચ્ચે રૂટ કરી શકે છે?હા. LiteLLM કન્ફિગારેશનમાં મોડેલો અને રૂટિંગ નીતિઓ નિર્ધારિત કરો જેથી વિલંબ, ખર્ચ અથવા ગુણવત્તા દ્વારા પ્રદાતાઓ બદલાય. વિશ્વસનીયતાની માટેFallbacks પણ સેટ કરી શકો.Q4: LiteLLM સાથે સ્ટ્રીમિંગ અને ટૂલ/ફંકશન કોલિંગ કેવી રીતે સક્રિય કરવું?LiteLLM મારફતે OpenAI-સંગત API વાપરો અને `stream=True` સેટ કરો (કે SDKમાં SSE). ટૂલ કોલિંગ માટે OpenAI ફંક્શન-કોલીંગ ફોર્મેટ અનુસરો—LiteLLM તેને ટાર્ગેટ પ્રદાતા તરફ ફોરવર્ડ કરે છે.Q5: LiteLLM સાથે ખર્ચને નિયંત્રિત કરવાનું સૌથી ઝડપી માર્ગ શું છે?પ્રોક્સી મારફતે વિનંતીઓને કેન્દ્રિત કરો, ઉપયોગ લોગિંગ સક્રિય કરો અને પ્રત્યેક કી માટે દર મર્યાદા અને બજેટ લાગુ કરો. વિવિધ લોડ માટે ખર્ચ-અનુકૂળ મોડેલો માટે રૂટ કરો અને સંસ્કરો પિન કરો જેથી કોઈ અજાણતા બિલ ન આવે.
ChatPDF માં નિપુણતા કેવી રીતે મેળવવી: ઘન દસ્તાવેજોમાંથી ઝડપથી માહિતી મેળવવી

ઝડપી અને ચોકસાઇભર્યા દસ્તાવેજો માટે શ્રેષ્ઠ X ઓટો-ટ્રાન્સલેશન વિકલ્પ

ઈરાનમાં Samsung AI અનુવાદ ઉપલબ્ધ નથી? વ્યવહારુ ઉપાય

ફારસી અનુવાદ સાધનો: ઝડપી અને સચોટ કાર્ય માટે એક વ્યવહારુ માર્ગદર્શિકા

ઘણું ઊંડાણપૂર્વક અને ઉલ્લેખિત સંશોધન માટે શ્રેષ્ઠ Grok વિકલ્પ

AI ઇમેજ જનરેટરના ટોચના 15 ફીચર્સ જેનો તમે ખરેખર ઉપયોગ કરશો