അപ്ഡേറ്റ് ചെയ്തത് 25 സെപ്റ്റ. 2025
7 മിനിറ്റ്
/v1/chat/completions എൻഡ്പോയിൻ്റ് ഉണ്ടാക്കുക.pip install litellmexport OPENAI_API_KEY=sk-...# ഓപ്ഷണൽ: കൂടുതൽ പ്രൊവൈഡർമാർexport ANTHROPIC_API_KEY=...export GOOGLE_API_KEY=...from litellm import completionresp = completion(model="gpt-4o", # അല്ലെങ്കിൽ "azure/gpt-4o", "anthropic/claude-3-5-sonnet", "gemini/gemini-1.5-pro"messages=.- മുകളിലുള്ള ക്വിക്ക്സ്റ്റാർട്ട് കോഡ് പ്രവർത്തിപ്പിക്കുക.- ലക്ഷ്യം: LiteLLM വഴി നിങ്ങളുടെ ആദ്യത്തെ OpenAI-ക്ക് അനുയോജ്യമായ അഭ്യർത്ഥന നടത്തുക.- പ്രായോഗിക ബിൽഡർ- DataCamp ട്യൂട്ടോറിയൽ വായിച്ച് സ്ട്രീമിംഗും റീട്രൈകളും ഉപയോഗിച്ച് ഉദാഹരണങ്ങൾ വികസിപ്പിക്കുക.- രണ്ട് പ്രൊവൈഡർമാരെ ചേർത്ത് ഫാൾബാക്കുകൾ ടെസ്റ്റ് ചെയ്യുക.- ടീം/പ്രൊഡക്ഷൻ ഉടമ- ഔദ്യോഗിക ഗെറ്റിംഗ് സ്റ്റാർട്ടഡ് ഗൈഡ് പഠിക്കുക.- പ്രോക്സി സ്ഥാപിക്കുക, ഒബ്സർവബിലിറ്റിയും കോസ്റ്റ് ട്രാക്കിംഗും ചേർക്കുക.- റേറ്റ് ലിമിറ്റുകളും PII റിഡക്ഷൻ പോളിസികളും നടപ്പിലാക്കുക.—## ഡീപ് ഡൈവ്: നിങ്ങൾ ആഴ്ചതോറും ഉപയോഗിക്കുന്ന പാറ്റേണുകൾ### ഒരു ഇൻ്റർഫേസ് കരാർ എന്ന നിലയിൽ OpenAI കോംപാറ്റിബിലിറ്റി- OpenAI-യുടെ API രൂപം നിങ്ങളുടെ ആപ്പ് കരാറായി പരിഗണിക്കുക. എല്ലാ അഭ്യർത്ഥനകളും നിങ്ങളുടെ LiteLLM പ്രോക്സിയുടെ `/v1/*` എൻഡ്പോയിൻ്റുകളിലേക്ക് പോകുന്നു.- കോഡ് ഉപയോഗിക്കാതെ, കോൺഫിഗറേഷൻ വഴി മോഡലുകൾ മാറ്റുക (ഉദാഹരണത്തിന്, `gpt-4o` → `claude-3-5`).### യൂസ് കേസ് അനുസരിച്ച് മോഡൽ റൂട്ടിംഗ്- ലേറ്റൻസി സെൻസിറ്റീവ് പാത്ത്: വേഗതയേറിയതും വിലകുറഞ്ഞതുമായ മോഡലുകളിലേക്ക് റൂട്ട് ചെയ്യുക.- റീസണിംഗ് പാത്ത്: റിട്രീവൽ-ഓഗ്മെൻ്റഡ് ജനറേഷൻ (RAG) അല്ലെങ്കിൽ ടൂൾ ഉപയോഗത്തിനായി ഉയർന്ന നിലവാരമുള്ള മോഡലുകളിലേക്ക് റൂട്ട് ചെയ്യുക.- പ്രൈവസി പാത്ത്: PII സെഗ്മെൻ്റുകൾക്കായി ലോക്കൽ/Ollama-യിലേക്ക് റൂട്ട് ചെയ്യുക.### കോസ്റ്റ് ഗാർഡ് റെയിലുകൾ- `user_id`/`team` ഉപയോഗിച്ച് അഭ്യർത്ഥനകൾ ടാഗ് ചെയ്യുക.- ഓരോ ടീമിനും/മോഡലിനും ബഡ്ജറ്റുകൾ സജ്ജമാക്കുക.- ടോക്കൺ ഉപയോഗം ഒരു സെൻട്രൽ സ്റ്റോറിലേക്ക് ലോഗ് ചെയ്യുക, വ്യതിയാനങ്ങൾ ഉണ്ടായാൽ അലേർട്ട് ചെയ്യുക.### റെസിലിയൻസ്- ജിറ്റർ ഉപയോഗിച്ച് റീട്രൈകൾ പ്രവർത്തനക്ഷമമാക്കുക.- ഓരോ പ്രൊവൈഡർക്കും ടൈംഔട്ടുകളും ആവർത്തിച്ചുള്ള പരാജയങ്ങളിൽ സർക്യൂട്ട് ബ്രേക്കറുകളും കോൺഫിഗർ ചെയ്യുക.- പ്രൊവൈഡർ മുൻഗണനകളും എക്സ്പ്ലിസിറ്റ് ഫാൾബാക്കുകളും നിർവ്വചിക്കുക.### ഒബ്സർവബിലിറ്റി- അഭ്യർത്ഥന/പ്രതികരണ മെറ്റാഡാറ്റ, ലേറ്റൻസി ഹിസ്റ്റോഗ്രാമുകൾ, മോഡൽ/വേർഷൻ എന്നിവ ക്യാപ്ചർ ചെയ്യുക.- ലോഗുകളിൽ രഹസ്യങ്ങളും/PII-യും എഡിറ്റ് ചെയ്യുക.- വേഗത കുറഞ്ഞ കോളുകൾ വേഗത്തിൽ കണ്ടെത്താൻ സേവനങ്ങളിലുടനീളം ട്രെയ്സുകൾ പരസ്പരം ബന്ധിപ്പിക്കുക.—## LiteLLM പ്രോക്സി കോൺഫിഗറേഷന്റെ ഉദാഹരണം (പ്രൊഡക്ഷൻ-റെഡി സ്റ്റാർട്ടർ)```yaml# config.yamlmodel_list:- model_name: gpt-4olitellm_params:model: openai/gpt-4oapi_key: ${OPENAI_API_KEY}- model_name: claude-3-5-sonnetlitellm_params:model: anthropic/claude-3-5-sonnetapi_key: ${ANTHROPIC_API_KEY}- model_name: gemini-1.5-prolitellm_params:model: google/gemini-1.5-proapi_key: ${GOOGLE_API_KEY}defaults:timeout: 30smax_tokens: 1024routing:- name: low-latencymodels: .- പ്രായോഗികവും ഉദാഹരണങ്ങൾ നൽകുന്നതുമായ ലേഖനം.- ആരംഭിക്കുന്നതിനും പ്രോക്സി മികച്ച രീതിയിൽ ഉപയോഗിക്കുന്നതിനുമുള്ള ഔദ്യോഗിക LiteLLM ഡോക്യുമെൻ്റുകൾ.—## ആക്ഷൻ പ്ലാൻ: നിങ്ങളുടെ അടുത്ത 7 ദിവസങ്ങൾദിവസം 1–2: ക്രാഷ് കോഴ്സും ക്വിക്ക്സ്റ്റാർട്ടും ചെയ്യുക; നിങ്ങളുടെ ആദ്യത്തെ പ്രോക്സി ചെയ്ത അഭ്യർത്ഥന നടത്തുക.ദിവസം 3–4: രണ്ടാമത്തെ പ്രൊവൈഡറും സ്ട്രീമിംഗും ചേർക്കുക; ടൈംഔട്ടുകൾ, റീട്രൈകൾ എന്നിവ സജ്ജമാക്കുക.ദിവസം 5: കോൺഫിഗറേഷനോടുകൂടി പ്രോക്സി സ്ഥാപിക്കുക; യൂസ് കേസ് അനുസരിച്ച് റൂട്ട് ചെയ്യുക (ലേറ്റൻസി vs റീസണിംഗ്).ദിവസം 6: ലോഗിംഗ്, കോസ്റ്റ് ട്രാക്കിംഗ്, റിഡക്ഷൻ എന്നിവ ചേർക്കുക.ദിവസം 7: ലോഡ്-ടെസ്റ്റ്; പ്രൊവൈഡർ പരാജയങ്ങൾ അനുകരിക്കുക; ഫാൾബാക്കുകൾ പരിശോധിക്കുക.—## പ്രധാന കണ്ടെത്തലുകൾ- വെണ്ടർ ലോക്ക്-ഇൻ ഇല്ലാതെ മൾട്ടി-പ്രൊവൈഡർ LLM ആപ്പുകളിലേക്കുള്ള ഏറ്റവും വേഗമേറിയ പാതയാണ് LiteLLM.- OpenAI-ക്ക് അനുയോജ്യമായ ഇൻ്റർഫേസിൽ നിന്ന് ആരംഭിച്ച് ഭരണത്തിനായി പ്രോക്സിയിലേക്ക് ഉയർത്തുക.- റൂട്ടിംഗ്, റെസിലിയൻസ്, ഒബ്സർവബിലിറ്റി എന്നിവയിൽ നേരത്തെ നിക്ഷേപം നടത്തുക - നിങ്ങൾക്ക് ഇത് ആറാമത്തെ മാസത്തിലല്ല, രണ്ടാമത്തെ ആഴ്ചയിൽ ആവശ്യമുണ്ട്.- മുകളിലെ ട്യൂട്ടോറിയലുകൾ നിങ്ങൾ ദിവസവും ഉപയോഗിക്കുന്നതിൻ്റെ 80% ഉൾക്കൊള്ളുന്നു; ബാക്കിയുള്ളവ നിങ്ങളുടെ ഉൽപ്പന്നത്തിൻ്റെ രഹസ്യ ചേരുവയാണ്.### പതിവായി ചോദിക്കുന്ന ചോദ്യങ്ങൾQ1: തുടക്കക്കാർക്കുള്ള മികച്ച LiteLLM ട്യൂട്ടോറിയൽ ഏതാണ്?വേഗത്തിലുള്ള വിഷ്വൽ walkthrough-നായി YouTube-ലെ LiteLLM ക്രാഷ് കോഴ്സിൽ നിന്ന് ആരംഭിക്കുക, തുടർന്ന് പ്രോക്സിക്കായുള്ള ഔദ്യോഗിക ഗെറ്റിംഗ് സ്റ്റാർട്ടഡ് ഗൈഡ് വായിക്കുക. DataCamp ട്യൂട്ടോറിയൽ നിങ്ങൾക്ക് പകർത്താൻ കഴിയുന്ന പ്രായോഗിക ഉദാഹരണങ്ങൾ നൽകുന്നു.Q2: OpenAI-ക്ക് അനുയോജ്യമായ പ്രോക്സിയായി ഞാൻ LiteLLM എങ്ങനെ ഉപയോഗിക്കും?LiteLLM പ്രോക്സി പ്രവർത്തിപ്പിച്ച് നിങ്ങളുടെ SDK-യുടെ അടിസ്ഥാന URL പ്രോക്സിയുടെ `/v1` എൻഡ്പോയിന്റുകളിലേക്ക് പോയിന്റ് ചെയ്യുക. നിങ്ങളുടെ ആപ്ലിക്കേഷൻ കോഡ് പോർട്ടബിൾ ആയി നിലനിർത്താൻ പ്രൊവൈഡർ വിശദാംശങ്ങൾ LiteLLM കോൺഫിഗിൽ സൂക്ഷിക്കുക.Q3: OpenAI, Anthropic, Gemini എന്നിവയ്ക്കിടയിൽ LiteLLM-ന് സ്വയമേവ റൂട്ട് ചെയ്യാൻ കഴിയുമോ?ഉവ്വ്. ലേറ്റൻസി, ചെലവ് അല്ലെങ്കിൽ ഗുണനിലവാരം അനുസരിച്ച് പ്രൊവൈഡർമാർക്കിടയിൽ മാറുന്നതിന് LiteLLM കോൺഫിഗിൽ മോഡലുകളും റൂട്ടിംഗ് തന്ത്രങ്ങളും നിർവ്വചിക്കുക. വിശ്വാസ്യതയ്ക്കായി നിങ്ങൾക്ക് ഫാൾബാക്കുകളും സജ്ജമാക്കാൻ കഴിയും.Q4: LiteLLM ഉപയോഗിച്ച് സ്ട്രീമിംഗും ടൂൾ/ഫംഗ്ഷൻ കോളിംഗും ഞാൻ എങ്ങനെ പ്രവർത്തനക്ഷമമാക്കും?LiteLLM വഴി OpenAI-ക്ക് അനുയോജ്യമായ API ഉപയോഗിച്ച് `stream=True` പ്രവർത്തനക്ഷമമാക്കുക (അല്ലെങ്കിൽ നിങ്ങളുടെ SDK-യിൽ SSE). ടൂൾ കോളിംഗിനായി, OpenAI ഫംഗ്ഷൻ-കോളിംഗ് ഫോർമാറ്റ് പിന്തുടരുക - LiteLLM ഇത് ടാർഗെറ്റ് പ്രൊവൈഡറിലേക്ക് ഫോർവേഡ് ചെയ്യുന്നു.Q5: LiteLLM ഉപയോഗിച്ച് ചെലവുകൾ നിയന്ത്രിക്കാനുള്ള ഏറ്റവും വേഗമേറിയ മാർഗ്ഗം ഏതാണ്?പ്രോക്സിയിലൂടെ അഭ്യർത്ഥനകൾ കേന്ദ്രീകരിക്കുക, ഉപയോഗ ലോഗിംഗ് പ്രവർത്തനക്ഷമമാക്കുക, ഓരോ കീയ്ക്കും റേറ്റ് ലിമിറ്റുകളും ബഡ്ജറ്റുകളും നടപ്പിലാക്കുക. ചെലവ് കുറഞ്ഞ മോഡലുകളിലേക്ക് വ്യത്യസ്ത വർക്ക്ലോഡുകൾ റൂട്ട് ചെയ്യുക, ആശ്ചര്യങ്ങൾ ഒഴിവാക്കാൻ പതിപ്പുകൾ പിൻ ചെയ്യുക.
ChatPDF എങ്ങനെ നിപുണമാക്കാം: സാന്ദ്രമായ രേഖകളിൽ നിന്നുള്ള വേഗത്തിലുള്ള洞察ങ്ങൾ

വേഗതയുള്ള, കൃത്യമായ ഡോക്യുമെന്റുകൾക്കായി മികച്ച X ഓട്ടോ-ട്രാൻസ്ലേഷൻ বিকল্পം

ഇറാനിൽ Samsung AI വിവർത്തനം ലഭ്യമല്ലേ? പ്രായോഗിക പരിഹാരങ്ങൾ

പേർഷ്യൻ വിവർത്തന ഉപകരണങ്ങൾ: വേഗതയിലും കൃത്യതയിലും പ്രായോഗിക മാർഗ്ഗനിർദേശം

ആഴത്തിലുള്ള, ഉദ്ധരിക്കപ്പെട്ട ഗവേഷണത്തിനുള്ള മികച്ച Grok ബദലുകൾ

AI ഇമേജ് ജനറേറ്ററിൻ്റെ നിങ്ങൾ ശരിക്കും ഉപയോഗിക്കുന്ന 15 പ്രധാന ഫീച്ചറുകൾ