How do I prepare data to fine-tune my own AI model with Tinker API?

Use JSONL with clear instruction–response or chat-style pairs. Keep tone consistent, anonymize sensitive info, and hold out 10–20% for testing so you don’t fool yourself with inflated scores.

Is fine-tuning with Tinker API better than prompt engineering?

Use prompts for quick tone tweaks and simple behaviors; use fine-tuning when you need durable style, structure, or domain patterns. Many teams combine both—RAG for facts, fine-tune for voice.

How much data do I need to fine-tune a model with Tinker API?

Quality beats quantity. A few hundred strong examples can outperform thousands of noisy ones. Start small, evaluate, then add targeted examples where the model struggles.

How do I deploy a fine-tuned model in Tinker API?

After training, Tinker returns a model ID you can call via the standard completions or chat endpoint. Set a helpful system prompt, tune temperature, and monitor outputs in real traffic.

How do I stop my fine-tuned model from hallucinating?

Train with examples that admit uncertainty, lower temperature, and pair with retrieval for facts. Make “cite sources” or “say you don’t know” part of the instruction and the training data.

നിങ്ങളുടെ AI ഈസ്റ്റ്‌റോബോട്ടിനെ പോലെ അല്ല, പരസ്യമായി നിന്റെ ശബ്ദം പോലെയാകാൻ നിങ്ങൾ ആഗ്രഹിച്ചിട്ടുണ്ടോ?

ഈ ദൃശ്യനെന്തെന്നാൽ: ഒരു കസ്റ്റമർ ഇമെയിൽ സംക്ഷേപിക്കാൻ നിങ്ങളുടെ AI-നെ ചോദിച്ചാൽ അത് ഷിപ്പിംഗ് ഫോറിക്കാസ്റ്റ് പറയുന്നതുപോലെ പ്രതികരിക്കുന്നു. സായാമികമായി ശരി; ആത്മാർത്ഥമായി സഹായകരമല്ല. നിങ്ങൾക്ക് വേണ്ടത് നിങ്ങളുടെ ടോൺ, ജാർഗൺ, ഇഷ്ടങ്ങൾ ഉൾപ്പെടെയുള്ള AI അനുഭവം, ഗാരേജ് ലബോറട്ടറി സ്ഥാപിക്കേണ്ടതില്ലാതെ.

ഇതಕ್ಕೆ ഫൈൻ-ട്യൂണിംഗ് സഹായിക്കുന്നു. നിങ്ങൾ “Tinker API”യെക്കുറിച്ച് കേട്ടിട്ടുണ്ടെങ്കിൽ, നിങ്ങൾ ശരിയായ സ്ഥലത്ത് എത്തിയിരിക്കുന്നു. ഈ ഗൈഡ് Tinker API ഉപയോഗിച്ച് നിങ്ങളുടെ സ്വന്തം AI മോഡൽ ഫൈൻ-ട്യൂൺ ചെയ്യുന്നതിനുള്ള മാർഗ്ഗങ്ങൾ നൽകുന്നു — അതിനാൽ അടുത്ത തവണ നിങ്ങൾ “Draft a response” എന്ന് ടൈപ്പ് ചെയ്താൽ നിങ്ങളുടെ ടീമിന്റെ ശൈലിയിൽ എന്ന നിലയ്ക്ക് മറുപടി കിട്ടും, HAL 9000ന്റെ ബന്ധുവിന്റെ പോലെ അല്ല.

നാം മുഴുവനായും ചിന്തിക്കാം: ഫൈൻ-ട്യൂണിംഗ് എന്താണെന്ന്, ഡാറ്റയെ എങ്ങനെ തയ്യാറാക്കണം, Tinker API-യുമായി ഫൈൻ-ട്യൂണിംഗ് എങ്ങനെ നടത്തണം, ബഡ്ജറ്റ് കൃത്യമായി ഉപയോഗിച്ചും സഹനമുള്ളതുമായിരിക്കാൻ എങ്ങനെ സൂക്ഷിക്കണം. ട്രെയിനിങ്ങിൽ ഉണ്ടാകാവുന്ന പ്രശ്നങ്ങളും ഞാനും പങ്കുവെക്കും—ഫൈൻ-ട്യൂണിംഗ് ശക്തമാണ്, പക്ഷേ ഒരു വെട്ടുകെട്ടുകാരി അല്ല.

കീവർഡുകളെക്കുറിച്ച് മുന്നറിയിപ്പ്: “Tinker API ഉപയോഗിച്ചുള്ള ഫൈൻ-ട്യൂണിംഗ് എങ്ങനെ” എന്ന വാചകങ്ങൾ നമ്മൾ പല തവണ ഉപയോഗിക്കും, കാരണം അതുകൊണ്ടാണ് നിങ്ങൾ എത്തിയത്. കൂടാതെ 'fine-tune your own AI model', 'Tinker API tutorial', 'dataset preparation for fine-tuning', 'deploying a fine-tuned model' പോലുള്ള ലംബമായ വാക്കുകളും ഉൾപ്പെടുത്തും. താണ്ക്കു ഭയപ്പെടേണ്ട, ഞാൻ മനുഷ്യനായിരിക്കും.

ഫൈൻ-ട്യുണിംഗിന്റെ അർത്ഥവും അതല്ലാത്തതും

ആകെ AI മോഡൽ ഒരു സ്വിസ് ആർമി നൈഫ് ആണെങ്കിൽ, ഫൈൻ-ട്യൂണിംഗ് എന്ന് നിങ്ങൾ പറയുന്നത്: “നൈഫ്, നാളെ മുതൽ പെട്ടികൾ തുറക്കുന്നതിൽ വളരെ മികച്ചവനാകണം.” നിങ്ങൾ നൈഫ് കണ്ടുപിടിക്കുന്നില്ല; നിങ്ങൾക്ക് ഇഷ്ടപ്പെട്ട കാർഡ്ബോർഡ് പഠിപ്പിക്കുന്നു.

പ്രായോഗികമായി, ഫൈൻ-ട്യൂണിംഗ് എന്നത് ഒരു അടിസ്ഥാന മോഡൽ (ഇന്റർനെറ്റിൽ ഉള്ള വലിയ എഴുത്തുകളും പഠിച്ചിരിക്കുന്നത്) നിങ്ങളുടെ ഉദാഹരണങ്ങൾ കൊണ്ട് നയിക്കുക — നിങ്ങളുടെ എഴുത്ത് ശൈലി, ഡൊമെയിൻ-സ്പെസിഫിക് Q&A, സപ്പോർട്ട് സ്ക്രിപ്റ്റുകൾ — അതിനാൽ അത് നിങ്ങളുടെ ഇഷ്ടാനുസരണം പ്രതികരിക്കും. മോഡലിന് ഒരു സ്റ്റൈൽ ഗൈഡ് കൂടെ പ്രാക്ടീസ് ക്വിസുകൾ നൽകുന്നത് പോലെയാണ്.

പക്ഷേ ഫൈൻ-ട്യൂണിംഗ് ഒരു മായാജാലം അല്ല. ഇതുമായി കിട്ടാത്ത വിവരങ്ങൾ ട്രെയിൻ ചെയ്യാൻ സാധിക്കില്ല; നിങ്ങൾക്കുള്ള ഡാറ്റ അവ പഠിപ്പിക്കണം. വലിയ സ്വകാര്യ ഡോക്യുമെന്റുകൾ ഓർമ്മിക്കാൻ സാധിക്കില്ല, പ്രാതിനിധ്യമുള്ള ഭാഗങ്ങൾ മാത്രം നൽകണം. ഡാറ്റ അസംബന്ധിതവും വ്യാപകവും അല്ലെങ്കിൽ ചുരുക്കവുമെങ്കിൽ മോഡൽ അത് പെരുമാറലായി കൈവരിക്കും, ഒരു കൂട്ടം തള്ളക്കകളുടെ ഡ്രമ്മറുടെ താളം പോലെ.

ചുരുക്കം കാഴ്ച

Tinker API ഉപയോഗിച്ച് നിങ്ങളുടെ AI മോഡൽ ഫൈൻ-ട്യൂൺ ചെയ്യുന്നതിന്റെ അവലോകനം:

Tinker API-യിൽ ഒരു അടിസ്ഥാന മോഡൽ തിരഞ്ഞെടുക്കുക.

ശുദ്ധിയും സമതുലനവും ഉള്ള ഒരു dataset തയ്യാറാക്കുക, പ്രോംപ്റ്റുകളും അനുയോജ്യമായ പ്രതികരണങ്ങളും ഉള്ളത്.

നിങ്ങളുടെ dataset Tinker-ലേക്ക് അപ്‌ലോഡ് ചെയ്യുക.

સ્પષ્ટമായ ഹൈപ്പർപാരാമീറ്ററുകളോടെ ഫൈൻ-ട്യൂണിംഗ് ജോബ് സൃഷ്ടിക്കുക.

പരിശീലനം നിരീക്ഷിക്കുക, ടെസ്റ്റ് സെറ്റോടെ ഫലങ്ങൾ വിലയിരുത്തുക.

ഫൈൻ-ട്യൂൺ ചെയ്ത മോഡൽ പ്രൊഡക്ഷനിൽ വിന്യസിച്ച് ഉപയോഗിക്കുക.

അസാധാരണ കണ്ടാൽ പുനരാവർത്തനം ചെയ്യുക.

നാം ഘട്ടം ഘട്ടമായി പോകും, കോഡ്-സ്റ്റൈൽ ഉദാഹരണങ്ങളുമായി, തിരുസ്സരിക്കാൻ സഹായിക്കുന്ന ടിപ്പുകളോടെ.

ഘട്ടം 1: വാടക കാര്‍ തിരഞ്ഞെടുക്കുന്നതുപോലെ നിങ്ങളുടെ അടിസ്ഥാന മോഡൽ തിരഞ്ഞെടുക്കുക

മാന്ഹാറ്റനിൽ പാര്‍ക്കിംഗ് ചെയ്യാൻ 15 സീറ്റുള്ള വാന്‍ വാടകയ്ക്ക് എടുക്കുവാൻ പോകില്ല. അതുപോലെ, ഒരു ലക്ഷം പ്രതിദിന അഭ്യർത്ഥനകൾക്ക് വേഗവും ചെലവിലും വേണ്ടിയെങ്കിൽ വലിയ മോഡൽ തിരഞ്ഞെടുക്കരുത്. Tinker API യിൽ ചെറുതും, മധ്യനിലയും, “വാവ്, വളരെ ബുദ്ധിമുട്ടുള്ള” മോഡൽ കുടുംബങ്ങൾ ഉണ്ട്.

വേഗവും ചെലവു ലാഭവും ആവശ്യമെങ്കിൽ: ചെറുതായുള്ള അടിസ്ഥാന മോഡൽ തിരഞ്ഞെടുക്കുക.

സൂക്ഷ്മതയും ലജ്ജയും വേണ്ടെങ്കിൽ: വലിയ അടിസ്ഥാന മോഡൽ തിരഞ്ഞെടുക്കുക.

സ്വന്തം വ്യവസായത്തിൽ ധാരാളം ജാർഗൺ ഉണ്ടെങ്കിൽ (മെഡിക്കൽ, നിയമ, സപ്പോർട്ട് മാക്രോക്സ്): മധ്യത്തരം വരെ വലിയ മോഡലുകൾക്ക് ഫൈൻ-ട്യൂണിംഗ് നല്ലത്.

പ്രവചനങ്ങൾ: ആദ്യം ചെറിയ മോഡലിൽ പ്രോട്ടോടൈപ്പ് തയ്യാറാക്കുക. പ്രധാന മാനദണ്ഡങ്ങൾ മെച്ചപ്പെടുത്തിയാൽ, dataset വലിയ മോഡലിലേക്ക് മാറ്റുക.

ഘട്ടം 2: dataset തയ്യാറാക്കേണ്ടത് റസിപ്പി കാർഡുപോലെ, വസ്തുക്കൾ കൂട്ടിയിടുന്ന ഒരിടവഴി അല്ല

dataset ആണ് മികച്ചതിന്റെ പ്രധാന ഘടകം. മോഡൽ അനുകരണം കൊണ്ട് പഠിക്കുന്നു; ഉദാഹരണങ്ങൾ മേരായുള്ളവയാണെങ്കിൽ മോഡൽ മേരായും ഇറങ്ങും. എന്നാൽ അറിഞ്ഞ കാര്യങ്ങൾ കൃത്യവും ഏകരൂപവുമാണെങ്കിൽ, മോഡൽ സഹായകരനായ ഒരുനിലവാരക്കാരെപ്പോലെ പ്രവർത്തിക്കും.

JSONL (JSON Lines) ഫോർമാറ്റ് ഉപയോഗിച്ച് നിർദ്ദേശ-പ്രതികരണങ്ങൾ parejas സൂചിപ്പിക്കുക. ചാറ്റ്-സ്റ്റൈൽ ഫൈൻ-ട്യൂണിംഗിനായി system/user/assistant പോലുള്ള റോളുകൾ ഉൾപ്പെടുക. ഓരോ ഉദാഹരണവും ചെറുതോ മധ്യമായോ ആയിരിക്കും; ഏറെ മനോഹരമായ യു ദാഹരണങ്ങൾ ആയിരിക്കും കൂടുതൽ ഗുണമേന്മയുള്ളത്.

ഉദാഹരണം (നിർദ്ദേശ-ശൈലി):

{"instruction": "ഈ സപ്പോർട്ട് ടിക്കറ്റ് 2 വാക്യങ്ങളിൽ സൗഹൃദഭാവത്തോടെ സംക്ഷേപിക്കുക.", "input": "ഉപഭോക്താവ് 'Track Order' ക്ലിക്ക് ചെയ്തപ്പോൾ 404 പിഴവ് റിപ്പോർട്ട് ചെയ്തു", "output": "ശ്രദ്ധയിൽപ്പെടുത്തിയതിന് നന്ദി! ഉപഭോക്താക്കൾ 'Track Order' ക്ലിക്ക് ചെയ്തപ്പോൾ സൈറ്റ് 404 കാണിക്കുന്നു. ഓർഡർ-ട്രാക്കിംഗ് പേജിലെ തകരാറായ ലിങ്ക് അന്വേഷണം നടന്നുകൊണ്ടിരിക്കുന്നു, പരിഹാരം നൽകുന്നുവെന്ന് അറിയിക്കും."}

ഉദാഹരണം (ചാറ്റ്-സ്റ്റൈൽ):

{"messages": [ {"role": "system", "content": "നീ concise, സുഹൃദായക സപ്പോർട്ട് ഏജന്റാണ്. മുറ്റുമൊട്ടും സരളമായ ഇംഗ്ലീഷ് ഉപയോഗിക്കുക."}, {"role": "user", "content": "എന്റെ സബ്സ്ക്രിപ്ഷൻ പുതുക്കി, പക്ഷേ കാർഡ് കാലഹരണപ്പെട്ടു പോയിട്ടുണ്ട്. സഹായിക്കാമോ?"}, {"role": "assistant", "content": "ക്ഷമിക്കണം ഈ പ്രശ്നത്തിന്! നിങ്ങളുടെ പ്ലാൻ വീണ്ടും പരിശോധിച്ചു—കാലഹരണപ്പെടുന്ന കാർഡിൽ പുതുക്കൽ ശ്രമിക്കപ്പെട്ടു. ബില്ലിംഗ് പേജിൽ കാർഡ് അപ്ഡേറ്റ് ചെയ്യുക; ഞാൻ വീഴ്ച ശ്രമിക്കും."} ]}

ഫൈൻ-ട്യൂണിംഗിന് dataset തയ്യാറാക്കാനുള്ള ചില ടിപ്പുകൾ:

സ്ഥിരതയാണ് രാജ്ഞിയെപ്പോലെ. ടോൺ, സൈൻ-ഓഫുകൾ, ഘടന എല്ലാം ഒരുപോലെ ഇരിക്കുക.

വിഷയങ്ങളിൽ സമതുലനം പാലിക്കുക. ഉദാഹരണങ്ങളുടെ 90% റിഫണ്ട് ആണെങ്കിൽ മോഡൽ റിഫണ്ട് പരിഹാരകാരനാകും.

പ്രശ്നമയ കാര്യങ്ങൾ ലേബൽ ചെയ്യുക. Tinker API മുൻഗണന സൂചനയെ പിന്തുണയ്ക്കുന്നതെങ്കിൽ നെഗറ്റീവ് ഉദാഹരണങ്ങൾ ഉൾക്കൊള്‍ളുക.

സുരക്ഷിതമായി സൂക്ഷിക്കുക. വ്യക്തിഗത ഡാറ്റ നീക്കംചെയ്യുക. സെൻസിറ്റീവ് വിവരങ്ങളുള്ളപക്ഷം അനോണിമൈസ് ചെയ്ത് സിന്തസൈസ് ചെയ്യുക.

ഡാറ്റയുടെ 10–20% ടെസ്റ്റ് സെറ്റായി കൈവിടുക. ട്രെയിനിംഗ് സെറ്റിലെ വിലയിരുത്തൽ മോഡലിന്റെ കഴിവ് കുറച്ചും അതിശയിപ്പിക്കുമായ ഒരു തെറ്റായ ധാരണ നൽകും.

ഘട്ടം 3: Tinker API-ൽ ഡാറ്റ അപ്‌ലോഡ് ചെയ്യുക എളുപ്പത്തിൽ

ഏറേ സെറ്റപ്പുകളിൽ ഫൈൻ-ട്യൂണിംഗ് പ്ലാറ്റ്ഫോമുകൾ സ്റ്റോറേജ് എൻറ്പോയിന്റ് നൽകുന്നു. Tinker API-യിൽ സാധാരണ തെരഞ്ഞെടുത്ത നടപടി:

dataset സ്രോതസ്സ് സൃഷ്ടിക്കുക (POST /datasets)

JSONL ഫയൽ അപ്‌ലോഡ് ചെയ്യുക

സ്കീമ പരിശോധിക്കുക (ശരിയായ എണ്ണങ്ങൾ, പിശകുകൾ, അക്രമം സംബന്ധിച്ച റിപ്പോർട്ട് ലഭിക്കുന്നു)

കുറച്ചു പോലെ ഒരു ഉദാഹരണം (curl-പോലെ):

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"

Tinker API CLI പിന്തുണയ്ക്കുമെങ്കിൽ, ജീവിതം സൗകര്യപ്രദമാകും:

അപ്‌ലോഡ് ചെയ്യുക

tinker datasets upload my_finetune_data.jsonl --purpose finetune

സാധുത പരിശോധിക്കുക

tinker datasets validate DATASET_ID

വാലിഡേഷൻ പിശകുകൾ നിങ്ങൾക്ക് സഹായകരമാണ്. അവ കടുത്താതായി തോന്നിയാലും, 2 മണിക്ക് പരീക്ഷണ പരാജയം തടയാൻ സഹായിക്കും.

ഘട്ടം 4: ഫൈൻ-ട്യൂൺ ജോബ് ആരംഭിക്കുക, ഉചിതമായ ക്രമീകരണങ്ങൾ തിരഞ്ഞെടുക്കുക

നിങ്ങളുടെ dataset, അടിസ്ഥാന മോഡൽ എന്നിവ കാണിക്കുന്ന ജോബ് ആരംഭിക്കും. Tinker API ഫൈൻ-ട്യൂണിംഗ് എൻഡ്പോയിന്റുകൾ epoch, learning rate, batch size, evaluation frequency പോലുള്ള പാരാമീറ്ററുകൾ സ്വീകരിക്കുന്നു. അതായത്, ഡാറ്റയിലൂടെയുള്ള ചുറ്റുപാടുകൾ, മോഡൽ എത്ര വേഗം പഠിക്കണം, ഒരിക്കൽ കാണുന്ന ഉദാഹരണങ്ങളുടെ എണ്ണം, പുരോഗതിയുടെ വിശകലനം എത്ര തവണ ലഭിക്കും.

ഉദാഹരണ അഭ്യർത്ഥന:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-large-1", "dataset_id": "ds_abc123", "epochs": 3, "learning_rate": 1e-5, "batch_size": 8, "eval_dataset_id": "ds_eval789", "suffix": "support-tone-v1" }'

ഉചിതമായ ഡിഫാൾറ്റുകൾ:

Epochs: ചെറിയ മുതൽ മധ്യത്തരം dataset-കൾക്ക് 3–5. കൂടുതൽ അടിക്കടി ശരിയല്ല; കൂടുതൽ സമയം ചെലവഴിക്കുന്നത് ഒടുവിൽ ഓവർഫിറ്റിംഗിന് നയിക്കും.

Learning rate: സംയമിതമായി ആരംഭിക്കുക (1e-5 അല്ലെങ്കിൽ 2e-5). മോഡൽ വേഗം പഠിച്ചാൽ പൊതുവായ ബുദ്ധി മറക്കുന്നു.

Batch size: നിങ്ങളുടെ ക്വോട്ട അനുസരിച്ച് എത്രയായാലും, പക്ഷെ മികച്ച ഡാറ്റയുമായി പ്രകടനം മെച്ചപ്പെടും.

ഊര്‍ജ്ജം നിലക്കൽ: Tinker API-യിൽ ഇത് ഉണ്ടെങ്കിൽ സജീവമാക്കുക. ഇത് ‘ഞങ്ങൾ എത്തിയോ?’ എന്ന രീതിയിൽ ചിലപ്പോഴൊക്കെ ‘അതെ’ എന്നു പറയും.

ഘട്ടം 5: പരിശീലനം ശ്രദ്ധയോടെ നിരീക്ഷിക്കുക

Tinker സാധാരണയായി ലോഗുകൾ സ്ട്രീം ചെയ്യും: ട്രെയിനിംഗ് ലോസ്, മൂല്യനിർണ്ണയം ലോസ്, നിർദ്ദിഷ്ട മെട്രിക്കുകൾ. ചായപ്പനികൾ വായിക്കാനുള്ള വിധം:

ട്രെയിനിംഗ് ലോസ് കുറയുന്നു, മൂല്യനിർണ്ണയം ലോസ് സ്ഥിരമോ കൂടുന്നതോ? നിങ്ങൾ ഓവർഫിറ്റിംഗ്, പുതിയ ഉത്തരങ്ങൾക്കും ട്രെയിൻ ചെയ്തവ പരാജയപ്പെടുന്നു.

രണ്ടും താഴേക്ക് പോകുന്നു? നിങ്ങൾ ശരിയായ വഴിയിലാണ്.

ലോസ് സ്‌കോർ ഉയർന്നും താഴ്ന്നും? നിങ്ങളുടെ ലേണിംഗ് റേറ്റ് വളരെ ഉയർന്നതായോ dataset അനിഷ്ടമായതായോ ആയിരിക്കും.

ടിങ്കർ മിഡ്-ട്രെയിനിംഗിൽ പ്രിവ്യൂ ജനറേഷൻ എടുത്തു പരിശോധിക്കുക. നിങ്ങളുടെ ടെസ്റ്റ് സെറ്റിലെ ചില പ്രോംപ്റ്റുകൾ പരീക്ഷിച്ച് ടോൺ അച്ചൈറിയും പരിശോധിക്കുക. ഇത് ഗുണപരമായ സ്വതന്ത്രമാണു, നിങ്ങളുടെ ശൈലി പരിശീലിപ്പിക്കുകയുള്ളത്, കണക്ക് പ്രൂഫുകൾ അല്ല.

ഘട്ടം 6: പേരിട്ടു, വിന്യസിച്ചു, ഉപയോഗിക്കുക

ജോബ് കഴിഞ്ഞവഴി, Tinker API ft:tinker-large-1:support-tone-v1:abc123 പോലെയുള്ള മോഡൽ ഐഡി നൽകും. ഇതിനുശേഷം എൻഡ്പോയിന്റിന് പിന്നിൽ വിന്യസിച്ച് അടിസ്ഥാന മോഡൽ പോലെ വിളിക്കാം — എന്നാൽ ഇനി ഇത് നിങ്ങളുടെ സംഘത്തിന്റെ ശൈലിയിൽ സംസാരിക്കും.

ഉദാഹരണ ജെനറേഷൻ കോൾ:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-large-1:support-tone-v1:abc123", "messages": [ {"role": "system", "content": "നീ concise, സുഹൃദായക സപ്പോർട്ട് ഏജന്റാണ്."}, {"role": "user", "content": "എന്റെ റീഫണ്ട് വൈകുന്നു, ഞാൻ വിഷമിക്കുന്നു."} ], "temperature": 0.4 }'

നിങ്ങളുടെ മോഡൽ അധികം പറയാത്തതോ അല്ലെങ്കിൽ കുറച്ചു മാത്രമുള്ളത് തന്നോ ആണെങ്കിൽ 'presence_penalty' ഉയർത്താം അല്ലെങ്കിൽ 'temperature' കുറയ്ക്കാം. Tinker ഡോക്യൂമെന്റേഷൻ ഇതിനുള്ള ക്രമീകരണങ്ങൾ വിശദീകരിക്കും—പരീക്ഷിച്ചുതീർക്കുന്നതിൽ മടിക്കേണ്ട.

ഘട്ടം 7: കോച്ച് പോലെ വിലയിരുത്തുക, കോടതി പോലെ അല്ല

സ്വയം സ്കോർ കാർഡ് കൂടാതെ മനുഷ്യന്റെ വിലയിരുത്തലും വേണം. സ്വയം മെട്രിക്കുകൾ (BLEU, ROUGE, ആക്യുറസി) തിളക്കമുള്ളതിൽ മാത്രം സുതാര്യമാണ്, ടോൺ കാണാനാകില്ല. മനുഷ്യർ 'ഇത് കുറച്ചു തെറ്റും' എങ്കിൽ കണ്ടെത്തും.

ഒരു ചെറിയ റൂബ്രിക് സജ്ജീകരിക്കുക:

ടോൺ പൊരുത്തം (1–5)

നിർദ്ദേശം പാലിക്കൽ (1–5)

വാസ്തവസമ്പത്തി (1–5)

ദൈർഘ്യമതി (1–5)

സുരക്ഷ/ന്യൂനബോധം (1–5)

തീർത്ത 50–100 ഔട്ട്പുട്ടുകൾ ഉൾപ്പെടുത്തി രണ്ടു പേർ സ്വതന്ത്രമായി റേറ്റിങ്ങ് ചെയ്യൂ. ഒരു വിഭാഗം ശരാശരി 3-നു താഴെ ആയാൽ dataset തിരിച്ചറിയാം, നിങ്ങൾ ആ മനസ്സിലുള്ള പെരുമാറ്റം കാണിക്കുന്ന കൂടുതൽ ഉദാഹരണങ്ങൾ ചേർക്കുക.

ഘട്ടം 8: ചെലവ്, പ്രകടനം: CFO-ക്കും സർവർ-ക്കും പ്രധാനം

Tinker API ഫൈൻ-ട്യൂണിംഗ് രണ്ടു സ്ഥലങ്ങളിലാണ് ചെലവ് വരുന്നത്: പരിശീലനവും (train) ഇൻഫറൻസിo (ഉപയോഗവും). പരിശീലനം ഒരിക്കൽ മാത്രമുള്ള കഠിന പ്രയത്‌നമാണ്; ഇൻഫറൻസ് ഓറിയെൻറെ തുടർച്ച.

ടോക്കൻ നീളം കുറയ്ക്കുക. ചെറുതായുള്ള പ്രോംപ്റ്റുകളും ഔട്ട്പുട്ടുകളും ചെലവ് കുറയ്ക്കും.

നിങ്ങളുടെ ശൈലി ഗണ്യമായ സിസ്റ്റം പ്രോംപ്റ്റ് ഉപയോഗിക്കുക, എല്ലാ കോൾ-ലും വലിയ നിർദ്ദേശങ്ങൾ ആവർത്തിക്കാതിരിക്കുക, Tinker ഡിപ്ലോയ്മെന്റ് ലെവൽ ഡിഫാൾട്ട് പിന്തുണയ്ക്കുന്നു എങ്കിൽ.

പോലുള്ള സാധാരണ പ്രോംപ്റ്റുകൾ കാഷെ ചെയ്യുക.

റൂട്ടിംഗ് യന്ത്രം പരീക്ഷിക്കുക: ആവശ്യം ഉള്ളപ്പോൾ മാത്രം ഫൈൻ-ട്യൂൺ ചെയ്ത വലിയ മോഡൽ ഉപയോഗിക്കുക; അല്ലെങ്കിൽ ചെറുതും വിലവ് കുറഞ്ഞതുമായ മോഡൽ ഉപയോഗിക്കുക.

ലെറ്റൻസി (വൈക്കം) പ്രധാനമാണ്. ഫൈൻ-ട്യൂൺ മോഡൽ മന്ദഗതിയാണെങ്കിൽ, ചെറിയ കോൺടെക്സ്റ്റ് വിൻഡോകൾ പരീക്ഷിക്കുക, അല്ലെങ്കിൽ സ്റ്റൈലിൽ വലിയ മോഡൽ ഉപയോഗിക്കുക മുള്ളടക്കത്തിനായി, ചെറു മോഡൽ ക്ലാസിഫിക്കേഷൻ വേണ്ടി മാത്രം.

ഘട്ടം 9: പ്രശ്ന പരിഹാരങ്ങൾ: ഗ്രീംലിന്റെ വലിയ ഹിറ്റുകൾ

മോഡൽ സ്വന്തം തന്നെ ആവർത്തിക്കുന്നു.

ടേംപറേച്ചർ കുറയ്ക്കുക; ലഘുവായ, കൃത്യമായ ഉത്തരങ്ങൾ ഉള്ള ഉദാഹരണങ്ങൾ കൂട്ടിച്ചേർക്കുക; ബീം വിഡ് കുറയ്ക്കുക.

അറിയിപ്പ് അവഗണിക്കുന്നു.

സിസ്റ്റം പ്രോംപ്റ്റ് ശക്തിപ്പെടുത്തുക, കർശനമായ നിർദ്ദേശം പാലിക്കുന്ന ഉദാഹരണങ്ങൾ ഉൾപ്പെടുത്തുക.

ഫാക്റ്റുകൾ ഹൈപ്പോടെ അവഗണിക്കുന്നു.

“എനിക്ക് അറിയില്ല” ഇതുപോലുള്ള ഉദാഹരണങ്ങൾ ചേർക്കുക. ഉറവിടങ്ങളെ കണക്ട് ചെയ്യുക; ടേംപറേച്ചർ കുറയ്ക്കുക; റിട്ട്രീവലിനൊപ്പം ചേർക്കുക.

അവൻ വളരെ ഇടയാക്കിയാണ്. (അതെ, ഇത് ഒരു കാര്യം.)

പരിധികൾ നിർവ്വചിക്കുന്ന, നയങ്ങളുമായി ബന്ധപ്പെട്ട പരിശീലന ഉദാഹരണങ്ങൾ ചേർക്കുക—“ഞങ്ങൾ X ചെയ്യാൻ കഴിയില്ല, എന്നാൽ ഈ Y ഉണ്ട്.”

ട്രെയിനിങ് മധിയിൽ പരാജയപ്പെടുന്നു.

Dataset വാലിഡേഷൻ പരിശോധിക്കുക, അസാധാരണ അക്ഷരങ്ങൾ, മാക്സ് ടോക്കൻ നീളം. ചെറിയ ബാച്ച് സൈസ് അല്ലെങ്കിൽ കുറച്ച് epoch പരീക്ഷിക്കുക.

ഘട്ടം 10: ഫൈൻ-ട്യൂൺ ചെയ്യൽ, പ്രോംപ്റ്റുകൾ അല്ലെങ്കിൽ റിട്ട്രീവൽ ഉപയോഗിക്കേണ്ടത് എപ്പോൾ?

എനിക്ക് ഫൈനലൈൻ-ട്യൂണിംഗ് ഇഷ്ടമാണ്, പക്ഷേ അതൊന്നല്ല മുഴുവൻ ഉപാധി. മൂന്ന് പ്രധാന രീതി:

പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗ് മാത്രം: ഏറ്റവും ഇളം, വേഗത്തിൽ. ടോൺ മാറ്റം വേണ്ടപ്പോൾ നല്ലതു.

റിട്ട്രീവൽ-ഓഗ്മെൻറഡ് ജെനറേഷൻ (RAG): പുതിയ വിവരങ്ങൾക്കും വലിയ നോളജ് ബേസ്-ക്കുമായി. മോഡൽ ഡോക്യുമെന്റ് റൺടൈമിൽ വായിക്കുന്നു.

ഫൈൻ-ട്യൂണിംഗ്: ശൈലി, ഘടന, സ്ഥിരമായ ഡൊമെയ്ൻ പാറ്റേണുകൾക്ക് മികച്ചത്.

സാധാരണ വിജയോദാഹരണം ഇതിന്റെയും അന്നും ആണ്: RAG Facts കിട്ടാൻ; പിന്നെ fine-tuned മോഡൽ നിങ്ങളുടെ ശൈലി മാത്രമായ മറുപടി നൽകാൻ.

ഓരോ Tinker API ട്യൂട്ടോറിയൽ നിങ്ങൾക്ക് കോപ്പി-പേസ്റ്റ് ചെയ്യാം

ഞങ്ങൾ സാമ്പിൾ, മിത്ത്യ-സൃഷ്ടിച്ച നടപ്പിലാക്കലിന് സമാനമായി അന്തഃസ്യൂചന നേർക്കാഴ്ച നൽകുന്നു. എൻഡ്പോയിന്റ്‌കളും ഐഡിയേയും നിങ്ങളുടെ യഥാർത്ഥത്തിൽ മാറ്റുക.

Datasets സൃഷ്ടിക്കുക, അപ്‌ലോഡ് ചെയ്യുക

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune"

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval"

ഫൈൻ-ട്യൂണിംഗ് തുടങ്ങുക

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-medium-1", "dataset_id": "ds_train", "eval_dataset_id": "ds_eval", "epochs": 4, "learning_rate": 2e-5, "suffix": "email-summarizer-v1" }'

ലോഗുകൾ സ്ട്രീം ചെയ്യുക

curl -N -H "Authorization: Bearer $TINKER_KEY"

ഫൈൻ-ട്യൂൺ മോഡൽ ഉപയോഗിക്കുക

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-medium-1:email-summarizer-v1:xyz", "prompt": "ഇമെയിൽ രണ്ട് ബുള്ളറ്റുകളിൽ സൗഹൃദമായ ടോണിൽ സംക്ഷേപിക്കുക:\n\n[ഇമെയിൽ ഇഴുക്കുക]", "max_tokens": 160, "temperature": 0.4 }'

യാഥാർഥ്യ സംഭവങ്ങൾ: എന്താകും സംഭവിക്കുക എന്നുപോലെയുള്ളത്...

നിങ്ങളുടെ സപ്പോർട്ട് മാക്രോകൾ ഫൈൻ-ട്യൂൺ ചെയ്യുക

പ്രത്യക്ഷത്തില്‍, നിങ്ങളുടെ AI ഏജൻറിന്റെ ഘടന പ്രകാരം മറുപടി നൽകുന്നു: ക്ഷമാപണം, നടപടി, തുടർ പ്രവർത്തനം. CSAT ഉയരും കാരണം ആളുകൾ കാഴ്ചപ്പാടിലുള്ള സ്ഥിരതയെ ഇഷ്ടപ്പെടുന്നു.

ബ്രാൻഡ് ശബ്ദത്തിൽ ഫൈൻ-ട്യൂൺ ചെയ്യുക

മോഡൽ നിങ്ങളുടെ 'നാം സഹായകരരാണ്, സ്ഥിരതയില്ലാത്തവർ അല്ല' ശൈലി പാടില്ലാതെ നഖം തുപ്പും. മാർക്കറ്റിംഗ് സമാധാനത്തോടെ ഉറങ്ങും.

കോഡ് നിർദ്ദേശങ്ങൾക്കായി ഫൈൻ-ട്യൂൺ ചെയ്യുക

ടാസ്‌ക് വിവരങ്ങളും ഇഷ്ടാനുസൃതമായ കോഡ് സ്നിപ്പറ്റുകളും നൽകുക. ഉദാഹരണങ്ങൾ ചെറുതും കേന്ദ്രീകൃതവുമാകണം; ശബ്ദമുള്ള കോഡ് ശബ്ദമുള്ള കോംപ്ലീഷനുകളെ പടരും.

വർഗ്ഗീകരണത്തിനായി ഫൈൻ-ട്യൂൺ ചെയ്യുക

അതെ, നിങ്ങൾ കഴിയും. ലേബൽ ചെയ്ത ഉദാഹരണങ്ങൾ നൽകുകയും, മോഡലിനെ ചുരുങ്ങിയ പ്രോംപ്റ്റുകളിൽ വിളിച്ച് ഉപയോഗിക്കുകയും ചെയ്യുക. കർശനമായ ലേബലുകൾക്ക് താപം 0 ആയി സജ്ജമാക്കുക.

സാധുത ആദ്യത്തെയും അവസാനത്തെയും എന്നും മുൻനിർത്തുക

നിങ്ങളുടെ ഉപയോഗം നിയന്ത്രിത അല്ലെങ്കിൽ സെൻസിറ്റീവ് മേഖലയിൽ എങ്കിൽ, സിസ്റ്റം പ്രോംപ്റ്റിലും പരിശീലന ഡാറ്റയിലും സുതാര്യമായ പരിധികൾ വരയ്ക്കുക. നിരസിച്ചലുകൾ നിഷ്പക്ഷമായി കാണിക്കുന്ന ഉദാഹരണങ്ങൾ ചേർക്കുക. ഔട്ട്പുട്ടുകളും ലോഗ് ചെയ്ത് ഉപയോക്താക്കൾക്ക് പ്രശ്നങ്ങൾ റിപ്പോർട്ട് ചെയ്യാൻ അനുവദിക്കുക. ഫൈൻ-ട്യൂൺ മോഡലുകൾ ആത്മവിശ്വാസത്തോടെ ജാഗ്രത പുലർത്താൻ പരിശീലിപ്പിക്കുക.

Sider.AI എവിടെ സഹായിക്കും (എവിടെ അല്ല)

ഈ തലശ്ശരി: Sider.AI ഒരു മികച്ച കൂട്ടുകാരൻ ആകാം നിങ്ങൾ Tinker API ഉപയോഗിക്കാൻ പഠിക്കുമ്പോൾ. ഇത് വേദന പറയാത്ത ഒരൊഫീഷ്യൽ കോ-പൈലറ്റിനുള്ള Experience പോലെയാണ്. ടെർമിനലിലൂടെ Dataset ഉദാഹരണങ്ങൾ Draft ചെയ്യാനും പഴയ ഇമെയിലുകൾ അല്ലെങ്കിൽ നോളജ് ബേസ് ഒപ്പം കാണാനും കഴിയും, പിന്നെ JSONL export ചെയ്യാം. ട്രെയിനിങ് ജോബ് ഓടിക്കാൻ കഴിയില്ല—അതിന്റെ ഭാഗം Tinker-ന്റെ ജോലി—പക്ഷേ Draft, പുനഃസംശോധനം, QA ആയി ഭൂരിഭാഗം പ്രായോഗികമാണ്. ഉദാഹരണത്തിന്, “ഈ മറുപടി ശാന്തവും എളുപ്പം ഇംഗ്ലീഷിലും രണ്ട് വാക്യങ്ങളിലാക്കി പുനഃരചിക്കുക” എന്നു ചോദിച്ച് Dataset നിലവാരം കൂട്ടാം.

എനിക്കു പറഞ്ഞു എന്ന് ആഗ്രഹിച്ച ചില കാര്യങ്ങൾ

കൂടുതൽ ഡാറ്റ മതി എന്നല്ല — കൂടുതൽ പ്രതിനിധാന ഡാറ്റ മതി.

ടോൺ ഒവർത്തെക്കരുത്. ചില വിശേഷപ്പെടുത്തലുകൾ ഉണ്ടാക്കിയേക്കുക ഉപയോക്താക്കൾ സൃഷ്ടിമാനിജീവിതങ്ങൾക്ക് വഴി പോകുമ്പോൾ.

എല്ലാം വേർഷൻ ചെയ്യുക: dataset v1.1, മോഡൽ v1.2, പ്രോംപ്റ്റ് ടെംപ്ലേറ്റ് v3.0. ഭാവിയുടെ നിങ്ങൾ നന്ദി പറയും.

റോൾബാക്ക് ബട്ടൺ ഉണ്ടാക്കുക. ഒരു പുതിയ ഫൈൻ-ട്യൂൺ തെറ്റായാൽ, പഴയ മോഡൽ ഉടനെ വിന്യസിക്കുക.

സുന്ദരമായ ഉദാഹരണമാത്രം അല്ല, യഥാർത്ഥ ഉപയോക്തൃ പ്രോംപ്റ്റുകൾ ഉപയോഗിച്ച് വിലയിരുത്തുക. ഉപയോക്താക്കൾ വ്യത്യസ്തമായ കവിതാകാരന്മാരും ആണെങ്കിലും.

ഒന്ന് മാത്രം പറയാം...

Tinker API ഫൈൻ-ട്യൂണിംഗ് Skynet നിർമ്മാണമല്ല. ഇത് നിങ്ങളുടെ AI തെറ്റങ്ങൾ കുറയ്ക്കാനും നിങ്ങളുടെ ടീമിന്റെ ഭാഗമാക്കിയെന്നു തോന്നിക്കാനുമാണ്. ചെറിയതിൽ തുടങ്ങുക, മിപ്പിരിക്കാൻ മടിക്കരുത്, ചിലപ്പോൾ ലളിതമായ പ്രോംപ്റ്റുകൾ മാറ്റമാകാം.

നിങ്ങളുടെ AI ഒടുവിൽ നിങ്ങൾ പോലെ മറുപടി നൽകുമ്പോൾ? അത് സാദ്ധ്യതയല്ല, മനസു നിലനിൽക്കലാണ്.

ചീറ്റ്ഷീറ്റ്

Tinker API ഉപയോഗിച്ച് നിങ്ങളുടെ സ്വന്തം AI മോഡൽ ഫൈൻ-ട്യൂൺ ചെയ്യാനുള്ള മാർഗ്ഗം: ശുദ്ധവും സുരക്ഷിതവുമായ JSONL കൂട്ടികൾ തയ്യാറാക്കുക; അപ്‌ലോഡ് ചെയ്യുക; ഉചിത ഡിഫാൾട്ട് ഉപയോഗിച്ച് ഫൈൻ-ട്യൂൺ ആരംഭിക്കുക; മനുഷ്യരും മെട്രിക്കുകളുമായി വിലയിരുത്തുക; വിന്യസിച്ച് ആവർത്തിക്കുക.

ഫൈൻ-ട്യൂണിംഗ് ശൈലിക്കും സ്ഥിര രൂപങ്ങൾക്കും ഉപയോഗിക്കുക; പുതിയ വിവരങ്ങൾക്ക് റിട്ട്രീവൽ ഉപയോഗിക്കുക.

ചെലവ് നിയന്ത്രിക്കാൻ ചെറിയ പ്രോംപ്റ്റുകൾ, ചെറു മോഡലുകൾ, റൂട്ടിംഗ് ഉപയോഗിക്കുക.

സുരക്ഷ dataset-ൽ വ്യക്തമായി ഉൾപ്പെടുത്തുക.

“Train” അമർത്തുന്നതിന് മുൻപ് ഡാറ്റാ ഉദാഹരണങ്ങൾ മികച്ചതാക്കാൻ Sider.AI പോലുള്ള ടൂളുകൾ ഉപകാരപ്രദമാണ്.

പതിവുചോദ്യങ്ങൾ

Q1: Tinker API ഉപയോഗിച്ച് എന്റെ സ്വന്തം AI മോഡൽ ഫൈൻ-ട്യൂൺ ചെയ്യാൻ ഡാറ്റ എങ്ങനെ തയ്യാറാക്കാം? JSONL ഫോർമാറ്റിൽ വ്യക്തമായ Instruction-Response അല്ലെങ്കിൽ ചാറ്റ്-സ്റ്റൈൽ ഉദാഹരണങ്ങൾ ഉപയോഗിക്കുക. ടോൺ ഒരേപോലെ ഇരിക്കുക, സ്വകാര്യ വിവരങ്ങൾ അനോണിമൈസ് ചെയ്യുക, 10–20% ഡാറ്റ ടെസ്റ്റിനായി വെക്കുക, അങ്ങോട്ട്_scores ഉയർന്നതായി തോന്നാതിരിക്കാൻ ശ്രദ്ധിക്കുക.

Q2: Tinker API ഉപയോഗിച്ച് ഫൈൻ-ട്യൂൺ ചെയ്യുന്നത് പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗിനെക്കാൾ മികച്ചതാണോ? വേഗത്തിലുള്ള ടോൺ മാറ്റങ്ങൾക്കും ലളിതമായ സ്വഭാവങ്ങൾക്കും പ്രോംപ്റ്റുകൾ ഉപയോഗിക്കുക; നിങ്ങൾക്ക് നിലനിൽക്കുന്ന ശൈലി, ഘടന അല്ലെങ്കിൽ ഡൊമെയ്ൻ പാറ്റേണുകൾ ആവശ്യമുള്ളപ്പോൾ ഫൈൻ-ട്യൂണിംഗ് ഉപയോഗിക്കുക. പല ടീമുകളും ഇത് രണ്ടും സംയോജിപ്പിക്കുന്നു - വസ്തുതകൾക്കായി RAG, ശബ്ദത്തിനായി ഫൈൻ-ട്യൂൺ.

Q3: Tinker API ഉപയോഗിച്ച് ഒരു മോഡലിനെ ഫൈൻ-ട്യൂൺ ചെയ്യാൻ എനിക്ക് എത്ര ഡാറ്റ ആവശ്യമാണ്? ഗുണമേന്മയാണ് അളവിനേക്കാൾ പ്രധാനം. കുറഞ്ഞ അളവിലുള്ള മികച്ച ഉദാഹരണങ്ങൾക്ക് ആയിരക്കണക്കിന് തെറ്റായ ഉദാഹരണങ്ങളെക്കാൾ മികച്ച പ്രകടനം നടത്താൻ കഴിയും. ചെറിയ തോതിൽ ആരംഭിച്ച് വിലയിരുത്തുക, തുടർന്ന് മോഡൽ ബുദ്ധിമുട്ടുന്നിടത്ത് ടാർഗെറ്റുചെയ്‌ത ഉദാഹരണങ്ങൾ ചേർക്കുക.

Q4: Tinker API-യിൽ ഞാൻ എങ്ങനെ ഫൈൻ-ട്യൂൺ ചെയ്ത മോഡൽ വിന്യസിക്കും? പരിശീലനത്തിന് ശേഷം, Tinker ഒരു മോഡൽ ID നൽകുന്നു. അതിനെ സ്റ്റാൻഡേർഡ് കംപ്ലീഷൻസ് വഴിയോ അല്ലെങ്കിൽ ചാറ്റ് എൻഡ്‌പോയിന്റ് വഴിയോ വിളിക്കാം. സഹായകരമായ ഒരു സിസ്റ്റം പ്രോംപ്റ്റ് സജ്ജമാക്കുക, താപനില ക്രമീകരിക്കുക, കൂടാതെ യഥാർത്ഥ ട്രാഫിക്കിൽ ഔട്ട്പുട്ടുകൾ നിരീക്ഷിക്കുക.

Q5: എൻ്റെ ഫൈൻ-ട്യൂൺ ചെയ്ത മോഡൽ തെറ്റായ വിവരങ്ങൾ നൽകുന്നത് എങ്ങനെ തടയാം? അനിശ്ചിതത്വം സമ്മതിക്കുന്ന ഉദാഹരണങ്ങൾ ഉപയോഗിച്ച് പരിശീലിപ്പിക്കുക, താപനില കുറയ്ക്കുക, കൂടാതെ വസ്തുതകൾക്കായി വീണ്ടെടുക്കലുമായി ജോടിയാക്കുക. "ഉറവിടങ്ങൾ ഉദ്ധരിക്കുക" അല്ലെങ്കിൽ "എനിക്കറിയില്ല എന്ന് പറയുക" എന്നത് നിർദ്ദേശത്തിൻ്റെയും പരിശീലന ഡാറ്റയുടെയും ഭാഗമാക്കുക.