How do I prepare data to fine-tune my own AI model with Tinker API?

Use JSONL with clear instruction–response or chat-style pairs. Keep tone consistent, anonymize sensitive info, and hold out 10–20% for testing so you don’t fool yourself with inflated scores.

Is fine-tuning with Tinker API better than prompt engineering?

Use prompts for quick tone tweaks and simple behaviors; use fine-tuning when you need durable style, structure, or domain patterns. Many teams combine both—RAG for facts, fine-tune for voice.

How much data do I need to fine-tune a model with Tinker API?

Quality beats quantity. A few hundred strong examples can outperform thousands of noisy ones. Start small, evaluate, then add targeted examples where the model struggles.

How do I deploy a fine-tuned model in Tinker API?

After training, Tinker returns a model ID you can call via the standard completions or chat endpoint. Set a helpful system prompt, tune temperature, and monitor outputs in real traffic.

How do I stop my fine-tuned model from hallucinating?

Train with examples that admit uncertainty, lower temperature, and pair with retrieval for facts. Make “cite sources” or “say you don’t know” part of the instruction and the training data.

તમારા AIને હવામાન રોબોટ કરતાં ઓછું અને… તમારી જેમ લાગવાની ઈચ્છા કદી થઈ છે?

આ કલ્પના કરો: તમે તમારા AIને ગ્રાહકના ઇમેઇલનો સારાંકન કરવા માટે પૂછો છો અને તે Shipping Forecastનું વર્ણન કરે તેવો જવાબ આપે છે. ટેકનિકલી બરાબર; પરંતુ આત્માનાં દ્રષ્ટિકોણે મદદરૂપ નથી. તમે ખરેખર એવું માંગો છો કે તમારું AI—તમારું ટોન, તમારું જર્ગન, તમારી પસંદગીઓ—બનાવવી હોય પણ અનુભવશાળી સંશોધન કે લેબ બનાવવાની જરૂર ના પડે.

અહીં ફાઈન-ટ્યુનિંગ કામમાં આવે છે. અને જો તમે 'Tinker API' વિશે સાંભળ્યું હશે તો તમે યોગ્ય જગ્યાએ છો. આ Tinker API સાથે તમારું AI મોડેલ કેવી રીતે ફાઇન-ટ્યુન કરવું તેની માર્ગદર્શિકા છે—તેમ ભાવિ વખતે જ્યારે તમે 'જવાબ તૈયાર કરો' ટાઇપ કરશો ત્યારે તે તમારી ટીમની ભાષા જેવા જવાબ આપે, HAL 9000 ના મિતનું નહીં.

અમે સમગ્ર પ્રક્રિયા સમજાવશું: ફાઇન-ટ્યુનિંગ શું છે, ડેટા કેવી રીતે તૈયાર કરવો, Tinker API સાથે ફાઇન-ટ્યુન કેવી રીતે ચલાવવી, અને તમારી બજેટ અથવા ધૈર્ય ન ખોટું પડી શકે તે કેવી રીતે ટાળવું. હું તમને આમાં છુપાયેલા સાવધાની ટિપ્સ પણ આપીશ—કારણ કે ફાઇન-ટ્યુનિંગ શક્તિશાળી છે, પરંતુ કોઈ જાદુગરી સ્ત્રી નથી.

મુખ્‍ય વાક્યાં પર ધ્યાનમાં રાખો: અમે ઘણીવાર 'Tinker API કેવી રીતે ઉપયોગ કરવો' કહેશુ, કારણ કે એજ તમારું પ્રશ્ન છે. અમે 'તમારું પોતાનું AI મોડેલ ફાઇન-ટ્યુન કરવું', 'Tinker API ટ્યુટોરિયલ', 'ફાઇન-ટ્યુનિંગ માટે ડેટાસેટ તૈયારી' અને 'ફાઇન-ટ્યુન મોડેલ ડિપ્લોયમેન્ટ' જેવા લાંબા ટર્મ પણ જોડશું. જો આ બધું વધારે લાગી રહ્યું હોય તો ચિંતિત ન થાઓ—હું સાદા ભાષામાં સમજાવીશ.

ફાઇન-ટ્યુનિંગ શું છે—અને શું નથી

જો સામાન્ય AI મોડેલ એક સ્વિસ આર્મી ચાકૂ હોય તો ફાઇન-ટ્યુનિંગ એ તમે કહેવું, “ચાકૂ, અમે તને પેકેજ ખુલવા માટે ખાસ બનાવવા જઈ રહ્યા છીએ.” તમે ચાકૂ શોધી રહ્યો નથી. તમે તેને તમારું મનપસંદ કાર્ડબોર્ડ શીખવી રહ્યા છો.

વાસ્તવમાં, ફાઇન-ટ્યુનિંગનો અર્થ છે કે તમે મૂળ મોડેલ (જે પહેલેથી બધી ઇન્ટરનેટ લેખનની જાણકારી મેળવી ચૂક્યું છે) તમારા ઉદાહરણોથી નડેજો—તમારી લખાણ શૈલી, વિશિષ્ટ ડોમેનના પ્રશ્નો-જવાબ, સપોર્ટ સ્ક્રિપ્ટ્સ—જે તેતમ અનુસાર જવાબ આપે. તે મોડેલને સ્ટાઈલ ગાઇડ અને પ્રેક્ટિસ પ્રશ્નાવળી આપવી જેવી છે.

પરંતુ ફાઇન-ટ્યુનિંગ કોઈ જાદુઈ ફોર્મ્યુલા નહીં. તે તેવા તથ્ય શીખશે નહીં જેને તેણે ક્યારેય નહીં જોયા હોય જો સુધી તમારું ડેટા તે શીખવતું ન હોય. તે મોટા માલિકાનિયા દસ્તાવેજ યાદ નહીં રાખી શકે જો સુધી તમે પ્રતિનિધિ ટુકડા ન આપો. અને જો તમારું ડેટા ગંદુ, વિવાદાસ્પદ, કે નાનું હોય તો તમારું મોડેલ તે જ આદતો અપનાવી ખૂણાનો ટેમ્પો ધરાવતો કિશોર રૉક બેન્ડ જેવું બની જશે.

ઝડપી ઝાંખી

અહીં Tinker API ઉપયોગ કરીને તમાર owno AI મોડેલ ફાઇન-ટ્યુન કેવી રીતે કરવું તેનો વ્યાપક દૃશ્ય છે:

Tinker API માં એક આધારભૂત મોડેલ પસંદ કરો.

પ્રોમ્પ્ટ અને આદર્શ જવાબો સાથે સાફ અને સંતુલિત ડેટાસેટ તૈયાર કરો.

તમારૂં ડેટાસેટ Tinker પર અપલોડ કરો.

સાપડ હાઇપરપેરામીટર્સ સાથે ફાઇન-ટ્યુનિન્ગ જૉબ બનાવો.

ટ્રેનિંગનું નિરીક્ષણ કરો, હોલ્ડઆઉટ ટેસ્ટ સેટથી મૂલ્યાંકન કરો.

તબાદ ડિપ્લોય કરો અને પ્રોડક્શનમાં ફાઇન-ટ્યુન કરેલા મોડેલને کال કરો.

જ્યારે અજરૂબી દેખાય ત્યારે પુનરાવૃત્તિ કરો.

અમે દરેક પગલાં સાથ આપવામાં કોડ ઉદાહરણો અને ટિપ્સ આપીશું જેનાથી તમારી ફરિયાદ કરવાની જરૂર ન રહે.

પગલું 1: આધારભૂત મોડેલ પસંદ કરો જેમ તમે ભાડાની કાર પસંદ કરો

તમે મૅનહેટન માં પૅરલલ પાર્કિંગ માટે 15-સીટની વાન ભાડે લેવા નથી જતાં. એજ રીતે, જો તમને ઝડપી અને સસ્તા જવાબોની જરૂર હોય તો મોટી અને ભારે મોડેલ ન પસંદ કરો. Tinker API સામાન્ય રીતે કેટલાક મોડેલ ફેમિલીઝ આપે છે—લાઇટવેઈટ, મધ્યમ, અને 'વાહ, આ તો સ્માર્ટ છે'.

જો ઝડપ અને ખર્ચ બચાવવો હોય: નાનું આધારભૂત મોડેલ પસંદ કરો.

જો વિગતવાર વિચારશીલતા, તાર્કિકતા અથવા લાંબા લખાણની જરૂર હોય: મોટું આધારભૂત મોડેલ પસંદ કરો.

જો તમારું ક્ષેત્ર ઘણું જર્ગન ધરાવે છે (ચિક્ષા, કાનૂની, સપોર્ટ માક્રોઝ): માધ્યમ કે મોટાં મોડેલ વધુ ફળદાયક રીતે ફાઇન-ટ્યુન થાય છે.

પ્રોફેશનલ ટીપ: શરૂઆત નાના મોડેલથી કરો પ્રોટોટાઇપ માટે. જો તમારી મુખ્ય માપદંડો સુધરે, તો એ જ ડેટાસેટને મોટા મોડેલ પર લઈ જાઓ.

પગલું 2: ડેટાસેટ તૈયાર કરો જેમ રસોઈનું રેસીપી કાર્ડ, વગર ઈચ્છનીય વસ્તુઓના ડબ્બામાંથી નહીં

તમારું ડેટાસેટ ગુણવત્તા માટે સૌથી મોટું સાધન છે. મોડેલ નકલ કરીને શીખે છે; જો ઉદાહરણ અમૂર્ત છે, તો મોડેલ અમૂર્ત બની જશે. যদি উদাহরণ crisp, consistent, અને વિવિધ છે, તો તમારું મોડેલ એક મદદરૂપ સાથીદારો બની જશે જે મેમો વાંચે છે.

જયસે JSONL (JSON Lines) ફોર્મેટમાં વિગતવાર સુચનાઓ-પ્રતિસાદ પેઅર્સ હોવા જોઈએ. ચેટ-સ્ટાઇલ ફાઇન-ટ્યુનિંગ માટે 'system/user/assistant' જેવા રોલ્સ શામેલ કરો. દરેક ઉદાહરણ નાનું કે મધ્યમ રાખો; ઘણા ગુણવત્તાવાળા ઉદાહરણો ઘણો અવાજ કરતા ઊંચા છે.

ઉદાહરણ (સૂચના-શૈલી):

{"instruction": "આ સપોર્ટ ટિકિટને 2 વાક્યમાં સારાંશ આપો, دوستانه ટોનમાં.", "input": "ગ્રાહકે 'ટ્રેક ઓર્ડર' પર ક્લિક કરતાં 404 ખોટી બતાવી છે", "output": "આ સમસ્યાની જાણકારી માટે આભાર! સાઇટ જ્યારે ગ્રાહકો 'ટ્રેક ઓર્ડર' પર ક્લિક કરે ત્યારે 404 બતાવે છે. અમે ઓર્ડર-ટ્રેકિંગ પૃષ્ઠમાં તૂટેલા લિંકની તપાસ કરી રહ્યા છીએ અને સમાધાન આપશું."}

ઉદાહરણ (ચેટ-શૈલી):

{"messages": [ {"role": "system", "content": "તમે સંક્ષિપ્ત અને મૈત્રીપૂર્ણ સપોર્ટ એજન્ટ եք. સરળ અંગ્રેજી નો ઉપયોગ કરો."}, {"role": "user", "content": "મારો સબ્સ્ક્રિપ્શન નવીનીકૃત થયો, પણ કાર્ડ મિયાદ પૂરી થઈ ગઈ. મદદ?"}, {"role": "assistant", "content": "આ સમસ્યાથી દુઃખ છે! મેં તમારું પ્લાન તપાસ્યું—મિયાદ પૂરી થઈ ગયેલા કાર્ડથી નવીનીકરણ થયું. કૃપા કરીને બિલિંગ પેનલ પર તમારું કાર્ડ અપડેટ કરો; હું ફરીથી ચાર્જ પ્રયત્ન કરીશ."} ]}

ફાઇન-ટ્યુનિંગ માટે ડેટાસેટ તૈયાર કરવા માટે ટિપ્સ:

સતતતા સૌથી મહત્વપૂર્ણ છે. હંમેશા એક જ ટોન, સહી અને બંધારણનો ઉપયોગ કરો.

વિષયોમાં સંતુલન રાખો. જો 90% ઉદાહરણ રિફંડ છે, તો તમારું મોડેલ 'રિફંડ ફેરિ' બની જશે.

જટિલ કિસ્સાઓને લેબલ કરો. નકારાત્મક ઉદાહરણો (શું ન કહેવું) શામેલ કરો, જો Tinker API પસંદગીઓ સપોર્ટ કરે.

સુરક્ષિત રાખો. વ્યક્તિગત માહિતી દૂર કરો. જો સંવેદનશીલ માહિતી હોય તો એનોનિમાઇઝ કે სინ્થેટિક બનાવો.

તમારા ડેટાનું 10-20% હોલ્ડઆઉટ તરીકે રાખો ટેસ્ટ માટે. ટ્રેનિંગ સેટ પર જ જોમ મૂલ્યાંકન કરશો તો તમે ખોટી ઊંઝાણમાં પડી જશો.

પગલું 3: Tinker API પર ડેટા અપલોડ કરો સરળતાથી

ઘણાં ફાઇન-ટ્યુનિંગ પ્લેટફોર્મ સ્ટોર્સૌએન્ડપોઇન્ટ આપે છે. Tinker API માં તમને સામાન્ય રીતે:

ડેટાસેટ સ્રોત બનાવો (ઉદાહરણ, POST /datasets)

તમારું JSONL ફાઈલ અપલોડ કરો

સ્કીમા ચકાસો (Tinker સામાન્ય રીતે ઉપયોગી રિપોર્ટ આપે છે: યોગ્ય ગણી, ભૂલો, અજોઈ ફીલ્ડ)

આ રીતે કોર્ડ-માટેનું ઉદાહરણ (curl જેવા):

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"

જો Tinker API CLI સપોર્ટ કરે તો આગળ જીવન સરળ થાય છે:

અપલોડ કરો

tinker datasets upload my_finetune_data.jsonl --purpose finetune

ચાલુ ચકાસણી

tinker datasets validate DATASET_ID

ચકાસણી ભૂલો તમારા મિત્ર છે. તે પરખ્યા જેવું લાગે છે, પરંતુ તે તમને અજાણેલા ત્રુଟિથી સવારે 2 વાગ્યે બચાવે છે.

પગલું 4: ફાઇન-ટ્યુન જૉબ શરુ કરો અને યોગ્ય સેટિંગ્સ પસંદ કરો

તમારા ડેટાસેટ અને પસંદ કરેલા આધારભૂત મોડેલ બતાવતા જૉબ શરૂ કરી શકો. Tinker API ફાઇન-ટ્યુન એન્ડપોઈન્ટ પર સામાન્ય પેરામીટર્સ જેમ કે epochs, લર્નિંગ રેટ, બેચ સાઇઝ અને મૂલ્યાંકન આવૃત્તિ આવે છે. મતલબ: તમારું ડેટા કેટલા વખતથી પસાર થવું, મોડેલ શીખવામાં કેટલું ઝડપી, કેટલાં ઉદાહરણ એકસાથે શીખવા, અને તમે દરેક કેટલાય વખત પ્રગતિ રિપોર્ટ જોઈ શકો.

ઉદાહરણ વિનંતી:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-large-1", "dataset_id": "ds_abc123", "epochs": 3, "learning_rate": 1e-5, "batch_size": 8, "eval_dataset_id": "ds_eval789", "suffix": "support-tone-v1" }'

યોગ્ય ડિફૉલ્ટ્સ:

ઇપોક્સ: નાના થી મધ્યમ ડેટાસેટ માટે 3-5. વધુ હમેશા સારું નહીં; કેટલીક વખત વધુ પગલાં સાથે ઓવરફિટિંગ થાય છે.

લર્નિંગ રેટ: સંરક્ષૂંક સ્તરે શરુ (1e-5 કે 2e-5). જો મોડેલ ખૂબ ઝડપથી શીખે તો તે તેની સામાન્ય સમજ ભૂલી શકે.

બેચ સાઇઝ: તમારી ક્વોટા મુજબ, પણ વધુ મહત્ત્વનું મૂળભૂત ડેટા ગુણવત્તા છે.

અન્ય-બંધ કરવું (અગાઉ અટકાવવી): જો Tinker API આપે તો તે ચાલુ કરો. તે એક રીતે 'અમે પહોંચ્યા કે નહિ?' સહાયક છે.

પગલું 5: દબદબાવાળા બગલા જેવું ટ્રેનિંગનું નિરીક્ષણ કરો - પણ શાંત બગલા

Tinker સામાન્ય રીતે લોગ્સ સ્ટ્રીમ કરે છે: ટ્રેનિંગ નુકસાન, મૂલ્યાંકન નુકસાન, અને કસ્ટમ મેટ્રિક્સ (જેમ કે Q&A માટે સચોટ મેળ) પણ તમને આપે. આ રીતે વાંચો:

ટ્રેનિંગ નુકસાન ઘટે અને મૂલ્યાંકન નુકસાન વધે/ફ્લેટ છે? તમે ઓવરફિટિંગ કરી રહ્યા છો—ટ્રેનિંગ જવાબો યાદ રાખો છો, નવા પ્રશ્નો માટે ખોટા જવાબો.

બન્ને ઘટી રહ્યા છે? રાસ્તે છે.

લોસ પોગો સ્ટિકના જેમ ઊછળતો હોય? તમારી લર્નિંગ રેટ વધારે અથવા ડેટાસેટ અસંગત હોઈ શકે.

જો Tinker ટ્રેનિંગ દરમ્યાન પૂર્વાવલોકન આપે તો કેટલાક પરીક્ષણ ઉદાહરણો ચકાસો અને ટોન/સચોટતા તપાસો. હા, આ ગુણવત્તામાં છે—પરંતુ તમે શૈલી ટ્રેન કરી રહ્યાં છો, ફિઝિક્સ ના નિયમ નહીં.

પગલું 6: નામ આપો, ડિપ્લોય કરો અને કોલ કરો

જ્યારે જૉબ પૂરી થાય ત્યારે Tinker API તમને મોડેલ ID આપે છે જેમ કે ft:tinker-large-1:support-tone-v1:abc123. પછી તમે તેને એન્ડપોઇન્ટ પાછળ લાગાડી શકો છો અને મૂળભૂત મોડેલ જેવો જ કોલ કરી શકો છો—પણ હવે તે તમારી ટીમ જેવી ભાષા બોલે છે.

ઉદાહરણ જનરેશન કોલ:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-large-1:support-tone-v1:abc123", "messages": [ {"role": "system", "content": "તમે સંક્ષિપ્ત, મૈત્રીપૂર્ણ સપોર્ટ એજન્ટ છો."}, {"role": "user", "content": "મારું રિફંડ મોડું છે અને હું રોષિત છું."} ], "temperature": 0.4 }'

જો તમારું મોડેલ વધુ વાતરૂપ કે વધારે ટૂંકું લાગે તો તમે ‘presence_penalty’ વધારે અથવા ‘temperature’ ઓછું કરી શકો. Tinker ના દસ્તાવેજો તરફાઓ આપે છે, નિર્ભય બનીને અજમાવજો.

પગલું 7: коच તરીકે મૂલ્યાંકન કરો, નિ્યાયક તરીકે નહીં

તમારે એક આપમેળે સ્કોરકાર્ડ અને માનવ જોબમાં મૂલ્યાંકન જોઈએ. આપમેળે મેટ્રિક્સ (BLEU, ROUGE, સાચું પરિણામ) સુસજ્જ છતાં ટોનને ઓળખી શકતું નથી. માનવો આ બાબતો પકડી શકે છે કે ‘આ ઉગ્ર લાગે છે’.

નાનું રૂબ્રિક બનાવો:

ટોન મેળવો (1–5)

સૂચના અનુસારનું પાલન (1–5)

તથ્યસંગતતા (1–5)

લંબાઈ નિયંત્રણ (1–5)

સુરક્ષા/આવ્ધિતતા (1–5)

તમારા હોલ્ડઆઉટ સેટમાંથી 50–100 આઉટપુટ નમૂનાઓ લવો. બે લોકોથી વિભાજીત રીતે રેટ કરાવો. જો કોઈ કેટેગરી 3થી નીચે આવે તો તે ડેટાસેટ પર જાઓ અને તે વર્તન દર્શાવતા વધુ ઉદાહરણો ઉમેરો.

પગલું 8: ખર્ચ અને કામગીરી: તમારી CFO અને સર્વર કેમ ચિંતિત હોય

Tinker API સાથે ફાઇન-ટ્યુનિંગ ખર્ચ ટ્રેનિંગ અને ઈન્ફરન્સ બે જગ્યાએ થાય છે. ટ્રેનિંગ એક-વારનું ઝડપભર્યું કાર્ય છે; ઈન્ફરન્સ દોડ જેવી છે.

ટોકન લંબાઈ ઘટાડો. ટૂંકા પ્રોમ્પ્ટ અને આઉટપુટ = ઓછા બિલ.

સિસ્ટમ પ્રોમ્પ્ટ ઉપયોગ કરો જે તમારી શૈલી પરથી ફ્રેમ કરે, પણ ભારે સૂચનાઓ દરેક કૉલ પર ન આપશો જો Tinker ડિપ્લોયમેન્ટ ડિફોલ્ટ આપે.

સામાન્ય પ્રોમ્પ્ટોને કેશ કરો જ્યાં શક્ય હોય.

રૂટિંગ સ્ટ્રેટેજી વિચારજો: આકાર્યક્ષમ મોટા ફાઇન-ટ્યુન મોડેલ જ ઉપયોગમાં લો; નહીંતર નાનું સસ્તું મોડેલ વાપરો.

લેટન્સી પણ મહત્વપૂર્ણ છે. જો તમારું ફાઇન-ટ્યુન મોડેલ ધીમું છે તો નાનું કન્ટેક્ષટ વિંડો અથવા નાનું મોડેલ વર્ગીકરણ માટે અને મોટું તે જ તરીકે ટેક્સ્ટ જનરેટ કરવા આપો.

પગલું 9: ટ્રબલશૂટિંગ: વાંધા અને ઉપાય

મોડેલ પોતાને પુનરાવર્તન કરે છે.

ટેમ્પરેચર ઘટાડો; ટૂંકા સ્પષ્ટ જવાબ સાથે ઉદાહરણ ઉમેરો; જો બીમ વિથ ઓપ્શન હોય તો તે ઓછુ કરો.

તે સૂચનાઓ અવગણે છે.

સિસ્ટમ પ્રોમ્પ્ટ મજબૂત બનાવો અને કડક સૂચના પાલન બતાવતા ટ્રેનિંગ ઉદાહરણો શામેલ કરો.

તે તથ્યોમાં જોવા મળતા ધૂકડાઓ કરે છે.

‘મને ખબર નથી’ જેવા ઉદાહરણો ઉમેરો અથવા સ્રોતો જોડો; ટેમ્પરેચર ઓછું કરો; રીટ્રીવલ સાથે જોડીને જવાબોની સ્થિરતા વધારો.

તે ખૂબ નમ્ર છે. (હા, આવું પણ થાય છે.)

ટ્રેનિંગ ઉદાહરણો ઉમેરો જે મર્યાદા નક્કી કરે અને નીતિઓ સ્પષ્ટ કરે—“અમે X કરી શકતા નથી, પરંતુ અહીં Y છે.”

ટ્રેનિંગ અડધામાં જ નિષ્ફળ જાય છે.

ડેટાસેટ માન્યતા, અપ્રાકૃતિક અક્ષરો અનેmaxlength token ચકાસો. નાનું બેચ સાઇઝ અથવા ઓછા ઇપોક્સ અજમાવો.

પગલું 10: ક્યારે ફાઇન-ટ્યુન કરવું અને ક્યારે પ્રોમ્પ્ટ કે રીટ્રીવલ વાપરવું

મને ફાઇન-ટ્યુનિંગ પસંદ છે, પરંતુ બસ એજ સાધન નથી. ત્રણ સામાન્ય રીતો:

પ્રોમ્પ્ટ એન્જિનિયરિંગ: સસ્તું, ઝડપી. માત્ર ટોન અથવા સરળ ધોરણ માટે ઉત્તમ.

રીટ્રીવલ-એજમેન્ટેડ જનરેશન (RAG): તાજી માહિતી અને મોટા જ્ઞાન સંગ્રહો માટે શ્રેષ્ઠ. મોડેલ દિલ્હીનો સમય પર તમારી દસ્તાવેજો વાંચે છે.

ફાઇન-ટ્યુનિંગ: શૈલી, બંધારણ અને ડોમેન પેટર્ન માટે શ્રેષ્ઠ જે દરરોજ બદલાતા નથી.

જ્યારે જીતનાર મિશ્રણ હોય છે: RAGથી તથ્યો મેળવો અને તેને ફાઇન-ટ્યુન મોડેલને આપો જેથી તે તમારી અનન્ય અવાજમાં જવાબ આપે.

એક ઝડપી Tinker API ટ્યુટોરિયલ કે જે તમે કૉપિ-પેસ્ટ કરી શકો

અહીં એક સમન્વયિત, કલ્પિત પગલાં છે જે Tinker પ્રકારના ઘણા પ્લેટફોર્મો માટે સામાન્ય છે. એન્ડપોઈન્ટ અને આઈડીને તમારી વાસ્તવિક સાથે બદલો.

ડેટાસેટ બનાવો અને અપલોડ કરો

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune"

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval"

ફાઇન-ટ્યુનિંગ શરૂ કરો

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-medium-1", "dataset_id": "ds_train", "eval_dataset_id": "ds_eval", "epochs": 4, "learning_rate": 2e-5, "suffix": "email-summarizer-v1" }'

લોગ્સ સ્ટ્રીમ કરો

curl -N -H "Authorization: Bearer $TINKER_KEY"

ફાઇન-ટ્યુન મોડેલ વાપરો

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-medium-1:email-summarizer-v1:xyz", "prompt": "આ ઇમેઇલને બે બિંદુઓમાં સારાંશ કરો, મિત્રો જેવા ટોનમાં:\n\n[IMEL PASTE KARO]", "max_tokens": 160, "temperature": 0.4 }'

વ્યવહારિક પરિસ્થિતિઓ: શું થાય જ્યારે…

તમે તમારાં સપોર્ટ માક્રોઝ પર ફાઇન-ટ્યુન કરો

અચાનક તમારું AI એ જ બંધારણમાં જવાબ આપે છે જેમ તમારી એજન્ટ્સ આપે: માફી, કાર્યવાહી, અનુસરણ. CSAT વધારે થાય છે કેમ કે લોકો આશ્ચર્ય કરતાં સુસંગતતા વધુ પસંદ કરે છે.

તમે તમારાં બ્રાન્ડ અવાજ પર ફાઇન-ટ્યુન કરો

મોડેલ તમારું 'અમે મદદરૂપ પણ ગ્રહણશીલ નથી' શૈલી ઓળખી લે છે. તે 17-એક્સક્લેમેશન માર્ક enthusiasms ટાળે છે. માર્કેટિંગ માણે.

તમે કોડ સૂચનો માટે ફાઇન-ટ્યુન કરો

કાર્ય વર્ણનના દંપતીઓ અને આદર્શ કોડ સ્નિપેટ્સ આપો. ઉદાહરણો ટૂંકા અને કેન્દ્રિત રાખો; અવાજવાળા કોડથી અવાજવાળું પૂર્ણ થાય છે.

તમે વર્ગીકરણ માટે ફાઇન-ટ્યુન કરો

હા, તમે કરી શકો. લેબલવાળા ઉદાહરણ આપો અને ટૂંકા પ્રોમ્પ્ટ્સ સાથે મોડેલને કોલ કરો. સ્ટ્રીક્ટ લેબલ્સ માટે ટેમ્પરેચર શૂન્ય કરો.

સુરક્ષા પહેલું, છેલ્લું અને હંમેશા

જો તમારું ઉપયોગ સંવેદનશીલ કે નિયમિત ક્ષેત્રોને સ્પર્શે તો સ્પષ્ટ મર્યાદાઓ સિસ્ટમ પ્રોમ્પ્ટ અને તાલીમ ડેટામાં મૂકો. નમ્રતાપૂર્વક નામંજુર કરવાના ઉદાહરણો ઉમેરો. આઉટપુટ લૉગ કરો અને વપરાશકર્તાઓને સમસ્યાઓ રિપોર્ટ કરવાની મંજૂરી આપો. ફાઇન-ટ્યુન મોડેલ વિશ્વાસભર્યું, પરંતુ સાવધાનીથી વર્તે તે જ રીતે ટ્રેન કરો.

ક્યાં Sider.AI કામમાં આવે (અને ક્યાં નહીં)

આ એક આશ્ચર્ય છે: Sider.AI તમારા માટે Tinker API કેવી રીતે વાપરવું તે શીખતી વખતે એક સારું સાથીદારો બની શકે છે. તે એ રીતે છે જેમ કે એક કાળજીભર્યો કોપાઇલટ જે દસ્તાવેજો વાંચે અને ફરિયાદ કરતો નથી. તમે Sider ની સાઇડબાર માં ડેટાસેટ ઉદાહરણો ડ્રાફ્ટ કરી શકો છો જ્યારે તમે તમારા ઈમેઇલ અથવા જ્ઞાનભંડાર જોઈ રહ્યા હોય, અને પછી સાફ, અનુસૂચિત JSONL નિકાસ કરી શકો. તે ટ્રેનિંગ જૉબ ચલાવતું નથી—એ Tinkerનું કામ છે—પણ ઉદાહરણો તૈયાર કરવા, પુનર્લેખન અને ક્યૂએ માટે તે અદ્ભુત છે. તેને પૂછો, “આ જવાબને શાંતિભર્યા, સરળ અંગ્રેજી ટોનમાં બે વાક્યોમાં ફરી લખો,” અને જોઈ જુઓ કે તમારું ડેટાસેટ ગુણવત્તા કેવી રીતે વધે છે.

જેણાં વિષે મને કોઈએ કહ્યુ નહોતું

વધુ ડેટા હંમેશા સારું નથી—વધુ પ્રતિનિધિ ડેટા સારું છે.

ટોન પર ઓવરફિટ નહીં કરો. થોડા વાઇલ્ડકાર્ડ ઉદાહરણો રાખો જેથી મોડેલ જલાદી કલાકારો જેમ નવા વિચાર સાથે રચી શકે.

બધું વર્ઝનિંગ કરો: ડેટાસેટ v1.1, મોડેલ v1.2, પ્રોમ્પ્ટ ટેમ્પ્લેટ v3.0. ભાવિ-તમે તમારું આભાર માનશે.

રોલબૅક બટન રાખો. જો નવું ફાઇન-ટ્યુનિંગ ખોટું જાય તો ઝડપથી પહેલાનું મોડેલ ફરી ડિપ્લોય કરો.

જયારે મૂલ્યાંકન કરો ત્યારે વપરાશકર્તા દ્વારા કરાયેલા ખરાબ નથી, પરંતુ વાસતવિક વપરાશકર્તા પ્રોમ્પ્ટ લઈ મૂલ્યાંકન કરો. વપરાશકર્તા કાવ્યકાર નિવૃત્તિના કવિઓ છે.

અન્ય એક તમને…

Tinker API સાથે ફાઇન-ટ્યુનિંગ Skynet બનાવવા માટે નથી. તે rough એજ બજાવવાનું છે જેથી તમારું AI તમારી ટીમ જેવી લાગણી આપેએ. નાનાથી શરૂ કરો, કડક માપો અને ઓળખો જ્યારે સરળ રીત (જેમ કે વધારે યોગ્ય પ્રોમ્પ્ટ્સ) કામ કરે.

કેમ કે જ્યારે તમારું AI આખરે તમારા જેવો જવાબ આપે? એ માત્ર કાર્યક્ષમતા નથી. એ સમજદારી છે.

ચીટ શીટ

તમારું AI મોડેલ ફાઇન-ટ્યુન કરવા માટે Tinker API કેવી રીતે વાપરવું: સાફ, અનુસૂચિત JSONL પેઅર્સ તૈયાર કરો; અપલોડ કરો; યોગ્ય ડિફૉલ્ટ સેટિંગ સાથે ફાઇન-ટ્યુન શરૂ કરો; માનવ અને મેટ્રિક્સ સાથે મૂલ્યાંકન કરો; ડિપ્લોય કરો અને પુનરાવર્તન કરો.

શૈલી અને સ્થિર પેટર્ન માટે ફાઇન-ટ્યુન ઉપયોગ કરો; તાજા તથ્યો માટે રીટ્રીવલનો ઉપયોગ કરો.

ટૂંકા પ્રોમ્પ્ટ્સ, નાનું મોડેલ અને રૂટિંગથી ખર્ચ નિયંત્રિત કરો.

તમારા ડેટાસેટને સુરક્ષા માટે વિશિષ્ટ બનાવો.

Sider.AI જેવા ટૂલ્સને ટ્રેનિંગ પહેલાં સુંદર ઉદાહરણો બનાવવામાં મદદ કરો.

FAQ

Q1: હું Tinker API સાથે મને પોતાનું AI મોડેલ ફાઇન-ટ્યુન કરવા માટે ડેટા કેવી રીતે તૈયાર કરું? જવાબ: JSONL ફોર્મેટમાં સ્પષ્ટ સૂચના-પ્રતિસાદ કે ચેટ-શૈલીના જોડીનો ઉપયોગ કરો. ટોન એકસમાન રાખો, સંવેદનશીલ માહિતી એનોનિમાઇઝ કરો અને 10–20% ડેટા ટેસ્ટ માટે અલગ રાખો જેથી તમે ખોટા પ્રમાણમાં મોડેલને બુદ્ધિમાન ન માનશો.

પ્રશ્ન 2: શું ટિંકર API સાથે ફાઇન-ટ્યુનિંગ પ્રોમ્પ્ટ એન્જિનિયરિંગ કરતાં વધુ સારું છે? ઝડપી ટોન ટ્વીક્સ અને સરળ વર્તણૂકો માટે પ્રોમ્પ્ટ્સનો ઉપયોગ કરો; જ્યારે તમારે ટકાઉ શૈલી, માળખું અથવા ડોમેન પેટર્નની જરૂર હોય ત્યારે ફાઇન-ટ્યુનિંગનો ઉપયોગ કરો. ઘણી ટીમો બંનેને જોડે છે - તથ્યો માટે RAG, વોઇસ માટે ફાઇન-ટ્યુન.

પ્રશ્ન 3: ટિંકર API સાથે મોડેલને ફાઇન-ટ્યુન કરવા માટે મારે કેટલો ડેટા જોઈએ છે? ગુણવત્તા જથ્થાને માત આપે છે. થોડા સો મજબૂત ઉદાહરણો હજારો ઘોંઘાટીયા ઉદાહરણો કરતાં વધુ સારો દેખાવ કરી શકે છે. નાનું શરૂ કરો, મૂલ્યાંકન કરો, પછી લક્ષિત ઉદાહરણો ઉમેરો જ્યાં મોડેલ સંઘર્ષ કરે છે.

પ્રશ્ન 4: હું ટિંકર API માં ફાઇન-ટ્યુન કરેલ મોડેલને કેવી રીતે જમાવી શકું? તાલીમ પછી, ટિંકર એક મોડેલ ID પરત કરે છે જેને તમે પ્રમાણભૂત પૂર્ણતાઓ અથવા ચેટ એન્ડપોઇન્ટ દ્વારા કૉલ કરી શકો છો. મદદરૂપ સિસ્ટમ પ્રોમ્પ્ટ સેટ કરો, તાપમાનને ટ્યુન કરો અને વાસ્તવિક ટ્રાફિકમાં આઉટપુટનું નિરીક્ષણ કરો.

પ્રશ્ન 5: હું મારા ફાઇન-ટ્યુન કરેલા મોડેલને આભાસી થવાથી કેવી રીતે રોકી શકું? અનિશ્ચિતતાને સ્વીકારતા ઉદાહરણો સાથે તાલીમ આપો, તાપમાન ઓછું કરો અને તથ્યો માટે પુનઃપ્રાપ્તિ સાથે જોડો. "સ્ત્રોતો ટાંકો" અથવા "કહો કે તમને ખબર નથી" ને સૂચના અને તાલીમ ડેટાનો ભાગ બનાવો.