How do I prepare data to fine-tune my own AI model with Tinker API?

Use JSONL with clear instruction–response or chat-style pairs. Keep tone consistent, anonymize sensitive info, and hold out 10–20% for testing so you don’t fool yourself with inflated scores.

Is fine-tuning with Tinker API better than prompt engineering?

Use prompts for quick tone tweaks and simple behaviors; use fine-tuning when you need durable style, structure, or domain patterns. Many teams combine both—RAG for facts, fine-tune for voice.

How much data do I need to fine-tune a model with Tinker API?

Quality beats quantity. A few hundred strong examples can outperform thousands of noisy ones. Start small, evaluate, then add targeted examples where the model struggles.

How do I deploy a fine-tuned model in Tinker API?

After training, Tinker returns a model ID you can call via the standard completions or chat endpoint. Set a helpful system prompt, tune temperature, and monitor outputs in real traffic.

How do I stop my fine-tuned model from hallucinating?

Train with examples that admit uncertainty, lower temperature, and pair with retrieval for facts. Make “cite sources” or “say you don’t know” part of the instruction and the training data.

మీ AI వాయిస్ వాతావరణ యంత్రం లాగా కాకుండా… మీలా వినిపిస్తుందని ఎప్పుడైనా కోరుకున్నారా?

ఇలా అనుకోండి: మీరు మీ AIని కస్టమర్ ఇమెయిల్‌ను సరాంశం చేయమని అడుగుతారు, అది షిప్పింగ్ ఫోర్కాస్ట్ చెప్పినట్లుగా స్పందిస్తుంది. సాంకేతికంగా సరైనది, కానీ ఉపయోగకరంగా కాదు. మీరు నిజంగా కోరేది మీ AI—మీ టోన్, మీ భాష, మీ ఇష్టాలు—అందుకోడానికి మీ గ్యారేజ్‌లో పరిశోధనా ప్రదేశం నిర్మించాల్సిన అవసరం లేకుండా.

ఇక్కడ ఫైన్-ట్యూనింగ్ వస్తుంది. మీరు 'Tinker API' గురించి వినిపించినట్లయితే, మీరు సరైన చోటున్నారు. ఇది Tinker APIతో మీ స్వంత AI మోడల్‌ను ఫైన్-ట్యూన్ చేసుకోవడానికి ఎలా అనేది గైడ్.

మేము పూర్తి ప్రక్రియను తెలుసుకుంటాం: ఫైన్-ట్యూనింగ్ అంటే ఏమిటి, మీ డేటాను ఎలా తయారు చేయాలి, Tinker APIతో ఫైన్-ట్యూన్ ఎలా చేయాలి, ఇంకా బడ్జెట్ లేదా సహనం ఖర్చు కాకుండా ఉండటానికి సూచనలు. మీరు ఎక్కడ జాగ్రత్త పెట్టాలి అనేది కూడా చెప్తాను—ఫైన్-ట్యూనింగ్ శక్తివంతమైనది, కానీ ఒక ఫెయిరీ గాడ్‌మదర్ కాదు.

కీవర్డ్స్ గురించి: 'Tinker API ఎలా ఉపయోగించాలి' అనే ప్రశ్నను చాలా ఉర్దూ తిరుగుతాం, ఎందుకంటే మీరు కొనుగోలు చేసిన ప్రశ్న అది. అలాగే 'ఫైన్-ట్యూన్ యోర్ ఓన్ AI మోడల్,' 'Tinker API ట్యుటోరియల్,' 'డేటాసెట్ ప్రిపరేషన్ ఫర్ ఫైన్-ట్యూనింగ్,' 'డిప్లాయింగ్ ఎ ఫైన్-ట్యూన్డ్ మోడల్' వంటి పదాలు కలిపి చెప్పనున్నాం. ఇది ఎక్కువగా అనిపిస్తుంటే, చింతించకండి—నేను దీన్ని సులభంగా, మనుష్యానికోసం మార్చుతాను.

ఫైన్-ట్యూనింగ్ అంటే ఏమిటి — మరియు అది ఏమి కాదు

జనరల్ AI మోడల్ ఒక స్విస్ ఆర్మీ కత్తి అయితే, ఫైన్-ట్యూనింగ్ అంటే 'కత్తి, మేము నిన్ను ప్యాకేజ్లు తెరవడంలో చాలా మంచిగా చేస్తాం' అని చెప్పటంలా ఉంటుంది. మీరు కత్తిని సృష్టించడం కాదు, మీరు మీ ఇష్టమైన కాగితాన్ని నేర్పిస్తున్నారు.

ప్రాక్టికల్‌గా, ఫయిన్-ట్యూనింగ్ అంటే మీరు ఒక బేస్ మోడల్ (ఇంటర్నెట్ టెక్స్ట్‌లపై ముందే శిక్షణ పొందినది) తీసుకుని, మీ ఉదాహరణలతో—మీ రచనా శైలి, డొమైన్-స్పెసిఫిక్ ప్రశ్నలు, సపోర్ట్ స్క్రిప్టులు—తప్పక స్పందించడానికి అలా మారుస్తారు. ఇది మోడల్‌కు స్టైల్ గైడ్ మరియు ప్రాక్టీస్ క్విజ్‌ల stack ఇవ్వడంలా ఉంటుంది.

కానీ ఫైన్-ట్యూనింగ్ ఒక మాంత్రికాలు కాదు. అది ట్రైనింగ్ డేటాలో లేని వివరాలు వెంటనే నేర్చుకోదు. పెద్ద ప్రైవేటు డాక్యుమెంట్లను 'మరచిపోదు'—మీరు ప్రతినిధి స్నిపెట్‌లు ఇవ్వాలి. మరియు మీరు డేటా గందరగోళంగా, విరుద్ధంగా లేదా చిన్నదిగా ఉంటే, మీ మోడల్ ఆ అలవాట్లను తీసుకుంటుంది, ఒక టీనేజర్ రాక్ బ్యాండ్ డ్రమ్మర్ టెంపో తెలియజేసినట్లుగా.

తేలికైన పనుల జాబితా

Tinker APIతో మీ స్వంత AI మోడల్ ఫైన్-ట్యూన్ చేసుకోవడానికి పంచతత్వ దృక్పథం ఇక్కడ:

Tinker APIలో ఒక బేస్ మోడల్ ఎంచుకోండి.

ప్రాంప్ట్స్ మరియు ఇడియల్ రిప్లైలతో శుభ్రంగా సమతుల్య డేటాసెట్ తయారు చేయండి.

మీ డేటాసెట్ Tinkerకు అప్‌లోడ్ చేయండి.

స్పష్టమైన హైపర్‌పారామీటర్లు తో ఫైన్-ట్యూనింగ్ జాబ్ క్రియేట్ చేయండి.

ట్రైనింగ్‌ను పర్యవేక్షించండి, హోల్డ్-ఔట్ టెస్ట్ సెట్‌తో ఫలితాలు మూల్యాంకనం చేయండి.

ఫైన్-ట్యూన్డ్ మోడల్‌ను ప్రొడక్షన్‌లో డిప్లాయ్ చేయండి మరియు కాల్ చేయండి.

వింతలు కనపడితే మళ్లీ ప్రయత్నించండి.

ప్రతి దశలో సహాయక కోడ్ ఉదాహరణలతో మరియు నేను స్క్రీన్‌పై అరవకుండా ఉండటానికి అనుసరించిన చిట్కాలతో సడలింపు.

దశ 1: బేస్ మోడల్‌ను వాడుకునే రెంటల్ కార్లా ఎంచుకోండి

మాంహట్టన్‌లో పారలల్ పార్కింగ్ కోసం 15 సీటర్ల వెన్ తీసుకోరు. అంతేలా, మీకు వేగవంతమైన, తక్కువ ఖర్చు రిప్లైలు కావాలంటే భారీ మోడల్ ఎంచుకోవద్దు. Tinker API సాధారణంగా కొన్ని మోడల్ ఫ్యామిలీస్ అందిస్తుంది—లైట్‌వెయిట్, మిడ్-సైజ్, మరియు 'అహా, అది తెలివైనది'.

వేగం మరియు ఖర్చు ఆదా కావాలంటే: చిన్న బేస్ ఎంచుకోండి.

సూక్ష్మత, తార్కికత లేదా దీర్ఘరేఖ వ్రాత అవసరమైతే: పెద్ద బేస్ ఎంచుకోండి.

మీ డొమైన్‌లో బాగా జార్గన్ ఉంటే (మెడికల్, లీగల్, సపోర్ట్ మాక్రోస్): మధ్య నుండి పెద్ద మోడల్స్ ఫైన్-ట్యూన్ చేయడం మరింత ఫలితప్రదం.

ప్రొ టిప్: ప్రొటోటైపు కోసం చిన్నదానితో మొదలు పెట్టండి. ముఖ్యమైన అంకెలు పెరిగితే, అదే డేటాసెట్‌ను పెద్ద బేస్‌లోకి మార్చండి.

దశ 2: మీ డేటాసెట్‌ను రెసిపీ కార్డ్‌లా, కుంపె పెట్టెలా కాకుండా సిద్ధం చేయండి

మీ డేటాసెట్ క్వాలిటీకి ఏకైక పెద్ద షక్తి. మోడల్ అనుకరణ ద్వారా నేర్చుకుంటుంది; ఉదాహరణలు అస్పష్టమైతే, మోడల్ అస్పష్టంగా నేర్చుకుంటుంది. స్పష్టంగా, సెకండ్, మరియు వైవిధ్యంగా ఉంటే, మీ మోడల్ సహాయక సహోద్యోగి లాంటిది అవుతుంది.

సూచనలు-ప్రత్యుత్తర జంటలతో JSONL (JSON లైన్స్) ఫార్మాట్‌లో ఉంచండి. చాల్-స్టైల్ ఫైన్-ట్యూనింగ్ కోసం system/user/assistant వంటి పాత్రలను చేర్చండి. ప్రతి ఉదాహరణను చిన్నదో మిధ్యమో ఉంచండి; చాలా రకమైన మెళకువలతో పన్ను మంచి.

ఉదాహరణ (సూచన-శైలి):

{"instruction": "ఈ సపోర్ట్ టికెట్‌ను 2 వాక్యాలలో స్నేహపూర్వక శైలిలో సరాంశం చెయ్యి.", "input": "కస్టమర్ 'ట్రాక్ ఆర్డర్' పై క్లిక్ చేస్తే 404 ఎర్రర్ ఉంటుందని చెప్తున్నారు", "output": "ధన్యవాదాలు ఇది తెలియపెట్టినకి! కస్టమర్లు 'ట్రాక్ ఆర్డర్' పై క్లిక్ చేస్తే వెబ్‌సైట్ 404 చూపిస్తోంది. మేము ఆర్డర్-ట్రాకింగ్ పేజీలోని లింక్ సరికాదని పరిశీలిస్తున్నాం; త్వరలో పరిష్కారం ఇస్తాం."}

ఉదాహరణ (చాట్-స్టైల్):

{"messages": [ {"role": "system", "content": "మీరు సారాంశంగా, స్నేహపూర్వక సపోర్ట్ ఏజెంట్. సాధారణ ఆంగ్ల భాషను వాడండి."}, {"role": "user", "content": "నా సబ్స్క్రిప్షన్ రీన్యూ అయింది కానీ కార్డ్ కాలాజీ అయింది. సహాయం చేస్తారా?"}, {"role": "assistant", "content": "సమస్యకు క్షమించండి! నేను మీ ప్లాన్‌ని తిరిగి తనిఖీ చేసాను—రిన్యువల్ కాలని కార్డ్‌తో ప్రయత్నం జరిగింది. దయచేసి మీ బిల్లింగ్ పేజీలో కార్డ్‌ని నవీకరించండి; అది సేవ్ అయిన తరువాత నేను రీచార్జ్ ప్రయత్నిస్తాను."} ]}

ఫైన్-ట్యూనింగ్ డేటాసెట్ తయారీలో చిట్కాలు:

కన్సిస్టెన్సీ అత్యంత ముఖ్యం. ఎప్పుడూ అదే టోన్, సంతకాల్లు, మరియు నిర్మాణం వాడండి.

మీ టాపిక్స్‌ను బ్యాలన్స్ చేయండి. 90% ఉదాహరణలు రిఫండ్‌లై ఉంటే, మీ మోడల్ రీఫండ్ ఫ్యారీ అవుతుంది.

మురికి సందర్భాలను లేబుల్ చేయండి. నెగటివ్ ఉదాహరణలు చేర్చండి (ఏం చెప్పకూడదు), ఇది Tinker APIలో ప్రిఫరెన్స్ సిగ్నల్ ఉంటే సహాయపడుతుంది.

భద్రంగా ఉంచండి. వ్యక్తిగత డేటాను తీసివేయండి. సున్నితమైన సమాచారం ఉంటే అనామకరింపు లేదా సింథసిస్ చేసుకోండి.

10-20% డేటాను పరీక్షా సెట్‌గా వదిలేయండి. ట్రైనింగ్ సెట్‌పై గ్రేడ్ చేస్తే, మీరు మీ మోడల్‌ను అతి తెలివైనది అనుకుంటారు. నాకు తెలుసు ఎందుకు అని అడగండి.

దశ 3: Tinker APIకి మీ డేటాను తోడాద बिना బాధల వల్ల అప్‌లోడ్ చేయండి

చాలా ఫైన్-ట్యూనింగ్ ప్లాట్‌ఫారమ్‌లు స్టోరేజ్ ఎండ్పాయింట్‌ను అందిస్తాయి. Tinker APIలో సాధారణంగా:

డేటాసెట్ రిసోర్సును సృష్టించండి (ఉదాహరణకు, POST /datasets)

మీ JSONL ఫైలు అప్‌లోడ్ చేయండి

స్కీమాను వాలిడేట్ చేయండి (Tinker సాధారణంగా ఆల్ రిపోర్ట్ ఇస్తుంది: సరైన కౌంట్లు,లోపాలు, విచిత్ర ఫీల్డ్స్)

ఉదాహరణ (కర్‌ల్-స్టైల్):

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"

Tinker API CLI కి మద్దతు ఉంటే, జీవితం సులభం అవుతుంది:

అప్‌లోడ్ చేయండి

tinker datasets upload my_finetune_data.jsonl --purpose finetune

వాలిడెట్ చేయండి

tinker datasets validate DATASET_ID

వాలిడేషన్ లోపాలు మిమ్మల్ని రక్షిస్తాయి. అవి కొంచెం కఠినంగా అనిపిస్తాయంటే, కాని రాత్రిలో ట్రైనింగ్ లోపాల నుంచి మిమ్మల్ని కాపాడతాయి.

దశ 4: ఫైన్-ట్యూన్ జాబ్ ప్రారంభించి సవ్యమైన సెట్టింగ్స్ ఎంచుకోండి

మీరు మీ డేటాసెట్ను మరియు ఎంచుకున్న బేస్ మోడల్‌ను పాయింట్ చేసే జాబ్‌ను ప్రారంభిస్తారు. Tinker API ఫైన్-ట్యూనింగ్ ఎండ్పాయింట్లు epochs, learning rate, batch size, మరియు evaluation frequency వంటి పారామీటర్లను అంగీకరిస్తాయి. అర్థం: మీ డేటాకు ఎన్ని సార్లు పాస్ ఇవ్వాలి, మోడల్ ఎంత వేగంగా నేర్చుకోవాలి, ఎన్ని ఉదాహరణలు ఒకసారి చదవాలి, మరియు ఎన్ని సార్లు ప్రగతి నివేదిక చూపాలి.

ఉదాహరణ అభ్యర్థన:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-large-1", "dataset_id": "ds_abc123", "epochs": 3, "learning_rate": 1e-5, "batch_size": 8, "eval_dataset_id": "ds_eval789", "suffix": "support-tone-v1" }'

సవ్యమైన డిఫాల్ట్స్:

Epochs: చిన్న నుండి మధ్యాన్య డేటాసెట్ కోసం 3–5. ఎక్కువ యత్నాలు ఎప్పుడు మంచి అయినా అవసరం కాదు; కొన్నిసార్లు అది ఓవర‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ఫిట్టింగ్ ఫలితం.

Learning rate: సంయమనం తో మొదలు పెట్టండి (1e-5 లేదా 2e-5). మోడల్ చాలా త్వరగా నేర్చుకుంటే, దాని సాధారణ తెలివితేటలు మర్చిపోతుంది.

Batch size: మీ క్వోటా అనుమతించే మేరకు, కానీ దీని మీద ఎక్కువ ఫోకస్ పెట్టకండి—పర్ఫార్మెన్స్ ముఖ్యంగా మంచి డేటాకి ఉంటుంది.

Early stopping: Tinker API అందిస్తే, దీన్ని యాక్టివేట్ చేయండి. ఇది 'మళ్ళీ వెళ్లామా?' అంటున్న మిషీన్ లెర్నింగ్ ఫీచర్.

దశ 5: శిక్షణను గ్రహిస్తూ పర్యవేక్షించండి

Tinker సాధారణంగా లాగ్స్ ను స్ట్రీమ్ చేస్తుంది: ట్రైనింగ్ లాస్, ఈవాల్యుయేషన్ లాస్, మరియు మీరు నిర్వచించిన స్టాండర్డ్ మీట్రిక్స్ (ఉదా: Q&Aకి ఎక్సాక్ట్ మ్యాచ్). ఇక్కడ తెలివిగా చూడటం ఎలా:

ట్రైనింగ్ లాస్ తగ్గుతూ, ఈవాల్ను లాస్ స్థిరంగా లేదా పెరుగుతుంటే? మీరు ఓవర్‌ఫిటింగ్ చేస్తున్నారు—మీ ట్రైనింగ్ జవాబులను మర్చిపోకుండా జ్ఞాపకం పట్టుకుంటున్నారు కానీ కొత్త వాటిని తప్పుతారు.

రెండు కూడా తగ్గుతున్నట్లైతే? మీరు సరైన దిశలో ఉన్నారు.

లాస్ తలపడుతూ పరిగెత్తితే? మీ లెర్నింగ్ రేటు ఎక్కువగా ఉండొచ్చు, లేదా డేటాసెట్ అస్థిరంగా ఉండొచ్చు.

Tinker మధ్యలో ప్రివ్యూ జనరేషన్ ఇచ్చితే, కొంత పొందిన అవుట్పుట్‌ను అంధంగా చూడండి. పర్‌ఫార్మెన్స్, టోన్, నిర్ధారిత విధంగా అంచనా వేయండి. అవును, ఇది సబ్జెక్టివ్, కానీ మీరు శైలిని శిక్షణ ఇస్తున్నారు, ఫిజిక్స్ సిద్ధాంతాలు కాదు.

దశ 6: పేరు పెట్టండి, డిప్లాయ్ చేయండి, కాల్ చేయండి

జాబ్ పూర్తయిన తర్వాత, Tinker API మీకు ఫైన్-ట్యూన్ మోడల్ ID ఇస్తుంది, ఉదా: ft:tinker-large-1:support-tone-v1:abc123. అందును డిప్లాయ్ చేసి, బేస్ మోడల్ లాగే కాల్ చేయండి—ఇప్పుడు మీ జట్టు స్టైల్లో మాట్లాడుతుంది.

ఉదాహరణ జనరేషన్ కాల్:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-large-1:support-tone-v1:abc123", "messages": [ {"role": "system", "content": "మీరు సారాంశంగా, స్నేహపూర్వక సపోర్ట్ ఏజెంట్."}, {"role": "user", "content": "నా రీఫండ్ ఆలస్యం అవుతుంది, నేను ఇబ్బంది పడుతున్నాను."} ], "temperature": 0.4 }'

మీ మోడల్ ఎక్కువ మాటలు మాట్లాడితే లేదా కాస్త తక్కువ పాయం ఉంటే 'presence_penalty' పెంచండి లేదా 'temperature' తగ్గించండి. Tinker డాక్యుమెంట్స్ అన్ని నియంత్రణల వివరాలు ఇస్తాయి—పరీక్షించ భయపడకండి.

దశ 7: కోచ్ లా మూల్యాంకనం చేయండి, తీర్పుదారు లాగా కాదు

మీకు ఆటోమేటిక్ స్కోర్కార్డ్ మరియు మానవ స్కోర్ కావాలి. ఆటో మీట్రిక్స్ (BLEU, ROUGE, accuracy) సరిగా ఉంటాయి కానీ టోన్ కనిపెట్టలేవు. మానవులు 'ఇది కొంచెం కోపంగా ఉంది' వంటి అంశాలను కనుగొంటారు.

స్నేహపూర్వక రుబ్రిక్ సెట్ చేయండి:

టోన్ మ్యాచ్ (1–5)

సూచనలు అనుసరించడం (1–5)

వాస్తవికత (1–5)

పొడవుతో నియంత్రణ (1–5)

భద్రత/అనుపాలన (1–5)

హోల్డ్-ఔట్ సెట్ నుండి 50–100 అవుట్‌పుట్లు ఎంపిక చేసుకుని, ఇద్దరు వ్యక్తులు వేరుగా రేటింగ్ ఇవ్వండి. ఒక క్యాటగిరీ మాధ్యమం 3 కంటే తక్కువ అయితే, మీ డేటాసెట్‌లను తిరిగి చూడండి మరియు కావలసిన ప్రవర్తన చూపించే మరిన్ని ఉదాహరణలు చేర్చండి.

దశ 8: ఖర్చు మరియు పనితనం: మీ CFO మరియు సర్వర్ పట్టుకునే విషయాలు

Tinker APIతో ఫైన్-ట్యూనింగ్‌కు రెండు చోట్ల ఖర్చు వస్తుంది: ట్రైనింగ్ మరియు ఇన్ఫరెన్స్. ట్రైనింగ్ ఒకసారి జరిగే వేగం; ఇన్ఫరెన్స్ మారథాన్ లాంటిది.

టోకెన్ పొడవును తగ్గించండి. చిన్న ప్రాంప్ట్‌లు మరియు అవుట్పుట్లు అంటే తక్కువ బిల్లు.

మీ శైలిని మీరు ఇచ్చే సిస్టమ్ ప్రాంప్ట్ ఉపయోగించండి, కానీ ప్రతిసారీ భారీ సూచనలు ఇవ్వవద్దు, Tinker డిప్లాయ్‌మెంట్ స్థాయి డిఫాల్ట్ మద్దతిస్తే.

ప్రముఖ ప్రాంప్ట్‌లను క్యాచ్ చేయండి, అందుకే అవసరమైన చోటాలే తిరిగి వాడుకోండి.

రూటింగ్ స్ట్రాటజీ కన్సిడర్ చేయండి: మీ ఫైన్-ట్యూన్ పెద్ద మోడల్‌ను అవసరం ఉన్నప్పుడు మాత్రమే వాడండి; లేకపోతే చిన్న మరియు చౌకైనదిని వాడండి.

లేటెన్సీ కూడా ముఖ్యం. ఫైన్-ట్యూన్ మోడల్ నెమ్మదిగా ఉంటే, చిన్న కాన్టెక్స్ట్ విండోస్ వాడండి, లేదా క్లాసిఫికేషన్‌కు చిన్న మోడల్ మరియు జనరేటివ్ టెక్స్ట్‌కు పెద్దది వాడండి.

దశ 9: సమస్యలు: గ్రెంలిన్స్ ప్రధాన సమస్యలు

మోడల్ స్వరంగా మరియొకటే మాటలు పునరావృతం చేస్తుంది.

టెంపరేచర్ తగ్గించండి; స్పష్టమైన, చిన్న జవాబులతో ఉదాహరణలు జోడించండి; బీమ్ వెడ్త్ ఉంటే దాన్ని తగ్గించండి.

ఇన్‌స్ట్రక్షన్స్‌ను పట్టించుకోదు.

సిస్టమ్ ప్రాంప్ట్ బలపరిచండి మరియు కఠిన ఇన్‌స్ట్రక్షన్ అనుసరించే ట్రైనింగ్ ఉదాహరణలు చేర్చండి.

అవాస్తవాలు ధైర్యంగా హెచ్చుకుంటుంది.

'నాకు తెలియదు' చెప్పే ఉదాహరణలు చేర్చండి లేదా మూలాలకు లింక్ చేయండి; టెంపరేచర్ తగ్గించండి; రెట్రీవల్ తో జత చేసుకోండి.

అత్యధిక స్నేహపూర్వకంగా ఉంటుంది (అది ఒక విషయం).

పాలసీలను క్లారిఫై చేసే మరియు బౌండరీలు చూపించే ట్రైనింగ్ ఉదాహరణలు జోడించండి—"మేము X చేయలేము, కానీ Y ఇస్తాము."

ట్రైనింగ్ మధ్యలో ఫెయిలవుతుంది.

డేటాసెట్ వాలిడేషన్, విచిత్ర అక్షరాలు, టోకెన్ పరిమితులు తనిఖీ చేయండి. చిన్న బ్యాచ్ సైజ్ లేదా తక్కువ epochs ప్రయత్నించండి.

దశ 10: ఎప్పుడు ఫైన్-ట్యూన్ చేయాలి, ఎప్పుడు ప్రాంప్ట్ లేదా రెట్రీవల్ ఉపయోగించాలి

నేను ఫైన్-ట్యూనింగ్ బాగా ఇష్టపడతాను, కానీ అది ఒక్క తుపాకీ కాదు. మూడు సాధారణ వ్యూహాలు:

ప్రాంప్ట్ ఇంజనీరింగ్ మాత్రమే: తక్కువ ఖర్చు, వేగవంతం. టోన్ సవరించడానికి లేదా సింపుల్ కాన్సిస్టెన్సీ కోసం చక్కగా వుంది.

రిట్రీవల్-ఆగ్మెంటెడ్ జనరేషన్ (RAG): తాజా వాస్తవాలు మరియు పెద్ద జ్ఞాన బేస్‌లకు బాగుంది. మోడల్ రన్ టైమ్‌లో మీ డాక్యుమెంట్లను చదువుతుంది.

ఫైన్-ట్యూనింగ్: స్టైల్, నిర్మాణం, డొమైన్ నమూనాల కోసం ఉత్తమం, అవి రోజూ మారవు.

చాలావార్తలు, గెలిచే పন্থా మిశ్రమం ఉంటుంది: RAG వాడి వాస్తవాలు తెచ్చుకోండి, తర్వాత వాటిని మీ ఫైన్-ట్యూన్డ్ మోడల్‌కు ఇవ్వండి, అది మీ సంతక శైలిలో సమాధానం ఇస్తుంది.

మీరు కాపీ-పేస్ట్ చేసుకోవచ్చునీ త్వరిత Tinker API ట్యుటోరియల్

ఇది అనేక Tinker-స్టైల్ ప్లాట్‌ఫారమ్‌లను ప్రతిబింబించే కల్పిత వాక్‌త్రూ. ఎండ్పాయింట్లు మరియు IDs మీ వాస్తవ వాటితో మార్చండి.

డేటాసెట్‌లు సృష్టించండి మరియు అప్‌లోడ్ చేయండి

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune"

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval"

ఫైన్-ట్యూనింగ్ ప్రారంభించండి

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-medium-1", "dataset_id": "ds_train", "eval_dataset_id": "ds_eval", "epochs": 4, "learning_rate": 2e-5, "suffix": "email-summarizer-v1" }'

లాగ్స్ స్ట్రీమ్ చేయండి

curl -N -H "Authorization: Bearer $TINKER_KEY"

ఫైన్-ట్యూన్డ్ మోడల్ వాడండి

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-medium-1:email-summarizer-v1:xyz", "prompt": "ఈ ఇమెయిల్‌ను రెండు బుల్లెట్లలో, స్నేహపూర్వక టోన్‌తో సరాంశం చేయండి:\n\n[ఇమెయిల్ పేస్ట్ చేయండి]", "max_tokens": 160, "temperature": 0.4 }'

ప్రకృతి ఘటనలు: ఇలా జరుగుతుంది…

మీ సపోర్ట్ మాక్రోస్‌పై ఫైన్-ట్యూన్ చేస్తారు

హఠాత్తు, మీ AI మీ ఏజెంట్లు వాడే పరిస్థితిలో జవాబిస్తది: క్షమాపణ, చర్య, అనుసరణ. CSAT మెరుగవుతుంది ఎందుకంటే ప్రజలు ఆశ్చర్యాల కన్నా సరసమైనతనాన్ని ఇష్టపడతారు.

మీ బ్రాండ్ వాయిస్‌పై ఫైన్-ట్యూన్ చేస్తారు

మోడల్ మీ 'మేము సహాయకులం కానీ ఒత్తిడి చేయని' శైలిని పట్టుకుంటుంది. 17 ఎగ్జ్లమేషన్ మార్కుల ఉత్సాహం నివారిస్తుంది. మార్కెటింగ్ సంతోషంగా నిద్రపోతుంది.

కోడ్ సూచనల కోసం ఫైన్-ట్యూన్ చేస్తారు

పనివివరణల మరియు ఆదర్శ కోడ్ స్నిపెట్ల జంటలు ఇవ్వండి. ఉదాహరణలు చిన్నవి మరియు కేంద్రితంగా ఉంచండి; ఆస్పృశ్యమైన కోడ్ కారణంగా అస్పృశ్యమైన పూర్తయిన టెక్స్ట్ వస్తుంది.

క్లాసిఫికేషన్ కోసం ఫైన్-ట్యూన్ చేస్తారు

అవును, మీరు చేయవచ్చు. లేబుల్ చేసిన ఉదాహরণలు ఇవ్వండి మరియు క్షిప్రమైన ప్రాంప్ట్‌లతో మోడల్‌ను కాల్ చేయండి. కఠిన లేబుల్స్ కోసం, టెంపరేచర్ ను సున్నా చేయండి.

భద్రత ముందు, చివర మరియు ఎప్పుడూ

మీ వినియోగం నియంత్రిత లేదా సున్నితమైన అంశాలు కట్టుబడితే, మీ సిస్టమ్ ప్రాంప్ట్ మరియు ట్రైనింగ్ డేటాలో స్పష్టమైన సరిహద్దులు చెయ్యండి. సుసంస్కృత తిరస్కరణలు చూపించే ఉదాహరణలు జోడించండి. అవుట్పుట్లను లాగ్ చేయండి మరియు వినియోగదారులు సమస్యలు నివేదించేందుకు వీలు కల్పించండి. ఫైన్-ట్యూన్డ్ మోడల్స్ ధృడమైన భద్రత ఉన్నవిగా శిక్షణ ఇవ్వండి.

Sider.AI ఎక్కడ సరిపోతుంది (మరియు ఎక్కడ కాదు)

ఒక ఆశ్చర్యం: Sider.AI మీరు Tinker API ఎలా ఉపయోగించాలో తెలుసుకునే సమయంలో అద్భుతమైన సహచరుడు అవుతుంది. అది డాక్స్ చదివే, ఉగ్గలేదు ఎలాంటి ఫిర్యాదు లేనివారి సహయ చక్రవర్గం లాంటిది. మీరు మీ మొజుసలు లేదా నోలేజ్ బేస్‌ను బ్రౌస్ చేస్తూ Sider సైడ్బార్‌లో డేటాసెట్ ఉదాహరణలు తయారుచేసుకోవచ్చు, అప్పుడు క్లీనుగా, స్థిరంగా JSONL ఎగుమతి చేయవచ్చు. ఇది శిక్షణ జాబ్‌ను నడుపదు—that Tinker పని—కానీ ఉదాహరణల రచనా, పునర్వ్రుత్తి, QAకి చాలా ఉపయోగకరం. దీన్ని అడిగి చూడండి: “ఈ జవాబును శాంతిగా, సాధారణ ఆంగ్ల సపోర్ట్ వాయిస్‌లో మార్చండి, రెండు వాక్యాలు” మరియు మీ డేటాసెట్ నాణ్యత ఎలా పెరిగిందో గమనించండి.

మాట్లు నేను ఎప్పుడైనా తెలుసుకోవాలనుకున్న విషయాలు

చాలా డేటా కాదు, మరింత ప్రాతినిధ్యం ఉన్న డేటా ముఖ్యం.

టోన్ ఓవర‍‍ఫిట్ చేయవద్దు. కొంత వైల్డ్‌కార్డ్ ఉదాహరణలు ఉంచండి, అలా მოდల్ వినియోగదారులు సృజనాత్మకత చూపినప్పుడు బెస్ట్ అన్‍‍‍ప్రెడిక్టబుల్ నిల్వచేయగలదు.

ప్రతి వస్తువును వెర్షన్ చేయండి: డేటాసెట్ v1.1, మోడల్ v1.2, ప్రాంప్ట్ టెంప్లేట్ v3.0. భవిష్యత్తు మీరు మీకు దన్య కేకను పంపుతుంది.

మళ్లీ వెనుకకు వెళ్ళే బటన్ ఉంచండి. కొత్త ఫైన్-ట్యూన్ ఇబ్బంది కలిగిస్తే, పాత మోడల్‌ని త్వరగా తిరిగి డిప్లాయ్ చేయండి.

కేవలం మీ అందమైన ఉదాహరణలు కాకుండా నిజమైన వినియోగదారుల ప్రాంప్ట్‌లతో మూల్యాంకనం చేయండి. వినియోగదారులుే చావు కవులు.

ఒక చివరి విషయం…

Tinker APIతో ఫైన్-ట్యూనింగ్ అంటే Skynet నిర్మించడం కాదు. అది మీ AIని మీ జట్టు భాగంగా అనిపించే విధంగా రఫ్ ఎడ్జ్‌లు తొలగించడం. చిన్నగా మొదలు పెట్టండి, తీవ్రమైన కొలతలు వేసుకోండి, మరియు సరళమైన ట్రిక్ (మంచి ప్రాంప్ట్‌లు) పని చేస్తే దాన్ని ఒప్పుకోండి.

మీ AI చివరకు మీలా సమాధానం ఇస్తే? అది కేవలం సమర్థత లేదు. అది మానసిక శాంతి.

చీట్ షీట్

Tinker APIని ఎలా ఉపయోగించి మీ స్వంత AI మోడల్‌ను ఫైన్-ట్యూన్ చేయాలి: శుభ్రంగా, స్థిరమైన JSONL జంటలు తయారుచేయండి; అప్‌లోడ్ చేయండి; సవ్యమైన డిఫాల్ట్‌లతో ఫైన్-ట్యూన్ ప్రారంభించండి; మానవులు మరియు మీట్రిక్స్‌తో మూల్యాంకనం చేయండి; డిప్లాయ్ చేసి మళ్లీ ప్రయత్నించండి.

చిరస్థాయి నమూనాల కోసం ఫైన్-ట్యూనింగ్ వాడండి; తాజా వాస్తవాల కోసం రెట్రీవల్ వాడండి.

చిన్న ప్రాంప్ట్‌లు, చిన్న మోడల్స్, మరియు రూటింగ్‌తో ఖర్చు నియంత్రించండి.

భద్రతను మీ డేటాసెట్‌లో స్పష్టంగా చేర్చండి.

Sider.AI వంటి టూల్స్ మీకు 'ట్రెయిన్' ట్రిగ్గర్ చేయకముందే మంచి ఉదాహరణలు రూపొందించడంలో సహాయం చేస్తాయని గుర్తుంచుకోండి.

సాధారణ ప్రశ్నలు

Q1: Tinker APIతో నా స్వంత AI మోడల్‌ను ఫైన్-ట్యూన్ చేయడానికి డేటాను ఎలా సిద్ధం చేయాలి? స్పష్టమైన సూచనలు-జవాబు లేదా చాట్-స్టైల్ జంటలతో JSONL వాడండి. టోన్ స్థిరంగా ఉంచండి, సున్నితమైన సమాచారాన్ని అనానిమైజ్ చేయండి, 10-20% డేటాను పరీక్షా కోసం వదిలేయండి, తద్వారా ఫలితాలపై మోసం కాకుండా ఉంటారు.

Q2: టింకర్ APIతో ఫైన్-ట్యూనింగ్ చేయడం ప్రాంప్ట్ ఇంజినీరింగ్ కంటే మెరుగైనదా? శీఘ్ర స్వరం మార్పులు మరియు సాధారణ ప్రవర్తనల కోసం ప్రాంప్ట్‌లను ఉపయోగించండి; మీకు మన్నికైన శైలి, నిర్మాణం లేదా డొమైన్ నమూనాలు అవసరమైనప్పుడు ఫైన్-ట్యూనింగ్ ఉపయోగించండి. చాలా జట్లు రెండింటినీ మిళితం చేస్తాయి— వాస్తవాల కోసం RAG, స్వరం కోసం ఫైన్-ట్యూన్.

Q3: టింకర్ APIతో మోడల్‌ను ఫైన్-ట్యూన్ చేయడానికి నాకు ఎంత డేటా అవసరం? పరిమాణం కంటే నాణ్యత ముఖ్యం. కొన్ని వందల బలమైన ఉదాహరణలు వేలాది శబ్ద ఉదాహరణలను అధిగమించగలవు. చిన్నగా ప్రారంభించండి, మూల్యాంకనం చేయండి, ఆపై మోడల్ కష్టపడుతున్న చోట లక్ష్య ఉదాహరణలను జోడించండి.

Q4: టింకర్ APIలో ఫైన్-ట్యూన్ చేసిన మోడల్‌ను నేను ఎలా అమలు చేయాలి? శిక్షణ తర్వాత, టింకర్ ప్రామాణిక పూర్తి లేదా చాట్ ఎండ్‌పాయింట్ ద్వారా మీరు కాల్ చేయగల మోడల్ IDని అందిస్తుంది. సహాయక సిస్టమ్ ప్రాంప్ట్‌ను సెట్ చేయండి, ఉష్ణోగ్రతను ట్యూన్ చేయండి మరియు నిజమైన ట్రాఫిక్‌లో అవుట్‌పుట్‌లను పర్యవేక్షించండి.

Q5: ఫైన్-ట్యూన్ చేసిన నా మోడల్ భ్రమలు కలిగించకుండా నేను ఎలా ఆపాలి? అనిశ్చితిని అంగీకరించే ఉదాహరణలతో శిక్షణ ఇవ్వండి, ఉష్ణోగ్రతను తగ్గించండి మరియు వాస్తవాల కోసం తిరిగి పొందే దానితో జత చేయండి. “మూలాలను పేర్కొనండి” లేదా “నాకు తెలియదని చెప్పండి” అనే సూచన మరియు శిక్షణ డేటాలో భాగంగా చేయండి.