How do I prepare data to fine-tune my own AI model with Tinker API?

Use JSONL with clear instruction–response or chat-style pairs. Keep tone consistent, anonymize sensitive info, and hold out 10–20% for testing so you don’t fool yourself with inflated scores.

Is fine-tuning with Tinker API better than prompt engineering?

Use prompts for quick tone tweaks and simple behaviors; use fine-tuning when you need durable style, structure, or domain patterns. Many teams combine both—RAG for facts, fine-tune for voice.

How much data do I need to fine-tune a model with Tinker API?

Quality beats quantity. A few hundred strong examples can outperform thousands of noisy ones. Start small, evaluate, then add targeted examples where the model struggles.

How do I deploy a fine-tuned model in Tinker API?

After training, Tinker returns a model ID you can call via the standard completions or chat endpoint. Set a helpful system prompt, tune temperature, and monitor outputs in real traffic.

How do I stop my fine-tuned model from hallucinating?

Train with examples that admit uncertainty, lower temperature, and pair with retrieval for facts. Make “cite sources” or “say you don’t know” part of the instruction and the training data.

آیا تا به حال آرزو کرده‌اید که هوش مصنوعی شما کمتر شبیه یک ربات هواشناسی و بیشتر شبیه... خودتان باشد؟

این تصویر را تصور کنید: از هوش مصنوعی خود می‌خواهید ایمیل یک مشتری را خلاصه کند، و آن پاسخ می‌دهد طوری که انگار در حال روایت پیش‌بینی آب و هوا است. از نظر فنی درست است؛ اما از نظر معنوی کمکی نمی‌کند. چیزی که شما واقعاً می‌خواهید، هوش مصنوعی‌تان است—با لحن، اصطلاحات و ترجیحات خودتان—بدون اینکه مجبور باشید یک آزمایشگاه تحقیقاتی در گاراژ خود بسازید.

اینجاست که fine-tuning (تنظیم دقیق) وارد می‌شود. و اگر زمزمه‌هایی درباره "Tinker API" شنیده‌اید، جای درستی آمده‌اید. این یک راهنمای عملی برای تنظیم دقیق مدل هوش مصنوعی خودتان با Tinker API است—بنابراین دفعه بعد که تایپ می‌کنید "پیش‌نویس یک پاسخ"، چیزی دریافت کنید که شبیه تیم شما باشد، نه پسر عموی HAL 9000.

ما کل فرایند را گام به گام بررسی خواهیم کرد: معنای fine-tuning، نحوه آماده‌سازی داده‌ها، نحوه اجرای fine-tune با Tinker API و نحوه مدیریت بودجه (یا صبرتان). من حتی به شما خواهم گفت که گرملین‌ها کجا زندگی می‌کنند—زیرا fine-tuning قدرتمند است، اما یک فرشته مهربان نیست.

توجه به کلمات کلیدی: ما قصد داریم زیاد بگوییم "نحوه استفاده از Tinker API"، زیرا این سوالی است که شما برای آن آمده‌اید. همچنین اصطلاحات طولانی‌تری مانند "fine-tune کردن مدل هوش مصنوعی خودتان"، "آموزش Tinker API"، "آماده‌سازی مجموعه داده برای fine-tuning" و "استقرار یک مدل fine-tune شده" را نیز در هم می‌آمیزیم. اگر به نظر زیاد می‌رسد، نگران نباشید—من آن را به زبان ساده بیان خواهم کرد.

Fine-tuning چیست—و چه چیزی نیست

اگر یک مدل هوش مصنوعی عمومی یک چاقوی سوئیسی باشد، fine-tuning به این معنی است که شما می‌گویید، "گوش کن، چاقو، ما می‌خواهیم تو را در باز کردن بسته‌ها بسیار، بسیار خوب کنیم." شما چاقو را اختراع نمی‌کنید. شما به آن مقواهای مورد علاقه‌تان را آموزش می‌دهید.

در عمل، fine-tuning به این معنی است که شما یک مدل پایه (که قبلاً روی اقیانوس‌های متن اینترنتی آموزش داده شده است) را می‌گیرید و با مثال‌های خودتان آن را تنظیم می‌کنید—سبک نوشتاری‌تان، پرسش و پاسخ‌های خاص حوزه‌تان، اسکریپت‌های پشتیبانی‌تان—تا به شکلی که شما می‌خواهید پاسخ دهد. این مانند این است که یک راهنمای سبک و یک دسته آزمون تمرینی به مدل بدهید.

اما fine-tuning یک جادوی جادویی نیست. ناگهان حقایقی را که هرگز ندیده است یاد نخواهد گرفت، مگر اینکه داده‌های شما آن الگوها را آموزش دهند. همچنین اسناد اختصاصی بزرگ را "به خاطر نمی‌آورد"، مگر اینکه قطعه‌های نماینده را به آن بدهید. و اگر داده‌های شما نامرتب، متناقض یا کوچک باشند، مدل شما آن عادت‌ها را به ارث می‌برد، درست مانند یک گروه راک نوجوان که سرعت نوازنده درامز خود را به ارث می‌برد.

برنامه سفر سریع

در اینجا یک نمای کلی از نحوه استفاده از Tinker API برای fine-tune کردن مدل هوش مصنوعی خودتان آورده شده است:

یک مدل پایه در Tinker API انتخاب کنید.

یک مجموعه داده تمیز و متعادل با prompts (درخواست‌ها) و پاسخ‌های ایده‌آل آماده کنید.

مجموعه داده خود را در Tinker آپلود کنید.

یک کار fine-tuning با hyperparameters (ابرپارامترها) واضح ایجاد کنید.

آموزش را نظارت کنید، نتایج را با یک مجموعه آزمایشی held-out ارزیابی کنید.

مدل fine-tune شده خود را در محیط عملیاتی مستقر و فراخوانی کنید.

هنگامی که چیزهای عجیب و غریب مشاهده کردید، تکرار کنید.

ما گام به گام پیش خواهیم رفت، با مثال‌هایی به سبک کد که می‌توانید paste کنید، و نکاتی که من را از فریاد زدن به صفحه نمایشم باز داشت.

گام 1: مدل پایه خود را مانند انتخاب یک ماشین اجاره‌ای انتخاب کنید

شما یک ون 15 نفره را برای پارک دوبل در منهتن اجاره نمی‌کنید. به طور مشابه، اگر به پاسخ‌های سریع و ارزان برای یک میلیون درخواست روزانه نیاز دارید، یک مدل بزرگ را انتخاب نکنید. Tinker API معمولاً چند خانواده مدل ارائه می‌دهد—سبک وزن، متوسط و "وای، چه هوشمند".

اگر به سرعت و صرفه‌جویی در هزینه نیاز دارید: مدل پایه کوچک‌تر را انتخاب کنید.

اگر به تفاوت‌های ظریف، استدلال یا نوشتن طولانی نیاز دارید: مدل پایه بزرگ‌تر را انتخاب کنید.

اگر دامنه شما اصطلاحات زیادی دارد (پزشکی، حقوقی، ماکروهای پشتیبانی): مدل‌های متوسط تا بزرگ با موفقیت بیشتری fine-tune می‌شوند.

نکته حرفه‌ای: با کوچک‌تر شروع کنید تا نمونه اولیه بسازید. اگر معیارهای کلیدی شما جهش پیدا کردند، همان مجموعه داده را به یک پایه بزرگ‌تر منتقل کنید.

گام 2: مجموعه داده خود را مانند یک کارت دستور غذا آماده کنید، نه کشوی آشغال

مجموعه داده شما بزرگ‌ترین اهرم برای کیفیت است. مدل با تقلید یاد می‌گیرد؛ اگر مثال‌ها مبهم باشند، مدل یاد می‌گیرد که مبهم باشد. اگر آنها واضح، سازگار و متنوع باشند، مدل شما به یک همکار مفید تبدیل می‌شود که در واقع یادداشت‌ها را می‌خواند.

هدف برای یک فرمت JSONL (JSON Lines) با جفت‌های دستورالعمل-پاسخ صریح باشد. برای fine-tuning به سبک چت، نقش‌هایی مانند system/user/assistant را وارد کنید. هر مثال را کوتاه تا متوسط نگه دارید. ده‌ها مثال با کیفیت بالا بهتر از هزاران مثال پر سر و صدا هستند.

مثال (به سبک دستورالعمل):

{"instruction": "این تیکت پشتیبانی را در 2 جمله و با لحن دوستانه خلاصه کنید.", "input": "مشتری هنگام کلیک بر روی 'پیگیری سفارش' یک خطای 404 را گزارش می‌دهد", "output": "از اینکه این موضوع را گزارش دادید متشکرم! سایت هنگام کلیک مشتریان بر روی 'پیگیری سفارش' یک خطای 404 را نشان می‌دهد. ما در حال بررسی یک لینک خراب در صفحه پیگیری سفارش هستیم و پیگیری و رفع خواهیم کرد."}

مثال (به سبک چت):

{"messages": [ {"role": "system", "content": "شما یک عامل پشتیبانی مختصر و دوستانه هستید. از زبان انگلیسی ساده استفاده کنید."}, {"role": "user", "content": "اشتراک من تمدید شد اما کارت منقضی شده بود. کمک؟"}, {"role": "assistant", "content": "از این مشکل متاسفم! من دوباره طرح شما را بررسی کرده‌ام—تمدید با کارت منقضی شده انجام شده است. لطفاً کارت خود را در صفحه صورت‌حساب به‌روزرسانی کنید؛ پس از ذخیره شدن، دوباره برای شارژ تلاش خواهم کرد."} ]}

نکاتی برای آماده‌سازی مجموعه داده برای fine-tuning:

سازگاری ملکه است. همیشه از یک لحن، امضا و ساختار استفاده کنید.

موضوعات خود را متعادل کنید. اگر 90٪ مثال‌ها مربوط به بازپرداخت هستند، مدل شما به پری بازپرداخت تبدیل می‌شود.

موارد دشوار را برچسب‌گذاری کنید. در صورت پشتیبانی Tinker API از یک سیگنال preference، مثال‌های منفی (آنچه نباید گفت) را وارد کنید.

ایمن نگه دارید. داده‌های شخصی را حذف کنید. اگر با اطلاعات حساس کار می‌کنید، آنها را ناشناس کنید یا سنتز کنید.

10-20٪ از داده‌های خود را به عنوان مجموعه آزمایشی نگه دارید. اگر در مجموعه آموزشی نمره دهید، خودتان را فریب می‌دهید که فکر کنید مدل یک نابغه است. از من بپرسید از کجا می‌دانم.

گام 3: داده‌های خود را بدون اشک و زاری در Tinker API آپلود کنید

اکثر پلتفرم‌های fine-tuning یک endpoint ذخیره‌سازی ارائه می‌دهند. با Tinker API، شما معمولاً:

یک منبع مجموعه داده ایجاد کنید (به عنوان مثال، POST /datasets)

فایل JSONL خود را آپلود کنید

طرحواره را اعتبارسنجی کنید (Tinker معمولاً یک گزارش مفید برمی‌گرداند: تعداد OK، خطاها، فیلدهای عجیب و غریب)

مثال شبه کد (curl-ish):

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"

اگر Tinker API از یک CLI پشتیبانی کند، زندگی آسان‌تر می‌شود:

آپلود

tinker datasets upload my_finetune_data.jsonl --purpose finetune

اعتبارسنجی

tinker datasets validate DATASET_ID

خطاهای اعتبارسنجی دوست شما هستند. آنها قضاوت‌گر به نظر می‌رسند، اما شما را از شکست‌های آموزشی مرموز در ساعت 2 بامداد نجات می‌دهند.

گام 4: یک کار fine-tune را شروع کنید و تنظیمات معقول را انتخاب کنید

شما یک کار را آغاز می‌کنید که به مجموعه داده و مدل پایه انتخابی شما اشاره دارد. اکثر endpointهای fine-tuning Tinker API پارامترهایی مانند epochs، learning rate، batch size و evaluation frequency را می‌پذیرند. ترجمه: چند بار داده‌های خود را بررسی می‌کنید، مدل با چه شدتی یاد می‌گیرد، چند مثال را همزمان مطالعه می‌کند و هر چند وقت یکبار یک گزارش پیشرفت به شما نشان می‌دهد.

مثال درخواست:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-large-1", "dataset_id": "ds_abc123", "epochs": 3, "learning_rate": 1e-5, "batch_size": 8, "eval_dataset_id": "ds_eval789", "suffix": "support-tone-v1" }'

پیش‌فرض‌های معقول:

Epochs: 3-5 برای مجموعه‌های داده کوچک تا متوسط. بیشتر همیشه بهتر نیست؛ گاهی اوقات فقط overfitting (بیش‌برازش) با مراحل اضافی است.

Learning rate: محافظه‌کارانه شروع کنید (1e-5 یا 2e-5). اگر مدل خیلی سریع یاد بگیرد، هوش عمومی خود را فراموش می‌کند.

Batch size: هر آنچه سهمیه شما اجازه می‌دهد، اما نگران نباشید—بهبود عملکرد بیشتر از داده‌های خوب ناشی می‌شود.

Early stopping: اگر Tinker API آن را ارائه می‌دهد، آن را فعال کنید. این "آیا رسیده‌ایم؟" یادگیری ماشین است که گهگاه می‌گوید، "بله."

گام 5: مانند یک شاهین آموزش را نظارت کنید—اما یک شاهین خونسرد

Tinker معمولاً گزارش‌ها را پخش می‌کند: training loss، evaluation loss و شاید معیارهای سفارشی که شما تعریف می‌کنید (مانند تطابق دقیق برای پرسش و پاسخ). در اینجا نحوه خواندن فال چای آورده شده است:

Training loss در حال کاهش، eval loss ثابت یا در حال افزایش؟ شما در حال overfitting هستید—پاسخ‌های آموزشی خود را حفظ می‌کنید اما پاسخ‌های جدید را خراب می‌کنید.

هر دو روند نزولی دارند؟ شما در مسیر درستی هستید.

Loss مانند یک چوب پوگو بالا و پایین می‌پرد؟ Learning rate شما ممکن است خیلی زیاد باشد، یا مجموعه داده شما ناسازگار است.

اگر Tinker نسل‌های پیش‌نمایش را در اواسط آموزش ارائه می‌دهد، خروجی‌های جزئی را بررسی کنید. چند prompt را از مجموعه آزمایشی خود نمونه‌برداری کنید و لحن/دقت را بررسی کنید. بله، کیفی است—اما شما در حال آموزش سبک هستید، نه اثبات فیزیک.

گام 6: نام‌گذاری کنید، مستقر کنید، فراخوانی کنید

هنگامی که کار به پایان می‌رسد، Tinker API شما را با یک شناسه مدل مانند ft:tinker-large-1:support-tone-v1:abc123 متبرک می‌کند. سپس می‌توانید آن را در پشت یک endpoint مستقر کنید و آن را درست مانند مدل پایه فراخوانی کنید—فقط اکنون مانند تیم شما صحبت می‌کند.

مثال فراخوانی تولید:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-large-1:support-tone-v1:abc123", "messages": [ {"role": "system", "content": "شما یک عامل پشتیبانی مختصر و دوستانه هستید.","role": "user", "content": "بازپرداخت من دیر شده و من ناراحتم."}], "temperature": 0.4 }'

همچنین اگر مدل شما خیلی پرحرف یا خیلی مختصر می‌شود، می‌توانید "presence_penalty" بالاتری یا "temperature" پایین‌تری تنظیم کنید. اسناد Tinker جزئیات تنظیمات را شرح می‌دهند—از آزمایش کردن نترسید.

گام 7: مانند یک مربی ارزیابی کنید، نه یک داور

شما به یک کارت امتیازی خودکار و یک کارت امتیازی انسانی نیاز دارید. معیارهای خودکار (BLEU، ROUGE، دقت) مرتب هستند اما نسبت به لحن کور هستند. انسان‌ها مشکل "این لحن تند به نظر می‌رسد" را درک می‌کنند.

یک rubric کوچک تنظیم کنید:

تطابق لحن (1-5)

پیروی از دستورالعمل (1-5)

واقعیت (1-5)

کنترل طول (1-5)

ایمنی/انطباق (1-5)

50-100 خروجی را از مجموعه held-out خود نمونه‌برداری کنید. از دو نفر بخواهید که آنها را به طور مستقل رتبه‌بندی کنند. اگر میانگین یک دسته کمتر از 3 است، آن را به مجموعه داده خود برگردانید و مثال‌های بیشتری اضافه کنید که رفتاری را که می‌خواهید نشان دهید.

گام 8: هزینه و عملکرد: آنچه که CFO شما و سرور شما به آن اهمیت می‌دهند

Fine-tuning با Tinker API در دو مکان هزینه دارد: آموزش و inference (استنتاج). آموزش یک دوی سرعت یک‌باره است. inference یک ماراتن است.

طول token را کاهش دهید. prompts و خروجی‌های کوتاه‌تر = صورت‌حساب‌های کوچک‌تر.

از یک system prompt استفاده کنید که سبک شما را مشخص می‌کند، اما دستورالعمل‌های بزرگ را در هر فراخوانی تکرار نکنید اگر Tinker از یک پیش‌فرض در سطح deployment پشتیبانی می‌کند.

prompts مشترک را در صورت امکان cache کنید.

یک استراتژی مسیریابی را در نظر بگیرید: از مدل بزرگ fine-tune شده خود فقط در صورت نیاز استفاده کنید؛ در غیر این صورت، به یک مدل کوچک‌تر و ارزان‌تر بازگردید.

Latency (تأخیر) نیز مهم است. اگر مدل fine-tune شده شما کندتر اجرا می‌شود، پنجره‌های context کوچک‌تری را امتحان کنید، یا از مدل کوچک برای طبقه‌بندی و مدل بزرگ فقط برای متن مولد استفاده کنید.

گام 9: عیب‌یابی: بزرگ‌ترین موفقیت‌های گرملین‌ها

مدل مانند یک صفحه شکسته خود را تکرار می‌کند.

Temperature را کاهش دهید. مثال‌هایی با پاسخ‌های واضح و کوتاه اضافه کنید. اگر این گزینه وجود دارد، عرض پرتو را کاهش دهید.

دستورالعمل‌ها را نادیده می‌گیرد.

System prompt را تقویت کنید و مثال‌های آموزشی را وارد کنید که پیروی دقیق از دستورالعمل را به نمایش بگذارند.

حقایق را با خودستایی توهم می‌کند.

مثال‌هایی را وارد کنید که می‌گویند "نمی‌دانم" یا به منابع پیوند می‌دهند؛ temperature را کاهش دهید؛ با بازیابی برای پاسخ‌های زمینی جفت کنید.

خیلی خوب است. (بله، این یک چیز است.)

مثال‌های آموزشی را اضافه کنید که مرزها را تعیین می‌کنند و سیاست‌ها را روشن می‌کنند—"ما نمی‌توانیم X را انجام دهیم، اما در اینجا Y وجود دارد."

آموزش در نیمه راه شکست می‌خورد.

اعتبارسنجی مجموعه داده، کاراکترهای عجیب و غریب و طول token حداکثر را بررسی کنید. Batch size کوچک‌تری یا epochs کمتری را امتحان کنید.

گام 10: چه زمانی fine-tune کنیم در مقابل چه زمانی از prompts یا بازیابی استفاده کنیم

من عاشق fine-tuning هستم، اما این تنها چکش نیست. سه استراتژی رایج:

Prompt engineering (مهندسی prompt) فقط: ارزان‌ترین، سریع‌ترین. عالی است وقتی فقط به یک تغییر لحن یا ثبات ساده نیاز دارید.

Retrieval-augmented generation (RAG): عالی برای حقایق جدید و پایگاه‌های دانش بزرگ. مدل اسناد شما را در زمان اجرا می‌خواند.

Fine-tuning: بهترین برای سبک، ساختار و الگوهای دامنه که روزانه تغییر نمی‌کنند.

اغلب، دستور العمل برنده کمی از هر کدام است: از RAG برای واکشی حقایق استفاده کنید، سپس آنها را به مدل fine-tune شده خود منتقل کنید تا با صدای مشخص شما پاسخ دهد.

یک آموزش سریع Tinker API که می‌توانید کپی و paste کنید

در اینجا یک walkthrough ادغام شده و خیالی وجود دارد که بسیاری از پلتفرم‌های سبک Tinker را منعکس می‌کند. Endpointها و شناسه‌ها را با موارد واقعی خود جایگزین کنید.

ایجاد و آپلود مجموعه‌های داده

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune"

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval"

شروع fine-tuning

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-medium-1", "dataset_id": "ds_train", "eval_dataset_id": "ds_eval", "epochs": 4, "learning_rate": 2e-5, "suffix": "email-summarizer-v1" }'

پخش گزارش‌ها

curl -N -H "Authorization: Bearer $TINKER_KEY"

از مدل fine-tune شده استفاده کنید

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-medium-1:email-summarizer-v1:xyz", "prompt": "ایمیل زیر را در دو گلوله خلاصه کنید، لحن دوستانه:\n\n[PASTE EMAIL]", "max_tokens": 160, "temperature": 0.4 }'

سناریوهای واقعی: چه اتفاقی می‌افتد وقتی...

شما روی ماکروهای پشتیبانی خود fine-tune می‌کنید

به طور ناگهانی، هوش مصنوعی شما با همان ساختاری پاسخ می‌دهد که نمایندگان شما استفاده می‌کنند: عذرخواهی، اقدام، پیگیری. CSAT اغلب افزایش می‌یابد زیرا مردم ثبات را بیشتر از شگفتی‌ها دوست دارند.

شما روی صدای برند خود fine-tune می‌کنید

مدل به سبک "ما مفید هستیم اما چسبنده نیستیم" شما می‌رسد. از اشتیاق 17 علامت تعجب اجتناب می‌کند. بازاریابی بهتر می‌خوابد.

شما برای پیشنهادات کد fine-tune می‌کنید

جفت‌های توضیحات وظیفه و قطعه‌های کد ایده‌آل را وارد کنید. مثال‌ها را کوتاه و متمرکز نگه دارید. کد پر سر و صدا منجر به تکمیل‌های پر سر و صدا می‌شود.

شما برای طبقه‌بندی fine-tune می‌کنید

بله، می‌توانید. مثال‌های برچسب‌گذاری شده را ارائه دهید و مدل را با prompts کوتاه فراخوانی کنید. برای برچسب‌های دقیق، temperature را روی صفر تنظیم کنید.

ایمنی اول، آخر و همیشه

اگر مورد استفاده شما حوزه‌های تنظیم شده یا حساس را لمس می‌کند، خطوط روشنی را در system prompt و داده‌های آموزشی خود ترسیم کنید. مثال‌هایی را اضافه کنید که امتناع‌ها را به زیبایی نشان می‌دهند. خروجی‌ها را ثبت کنید و به کاربران اجازه دهید مشکلات را گزارش کنند. مدل‌های fine-tune شده می‌توانند مطمئن باشند—آنها را آموزش دهید تا با اطمینان محتاط باشند.

جایگاه Sider.AI کجاست (و کجا نیست)

در اینجا یک شگفتی وجود دارد: Sider.AI می‌تواند یک همراه عالی باشد در حالی که شما در حال بررسی نحوه استفاده از Tinker API هستید. این مانند داشتن یک کمک خلبان محتاط است که اسناد را بدون شکایت می‌خواند. شما می‌توانید مثال‌های مجموعه داده را در نوار کناری Sider در حین مرور ایمیل‌ها یا پایگاه دانش موجود خود پیش‌نویس کنید، سپس JSONL تمیز و سازگار را صادر کنید. این کار آموزش را برای شما اجرا نمی‌کند—این وظیفه Tinker است—اما برای پیش‌نویس، بازسازی و QA کردن مثال‌های شما، فوق‌العاده کاربردی است. از آن بپرسید، "این پاسخ را با یک صدای پشتیبانی آرام و انگلیسی ساده، در دو جمله بازنویسی کنید"، و شاهد جهش کیفیت مجموعه داده خود باشید.

گرفتاری‌هایی که ای کاش کسی به من می‌گفت

داده‌های بیشتر همیشه بهتر نیستند—داده‌های نماینده بیشتر بهتر هستند.

در لحن overfitting نکنید. چند مثال wildcard را نگه دارید تا مدل بتواند هنگام خلاقیت کاربران بداهه‌پردازی کند.

همه چیز را نسخه بندی کنید: مجموعه داده v1.1، مدل v1.2، قالب prompt v3.0. آینده شما یک مافین تشکر برای شما ارسال خواهد کرد.

یک دکمه بازگشت نگه دارید. اگر یک fine-tune جدید از ریل خارج شد، به سرعت مدل قبلی را دوباره مستقر کنید.

با prompts واقعی کاربر ارزیابی کنید، نه فقط زیباترین مثال‌های خود. کاربران شاعران هرج و مرج هستند.

یک چیز دیگر...

Fine-tuning با Tinker API در مورد ساخت Skynet نیست. این در مورد تراشیدن لبه‌های ناهموار است تا هوش مصنوعی شما احساس شود که بخشی از تیم شما است. کوچک شروع کنید، بی‌رحمانه اندازه بگیرید و نترسید که اعتراف کنید وقتی یک ترفند ساده‌تر (مانند prompts بهتر) کار را انجام می‌دهد.

زیرا وقتی هوش مصنوعی شما در نهایت به شکلی پاسخ می‌دهد که شما می‌خواهید؟ این فقط کارایی نیست. این عقلانیت است.

برگ تقلب

نحوه استفاده از Tinker API برای fine-tune کردن مدل هوش مصنوعی خودتان: جفت‌های JSONL تمیز و سازگار را آماده کنید؛ آپلود کنید؛ یک fine-tune را با پیش‌فرض‌های معقول شروع کنید؛ با انسان و معیارها ارزیابی کنید؛ مستقر کنید و تکرار کنید.

از fine-tuning برای سبک و الگوهای پایدار استفاده کنید؛ از بازیابی برای حقایق جدید استفاده کنید.

هزینه را با prompts کوتاه‌تر، مدل‌های کوچک‌تر و مسیریابی کنترل کنید.

ایمنی را به عنوان بخشی صریح از مجموعه داده خود در نظر بگیرید.

اجازه دهید ابزارهایی مانند Sider.AI به شما کمک کنند تا مثال‌های بهتری را قبل از اینکه دکمه "آموزش" را بزنید، بسازید.

سوالات متداول

Q1:چگونه داده‌ها را برای fine-tune کردن مدل هوش مصنوعی خود با Tinker API آماده کنم؟ از JSONL با جفت‌های دستورالعمل-پاسخ واضح یا جفت‌های به سبک چت استفاده کنید. لحن را ثابت نگه دارید، اطلاعات حساس را ناشناس کنید و 10-20٪ را برای آزمایش نگه دارید تا با امتیازهای باد کرده خودتان را فریب ندهید.

سوال 2: آیا تنظیم دقیق با Tinker API بهتر از مهندسی پرامپت است؟ از پرامپت‌ها برای تغییرات سریع لحن و رفتارهای ساده استفاده کنید؛ از تنظیم دقیق زمانی استفاده کنید که به سبک، ساختار یا الگوهای دامنه بادوام نیاز دارید. بسیاری از تیم‌ها هر دو را با هم ترکیب می‌کنند - RAG برای حقایق، تنظیم دقیق برای صدا.

سوال 3: برای تنظیم دقیق یک مدل با Tinker API به چه مقدار داده نیاز دارم؟ کیفیت بر کمیت برتری دارد. چند صد مثال قوی می‌توانند از هزاران مثال پر سر و صدا عملکرد بهتری داشته باشند. از کم شروع کنید، ارزیابی کنید، سپس مثال‌های هدفمندی را که مدل در آن مشکل دارد اضافه کنید.

سوال 4: چگونه یک مدل تنظیم شده دقیق را در Tinker API مستقر کنم؟ پس از آموزش، Tinker یک شناسه مدل {model ID} را برمی‌گرداند که می‌توانید از طریق نقاط پایانی استاندارد تکمیل یا چت با آن تماس بگیرید. یک پرامپت سیستمی مفید تنظیم کنید، دما را تنظیم کنید و خروجی‌ها را در ترافیک واقعی نظارت کنید.

سوال 5: چگونه از توهم زدن مدل تنظیم شده دقیق خود جلوگیری کنم؟ با مثال‌هایی که عدم قطعیت را می‌پذیرند آموزش دهید، دما را پایین بیاورید و برای حقایق با بازیابی جفت کنید. «ذکر منابع» یا «گفتن اینکه نمی‌دانید» را بخشی از دستورالعمل و داده‌های آموزشی قرار دهید.