آیا تا به حال آرزو کردهاید که هوش مصنوعی شما کمتر شبیه یک ربات هواشناسی و بیشتر شبیه... خودتان باشد؟
این تصویر را تصور کنید: از هوش مصنوعی خود میخواهید ایمیل یک مشتری را خلاصه کند، و آن پاسخ میدهد طوری که انگار در حال روایت پیشبینی آب و هوا است. از نظر فنی درست است؛ اما از نظر معنوی کمکی نمیکند. چیزی که شما واقعاً میخواهید، هوش مصنوعیتان است—با لحن، اصطلاحات و ترجیحات خودتان—بدون اینکه مجبور باشید یک آزمایشگاه تحقیقاتی در گاراژ خود بسازید.
اینجاست که fine-tuning (تنظیم دقیق) وارد میشود. و اگر زمزمههایی درباره "Tinker API" شنیدهاید، جای درستی آمدهاید. این یک راهنمای عملی برای تنظیم دقیق مدل هوش مصنوعی خودتان با Tinker API است—بنابراین دفعه بعد که تایپ میکنید "پیشنویس یک پاسخ"، چیزی دریافت کنید که شبیه تیم شما باشد، نه پسر عموی HAL 9000.
ما کل فرایند را گام به گام بررسی خواهیم کرد: معنای fine-tuning، نحوه آمادهسازی دادهها، نحوه اجرای fine-tune با Tinker API و نحوه مدیریت بودجه (یا صبرتان). من حتی به شما خواهم گفت که گرملینها کجا زندگی میکنند—زیرا fine-tuning قدرتمند است، اما یک فرشته مهربان نیست.
توجه به کلمات کلیدی: ما قصد داریم زیاد بگوییم "نحوه استفاده از Tinker API"، زیرا این سوالی است که شما برای آن آمدهاید. همچنین اصطلاحات طولانیتری مانند "fine-tune کردن مدل هوش مصنوعی خودتان"، "آموزش Tinker API"، "آمادهسازی مجموعه داده برای fine-tuning" و "استقرار یک مدل fine-tune شده" را نیز در هم میآمیزیم. اگر به نظر زیاد میرسد، نگران نباشید—من آن را به زبان ساده بیان خواهم کرد.
Fine-tuning چیست—و چه چیزی نیست
اگر یک مدل هوش مصنوعی عمومی یک چاقوی سوئیسی باشد، fine-tuning به این معنی است که شما میگویید، "گوش کن، چاقو، ما میخواهیم تو را در باز کردن بستهها بسیار، بسیار خوب کنیم." شما چاقو را اختراع نمیکنید. شما به آن مقواهای مورد علاقهتان را آموزش میدهید.
در عمل، fine-tuning به این معنی است که شما یک مدل پایه (که قبلاً روی اقیانوسهای متن اینترنتی آموزش داده شده است) را میگیرید و با مثالهای خودتان آن را تنظیم میکنید—سبک نوشتاریتان، پرسش و پاسخهای خاص حوزهتان، اسکریپتهای پشتیبانیتان—تا به شکلی که شما میخواهید پاسخ دهد. این مانند این است که یک راهنمای سبک و یک دسته آزمون تمرینی به مدل بدهید.
اما fine-tuning یک جادوی جادویی نیست. ناگهان حقایقی را که هرگز ندیده است یاد نخواهد گرفت، مگر اینکه دادههای شما آن الگوها را آموزش دهند. همچنین اسناد اختصاصی بزرگ را "به خاطر نمیآورد"، مگر اینکه قطعههای نماینده را به آن بدهید. و اگر دادههای شما نامرتب، متناقض یا کوچک باشند، مدل شما آن عادتها را به ارث میبرد، درست مانند یک گروه راک نوجوان که سرعت نوازنده درامز خود را به ارث میبرد.
برنامه سفر سریع
در اینجا یک نمای کلی از نحوه استفاده از Tinker API برای fine-tune کردن مدل هوش مصنوعی خودتان آورده شده است:
- یک مدل پایه در Tinker API انتخاب کنید.
- یک مجموعه داده تمیز و متعادل با prompts (درخواستها) و پاسخهای ایدهآل آماده کنید.
- مجموعه داده خود را در Tinker آپلود کنید.
- یک کار fine-tuning با hyperparameters (ابرپارامترها) واضح ایجاد کنید.
- آموزش را نظارت کنید، نتایج را با یک مجموعه آزمایشی held-out ارزیابی کنید.
- مدل fine-tune شده خود را در محیط عملیاتی مستقر و فراخوانی کنید.
- هنگامی که چیزهای عجیب و غریب مشاهده کردید، تکرار کنید.
ما گام به گام پیش خواهیم رفت، با مثالهایی به سبک کد که میتوانید paste کنید، و نکاتی که من را از فریاد زدن به صفحه نمایشم باز داشت.
گام 1: مدل پایه خود را مانند انتخاب یک ماشین اجارهای انتخاب کنید
شما یک ون 15 نفره را برای پارک دوبل در منهتن اجاره نمیکنید. به طور مشابه، اگر به پاسخهای سریع و ارزان برای یک میلیون درخواست روزانه نیاز دارید، یک مدل بزرگ را انتخاب نکنید. Tinker API معمولاً چند خانواده مدل ارائه میدهد—سبک وزن، متوسط و "وای، چه هوشمند".
- اگر به سرعت و صرفهجویی در هزینه نیاز دارید: مدل پایه کوچکتر را انتخاب کنید.
- اگر به تفاوتهای ظریف، استدلال یا نوشتن طولانی نیاز دارید: مدل پایه بزرگتر را انتخاب کنید.
- اگر دامنه شما اصطلاحات زیادی دارد (پزشکی، حقوقی، ماکروهای پشتیبانی): مدلهای متوسط تا بزرگ با موفقیت بیشتری fine-tune میشوند.
نکته حرفهای: با کوچکتر شروع کنید تا نمونه اولیه بسازید. اگر معیارهای کلیدی شما جهش پیدا کردند، همان مجموعه داده را به یک پایه بزرگتر منتقل کنید.
گام 2: مجموعه داده خود را مانند یک کارت دستور غذا آماده کنید، نه کشوی آشغال
مجموعه داده شما بزرگترین اهرم برای کیفیت است. مدل با تقلید یاد میگیرد؛ اگر مثالها مبهم باشند، مدل یاد میگیرد که مبهم باشد. اگر آنها واضح، سازگار و متنوع باشند، مدل شما به یک همکار مفید تبدیل میشود که در واقع یادداشتها را میخواند.
هدف برای یک فرمت JSONL (JSON Lines) با جفتهای دستورالعمل-پاسخ صریح باشد. برای fine-tuning به سبک چت، نقشهایی مانند system/user/assistant را وارد کنید. هر مثال را کوتاه تا متوسط نگه دارید. دهها مثال با کیفیت بالا بهتر از هزاران مثال پر سر و صدا هستند.
مثال (به سبک دستورالعمل):
{"instruction": "این تیکت پشتیبانی را در 2 جمله و با لحن دوستانه خلاصه کنید.", "input": "مشتری هنگام کلیک بر روی 'پیگیری سفارش' یک خطای 404 را گزارش میدهد", "output": "از اینکه این موضوع را گزارش دادید متشکرم! سایت هنگام کلیک مشتریان بر روی 'پیگیری سفارش' یک خطای 404 را نشان میدهد. ما در حال بررسی یک لینک خراب در صفحه پیگیری سفارش هستیم و پیگیری و رفع خواهیم کرد."}
مثال (به سبک چت):
{"messages": [
{"role": "system", "content": "شما یک عامل پشتیبانی مختصر و دوستانه هستید. از زبان انگلیسی ساده استفاده کنید."},
{"role": "user", "content": "اشتراک من تمدید شد اما کارت منقضی شده بود. کمک؟"},
{"role": "assistant", "content": "از این مشکل متاسفم! من دوباره طرح شما را بررسی کردهام—تمدید با کارت منقضی شده انجام شده است. لطفاً کارت خود را در صفحه صورتحساب بهروزرسانی کنید؛ پس از ذخیره شدن، دوباره برای شارژ تلاش خواهم کرد."}
]}
نکاتی برای آمادهسازی مجموعه داده برای fine-tuning:
- سازگاری ملکه است. همیشه از یک لحن، امضا و ساختار استفاده کنید.
- موضوعات خود را متعادل کنید. اگر 90٪ مثالها مربوط به بازپرداخت هستند، مدل شما به پری بازپرداخت تبدیل میشود.
- موارد دشوار را برچسبگذاری کنید. در صورت پشتیبانی Tinker API از یک سیگنال preference، مثالهای منفی (آنچه نباید گفت) را وارد کنید.
- ایمن نگه دارید. دادههای شخصی را حذف کنید. اگر با اطلاعات حساس کار میکنید، آنها را ناشناس کنید یا سنتز کنید.
10-20٪ از دادههای خود را به عنوان مجموعه آزمایشی نگه دارید. اگر در مجموعه آموزشی نمره دهید، خودتان را فریب میدهید که فکر کنید مدل یک نابغه است. از من بپرسید از کجا میدانم.
گام 3: دادههای خود را بدون اشک و زاری در Tinker API آپلود کنید
اکثر پلتفرمهای fine-tuning یک endpoint ذخیرهسازی ارائه میدهند. با Tinker API، شما معمولاً:
- یک منبع مجموعه داده ایجاد کنید (به عنوان مثال، POST /datasets)
- فایل JSONL خود را آپلود کنید
- طرحواره را اعتبارسنجی کنید (Tinker معمولاً یک گزارش مفید برمیگرداند: تعداد OK، خطاها، فیلدهای عجیب و غریب)
مثال شبه کد (curl-ish):
curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"
اگر Tinker API از یک CLI پشتیبانی کند، زندگی آسانتر میشود:
آپلود
tinker datasets upload my_finetune_data.jsonl --purpose finetune
اعتبارسنجی
tinker datasets validate DATASET_ID
خطاهای اعتبارسنجی دوست شما هستند. آنها قضاوتگر به نظر میرسند، اما شما را از شکستهای آموزشی مرموز در ساعت 2 بامداد نجات میدهند.
گام 4: یک کار fine-tune را شروع کنید و تنظیمات معقول را انتخاب کنید
شما یک کار را آغاز میکنید که به مجموعه داده و مدل پایه انتخابی شما اشاره دارد. اکثر endpointهای fine-tuning Tinker API پارامترهایی مانند epochs، learning rate، batch size و evaluation frequency را میپذیرند. ترجمه: چند بار دادههای خود را بررسی میکنید، مدل با چه شدتی یاد میگیرد، چند مثال را همزمان مطالعه میکند و هر چند وقت یکبار یک گزارش پیشرفت به شما نشان میدهد.
مثال درخواست:
curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{
"base_model": "tinker-large-1",
"dataset_id": "ds_abc123",
"epochs": 3,
"learning_rate": 1e-5,
"batch_size": 8,
"eval_dataset_id": "ds_eval789",
"suffix": "support-tone-v1"
}'
پیشفرضهای معقول:
- Epochs: 3-5 برای مجموعههای داده کوچک تا متوسط. بیشتر همیشه بهتر نیست؛ گاهی اوقات فقط overfitting (بیشبرازش) با مراحل اضافی است.
- Learning rate: محافظهکارانه شروع کنید (1e-5 یا 2e-5). اگر مدل خیلی سریع یاد بگیرد، هوش عمومی خود را فراموش میکند.
- Batch size: هر آنچه سهمیه شما اجازه میدهد، اما نگران نباشید—بهبود عملکرد بیشتر از دادههای خوب ناشی میشود.
- Early stopping: اگر Tinker API آن را ارائه میدهد، آن را فعال کنید. این "آیا رسیدهایم؟" یادگیری ماشین است که گهگاه میگوید، "بله."
گام 5: مانند یک شاهین آموزش را نظارت کنید—اما یک شاهین خونسرد
Tinker معمولاً گزارشها را پخش میکند: training loss، evaluation loss و شاید معیارهای سفارشی که شما تعریف میکنید (مانند تطابق دقیق برای پرسش و پاسخ). در اینجا نحوه خواندن فال چای آورده شده است:
- Training loss در حال کاهش، eval loss ثابت یا در حال افزایش؟ شما در حال overfitting هستید—پاسخهای آموزشی خود را حفظ میکنید اما پاسخهای جدید را خراب میکنید.
- هر دو روند نزولی دارند؟ شما در مسیر درستی هستید.
- Loss مانند یک چوب پوگو بالا و پایین میپرد؟ Learning rate شما ممکن است خیلی زیاد باشد، یا مجموعه داده شما ناسازگار است.
اگر Tinker نسلهای پیشنمایش را در اواسط آموزش ارائه میدهد، خروجیهای جزئی را بررسی کنید. چند prompt را از مجموعه آزمایشی خود نمونهبرداری کنید و لحن/دقت را بررسی کنید. بله، کیفی است—اما شما در حال آموزش سبک هستید، نه اثبات فیزیک.
گام 6: نامگذاری کنید، مستقر کنید، فراخوانی کنید
هنگامی که کار به پایان میرسد، Tinker API شما را با یک شناسه مدل مانند ft:tinker-large-1:support-tone-v1:abc123 متبرک میکند. سپس میتوانید آن را در پشت یک endpoint مستقر کنید و آن را درست مانند مدل پایه فراخوانی کنید—فقط اکنون مانند تیم شما صحبت میکند.
مثال فراخوانی تولید:
curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{
"model": "ft:tinker-large-1:support-tone-v1:abc123",
"messages": [
{"role": "system", "content": "شما یک عامل پشتیبانی مختصر و دوستانه هستید.","role": "user", "content": "بازپرداخت من دیر شده و من ناراحتم."}],
"temperature": 0.4
}'
همچنین اگر مدل شما خیلی پرحرف یا خیلی مختصر میشود، میتوانید "presence_penalty" بالاتری یا "temperature" پایینتری تنظیم کنید. اسناد Tinker جزئیات تنظیمات را شرح میدهند—از آزمایش کردن نترسید.
گام 7: مانند یک مربی ارزیابی کنید، نه یک داور
شما به یک کارت امتیازی خودکار و یک کارت امتیازی انسانی نیاز دارید. معیارهای خودکار (BLEU، ROUGE، دقت) مرتب هستند اما نسبت به لحن کور هستند. انسانها مشکل "این لحن تند به نظر میرسد" را درک میکنند.
یک rubric کوچک تنظیم کنید:
- پیروی از دستورالعمل (1-5)
50-100 خروجی را از مجموعه held-out خود نمونهبرداری کنید. از دو نفر بخواهید که آنها را به طور مستقل رتبهبندی کنند. اگر میانگین یک دسته کمتر از 3 است، آن را به مجموعه داده خود برگردانید و مثالهای بیشتری اضافه کنید که رفتاری را که میخواهید نشان دهید.
گام 8: هزینه و عملکرد: آنچه که CFO شما و سرور شما به آن اهمیت میدهند
Fine-tuning با Tinker API در دو مکان هزینه دارد: آموزش و inference (استنتاج). آموزش یک دوی سرعت یکباره است. inference یک ماراتن است.
- طول token را کاهش دهید. prompts و خروجیهای کوتاهتر = صورتحسابهای کوچکتر.
- از یک system prompt استفاده کنید که سبک شما را مشخص میکند، اما دستورالعملهای بزرگ را در هر فراخوانی تکرار نکنید اگر Tinker از یک پیشفرض در سطح deployment پشتیبانی میکند.
- prompts مشترک را در صورت امکان cache کنید.
- یک استراتژی مسیریابی را در نظر بگیرید: از مدل بزرگ fine-tune شده خود فقط در صورت نیاز استفاده کنید؛ در غیر این صورت، به یک مدل کوچکتر و ارزانتر بازگردید.
Latency (تأخیر) نیز مهم است. اگر مدل fine-tune شده شما کندتر اجرا میشود، پنجرههای context کوچکتری را امتحان کنید، یا از مدل کوچک برای طبقهبندی و مدل بزرگ فقط برای متن مولد استفاده کنید.
گام 9: عیبیابی: بزرگترین موفقیتهای گرملینها
- مدل مانند یک صفحه شکسته خود را تکرار میکند.
- Temperature را کاهش دهید. مثالهایی با پاسخهای واضح و کوتاه اضافه کنید. اگر این گزینه وجود دارد، عرض پرتو را کاهش دهید.
- دستورالعملها را نادیده میگیرد.
- System prompt را تقویت کنید و مثالهای آموزشی را وارد کنید که پیروی دقیق از دستورالعمل را به نمایش بگذارند.
- حقایق را با خودستایی توهم میکند.
- مثالهایی را وارد کنید که میگویند "نمیدانم" یا به منابع پیوند میدهند؛ temperature را کاهش دهید؛ با بازیابی برای پاسخهای زمینی جفت کنید.
- خیلی خوب است. (بله، این یک چیز است.)
- مثالهای آموزشی را اضافه کنید که مرزها را تعیین میکنند و سیاستها را روشن میکنند—"ما نمیتوانیم X را انجام دهیم، اما در اینجا Y وجود دارد."
- آموزش در نیمه راه شکست میخورد.
- اعتبارسنجی مجموعه داده، کاراکترهای عجیب و غریب و طول token حداکثر را بررسی کنید. Batch size کوچکتری یا epochs کمتری را امتحان کنید.
گام 10: چه زمانی fine-tune کنیم در مقابل چه زمانی از prompts یا بازیابی استفاده کنیم
من عاشق fine-tuning هستم، اما این تنها چکش نیست. سه استراتژی رایج:
- Prompt engineering (مهندسی prompt) فقط: ارزانترین، سریعترین. عالی است وقتی فقط به یک تغییر لحن یا ثبات ساده نیاز دارید.
- Retrieval-augmented generation (RAG): عالی برای حقایق جدید و پایگاههای دانش بزرگ. مدل اسناد شما را در زمان اجرا میخواند.
- Fine-tuning: بهترین برای سبک، ساختار و الگوهای دامنه که روزانه تغییر نمیکنند.
اغلب، دستور العمل برنده کمی از هر کدام است: از RAG برای واکشی حقایق استفاده کنید، سپس آنها را به مدل fine-tune شده خود منتقل کنید تا با صدای مشخص شما پاسخ دهد.
یک آموزش سریع Tinker API که میتوانید کپی و paste کنید
در اینجا یک walkthrough ادغام شده و خیالی وجود دارد که بسیاری از پلتفرمهای سبک Tinker را منعکس میکند. Endpointها و شناسهها را با موارد واقعی خود جایگزین کنید.
- ایجاد و آپلود مجموعههای داده
curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune" curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval" curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{
"base_model": "tinker-medium-1",
"dataset_id": "ds_train",
"eval_dataset_id": "ds_eval",
"epochs": 4,
"learning_rate": 2e-5,
"suffix": "email-summarizer-v1"
}'
curl -N -H "Authorization: Bearer $TINKER_KEY"
- از مدل fine-tune شده استفاده کنید
curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{
"model": "ft:tinker-medium-1:email-summarizer-v1:xyz",
"prompt": "ایمیل زیر را در دو گلوله خلاصه کنید، لحن دوستانه:\n\n[PASTE EMAIL]",
"max_tokens": 160,
"temperature": 0.4
}'
سناریوهای واقعی: چه اتفاقی میافتد وقتی...
- شما روی ماکروهای پشتیبانی خود fine-tune میکنید
- به طور ناگهانی، هوش مصنوعی شما با همان ساختاری پاسخ میدهد که نمایندگان شما استفاده میکنند: عذرخواهی، اقدام، پیگیری. CSAT اغلب افزایش مییابد زیرا مردم ثبات را بیشتر از شگفتیها دوست دارند.
- شما روی صدای برند خود fine-tune میکنید
- مدل به سبک "ما مفید هستیم اما چسبنده نیستیم" شما میرسد. از اشتیاق 17 علامت تعجب اجتناب میکند. بازاریابی بهتر میخوابد.
- شما برای پیشنهادات کد fine-tune میکنید
- جفتهای توضیحات وظیفه و قطعههای کد ایدهآل را وارد کنید. مثالها را کوتاه و متمرکز نگه دارید. کد پر سر و صدا منجر به تکمیلهای پر سر و صدا میشود.
- شما برای طبقهبندی fine-tune میکنید
- بله، میتوانید. مثالهای برچسبگذاری شده را ارائه دهید و مدل را با prompts کوتاه فراخوانی کنید. برای برچسبهای دقیق، temperature را روی صفر تنظیم کنید.
ایمنی اول، آخر و همیشه
اگر مورد استفاده شما حوزههای تنظیم شده یا حساس را لمس میکند، خطوط روشنی را در system prompt و دادههای آموزشی خود ترسیم کنید. مثالهایی را اضافه کنید که امتناعها را به زیبایی نشان میدهند. خروجیها را ثبت کنید و به کاربران اجازه دهید مشکلات را گزارش کنند. مدلهای fine-tune شده میتوانند مطمئن باشند—آنها را آموزش دهید تا با اطمینان محتاط باشند.
جایگاه Sider.AI کجاست (و کجا نیست)
در اینجا یک شگفتی وجود دارد: Sider.AI میتواند یک همراه عالی باشد در حالی که شما در حال بررسی نحوه استفاده از Tinker API هستید. این مانند داشتن یک کمک خلبان محتاط است که اسناد را بدون شکایت میخواند. شما میتوانید مثالهای مجموعه داده را در نوار کناری Sider در حین مرور ایمیلها یا پایگاه دانش موجود خود پیشنویس کنید، سپس JSONL تمیز و سازگار را صادر کنید. این کار آموزش را برای شما اجرا نمیکند—این وظیفه Tinker است—اما برای پیشنویس، بازسازی و QA کردن مثالهای شما، فوقالعاده کاربردی است. از آن بپرسید، "این پاسخ را با یک صدای پشتیبانی آرام و انگلیسی ساده، در دو جمله بازنویسی کنید"، و شاهد جهش کیفیت مجموعه داده خود باشید. گرفتاریهایی که ای کاش کسی به من میگفت
- دادههای بیشتر همیشه بهتر نیستند—دادههای نماینده بیشتر بهتر هستند.
- در لحن overfitting نکنید. چند مثال wildcard را نگه دارید تا مدل بتواند هنگام خلاقیت کاربران بداههپردازی کند.
- همه چیز را نسخه بندی کنید: مجموعه داده v1.1، مدل v1.2، قالب prompt v3.0. آینده شما یک مافین تشکر برای شما ارسال خواهد کرد.
- یک دکمه بازگشت نگه دارید. اگر یک fine-tune جدید از ریل خارج شد، به سرعت مدل قبلی را دوباره مستقر کنید.
- با prompts واقعی کاربر ارزیابی کنید، نه فقط زیباترین مثالهای خود. کاربران شاعران هرج و مرج هستند.
یک چیز دیگر...
Fine-tuning با Tinker API در مورد ساخت Skynet نیست. این در مورد تراشیدن لبههای ناهموار است تا هوش مصنوعی شما احساس شود که بخشی از تیم شما است. کوچک شروع کنید، بیرحمانه اندازه بگیرید و نترسید که اعتراف کنید وقتی یک ترفند سادهتر (مانند prompts بهتر) کار را انجام میدهد.
زیرا وقتی هوش مصنوعی شما در نهایت به شکلی پاسخ میدهد که شما میخواهید؟ این فقط کارایی نیست. این عقلانیت است.
برگ تقلب
- نحوه استفاده از Tinker API برای fine-tune کردن مدل هوش مصنوعی خودتان: جفتهای JSONL تمیز و سازگار را آماده کنید؛ آپلود کنید؛ یک fine-tune را با پیشفرضهای معقول شروع کنید؛ با انسان و معیارها ارزیابی کنید؛ مستقر کنید و تکرار کنید.
- از fine-tuning برای سبک و الگوهای پایدار استفاده کنید؛ از بازیابی برای حقایق جدید استفاده کنید.
- هزینه را با prompts کوتاهتر، مدلهای کوچکتر و مسیریابی کنترل کنید.
- ایمنی را به عنوان بخشی صریح از مجموعه داده خود در نظر بگیرید.
- اجازه دهید ابزارهایی مانند Sider.AI به شما کمک کنند تا مثالهای بهتری را قبل از اینکه دکمه "آموزش" را بزنید، بسازید.
سوالات متداول
Q1:چگونه دادهها را برای fine-tune کردن مدل هوش مصنوعی خود با Tinker API آماده کنم؟
از JSONL با جفتهای دستورالعمل-پاسخ واضح یا جفتهای به سبک چت استفاده کنید. لحن را ثابت نگه دارید، اطلاعات حساس را ناشناس کنید و 10-20٪ را برای آزمایش نگه دارید تا با امتیازهای باد کرده خودتان را فریب ندهید.
سوال 2: آیا تنظیم دقیق با Tinker API بهتر از مهندسی پرامپت است؟
از پرامپتها برای تغییرات سریع لحن و رفتارهای ساده استفاده کنید؛ از تنظیم دقیق زمانی استفاده کنید که به سبک، ساختار یا الگوهای دامنه بادوام نیاز دارید. بسیاری از تیمها هر دو را با هم ترکیب میکنند - RAG برای حقایق، تنظیم دقیق برای صدا.
سوال 3: برای تنظیم دقیق یک مدل با Tinker API به چه مقدار داده نیاز دارم؟
کیفیت بر کمیت برتری دارد. چند صد مثال قوی میتوانند از هزاران مثال پر سر و صدا عملکرد بهتری داشته باشند. از کم شروع کنید، ارزیابی کنید، سپس مثالهای هدفمندی را که مدل در آن مشکل دارد اضافه کنید.
سوال 4: چگونه یک مدل تنظیم شده دقیق را در Tinker API مستقر کنم؟
پس از آموزش، Tinker یک شناسه مدل {model ID} را برمیگرداند که میتوانید از طریق نقاط پایانی استاندارد تکمیل یا چت با آن تماس بگیرید. یک پرامپت سیستمی مفید تنظیم کنید، دما را تنظیم کنید و خروجیها را در ترافیک واقعی نظارت کنید.
سوال 5: چگونه از توهم زدن مدل تنظیم شده دقیق خود جلوگیری کنم؟
با مثالهایی که عدم قطعیت را میپذیرند آموزش دهید، دما را پایین بیاورید و برای حقایق با بازیابی جفت کنید. «ذکر منابع» یا «گفتن اینکه نمیدانید» را بخشی از دستورالعمل و دادههای آموزشی قرار دهید.