How do I prepare data to fine-tune my own AI model with Tinker API?

Use JSONL with clear instruction–response or chat-style pairs. Keep tone consistent, anonymize sensitive info, and hold out 10–20% for testing so you don’t fool yourself with inflated scores.

Is fine-tuning with Tinker API better than prompt engineering?

Use prompts for quick tone tweaks and simple behaviors; use fine-tuning when you need durable style, structure, or domain patterns. Many teams combine both—RAG for facts, fine-tune for voice.

How much data do I need to fine-tune a model with Tinker API?

Quality beats quantity. A few hundred strong examples can outperform thousands of noisy ones. Start small, evaluate, then add targeted examples where the model struggles.

How do I deploy a fine-tuned model in Tinker API?

After training, Tinker returns a model ID you can call via the standard completions or chat endpoint. Set a helpful system prompt, tune temperature, and monitor outputs in real traffic.

How do I stop my fine-tuned model from hallucinating?

Train with examples that admit uncertainty, lower temperature, and pair with retrieval for facts. Make “cite sources” or “say you don’t know” part of the instruction and the training data.

هل تمنيت يومًا أن يبدو الذكاء الاصطناعي الخاص بك أقل شبهاً بروبوت الأرصاد الجوية وأكثر شبهاً... بك؟

تخيل هذا: تطلب من الذكاء الاصطناعي الخاص بك تلخيص رسالة بريد إلكتروني لعميل، فيرد وكأنه يروي نشرة الأحوال الجوية البحرية. صحيح من الناحية الفنية؛ لكنه غير مفيد روحانيًا. ما تريده حقًا هو الذكاء الاصطناعي الخاص بك - أسلوبك، مصطلحاتك الخاصة، تفضيلاتك - دون الحاجة إلى بناء مختبر أبحاث في المرآب الخاص بك.

هنا يأتي دور الضبط الدقيق. وإذا سمعت همسات عن "Tinker API"، فأنت في المكان الصحيح. هذا هو الدليل الإرشادي لضبط النموذج الخاص بك من الذكاء الاصطناعي باستخدام Tinker API - حتى تحصل في المرة القادمة التي تكتب فيها "اكتب ردًا" على شيء يبدو وكأنه فريقك، وليس ابن عم HAL 9000.

سوف نسير في كل شيء: ما يعنيه الضبط الدقيق، وكيفية إعداد بياناتك، وكيفية تشغيل الضبط الدقيق باستخدام Tinker API، وكيفية عدم تفجير ميزانيتك (أو صبرك). سأخبرك أيضًا بأماكن تواجد العفاريت - لأن الضبط الدقيق قوي، لكنه ليس عرابة ساحرة.

تنبيه بشأن الكلمات الرئيسية: سنقول "كيفية استخدام Tinker API" كثيرًا، لأن هذا هو السؤال الذي جئت من أجله. سندمج أيضًا مصطلحات طويلة الذيل مثل "ضبط النموذج الخاص بك من الذكاء الاصطناعي بدقة" و "Tinker API tutorial" و "إعداد مجموعة البيانات للضبط الدقيق" و "نشر نموذج مضبوط بدقة". إذا بدا ذلك كثيرًا، فلا تقلق - سأبقيه إنسانيًا.

ما هو الضبط الدقيق - وما هو ليس كذلك

إذا كان نموذج الذكاء الاصطناعي العام عبارة عن سكين سويسري، فإن الضبط الدقيق هو أن تقول: "اسمع يا سكين، سنجعلك جيدًا جدًا جدًا في فتح الطرود." أنت لا تخترع السكين. أنت تعلمها الورق المقوى المفضل لديك.

من الناحية العملية، يعني الضبط الدقيق أنك تأخذ نموذجًا أساسيًا (تم تدريبه بالفعل على محيطات من نصوص الإنترنت) وتدفعه بأمثلتك - أسلوب كتابتك، والأسئلة والأجوبة الخاصة بمجالك، ونصوص الدعم الخاصة بك - بحيث يستجيب بالطريقة التي تريدها. إنه مثل إعطاء النموذج دليل أسلوب ومجموعة من اختبارات الممارسة.

لكن الضبط الدقيق ليس تعويذة سحرية. لن يتعلم فجأة الحقائق التي لم يرها من قبل ما لم تعلم بياناتك هذه الأنماط. كما أنه لن "يتذكر" المستندات الضخمة ذات الملكية الخاصة ما لم تقم بتغذية مقتطفات تمثيلية. وإذا كانت بياناتك فوضوية أو متناقضة أو صغيرة، فسوف يرث النموذج الخاص بك هذه العادات مثلما ترث فرقة روك مراهقة إيقاع عازف الطبول.

خط سير الرحلة السريع

إليك نظرة عامة على كيفية استخدام Tinker API لضبط النموذج الخاص بك من الذكاء الاصطناعي بدقة:

اختر نموذجًا أساسيًا في Tinker API.

قم بإعداد مجموعة بيانات نظيفة ومتوازنة مع مطالبات واستجابات مثالية.

قم بتحميل مجموعة البيانات الخاصة بك إلى Tinker.

قم بإنشاء وظيفة ضبط دقيق مع معلمات فائقة واضحة.

راقب التدريب، وقم بتقييم النتائج باستخدام مجموعة اختبار محجوبة.

انشر واستدعي النموذج المضبوط بدقة في الإنتاج.

كرر العملية عندما تكتشف غرابة.

سوف نسير خطوة بخطوة، مع أمثلة بأسلوب التعليمات البرمجية يمكنك لصقها، ونصائح منعتني من الصراخ في شاشتي.

الخطوة 1: اختر النموذج الأساسي الخاص بك كما لو كنت تختار سيارة مستأجرة

لن تستأجر شاحنة تتسع لـ 15 مقعدًا لكي تصفها في موقف مواز في مانهاتن. وبالمثل، لا تختر نموذجًا ضخمًا إذا كنت بحاجة إلى ردود سريعة ورخيصة لمليون طلب يومي. يقدم Tinker API عادةً عددًا قليلاً من عائلات النماذج - خفيفة الوزن ومتوسطة الحجم و "يا له من ذكاء".

إذا كنت بحاجة إلى السرعة وتوفير التكاليف: اختر القاعدة الأصغر.

إذا كنت بحاجة إلى الفروق الدقيقة أو المنطق أو الكتابة المطولة: اختر القاعدة الأكبر.

إذا كان لمجالك الكثير من المصطلحات (الطبية والقانونية ووحدات الماكرو للدعم): فإن النماذج المتوسطة إلى الكبيرة تقوم بالضبط الدقيق بشكل أكثر مثمرًا.

نصيحة احترافية: ابدأ أصغر لعمل نموذج أولي. إذا قفزت المقاييس الرئيسية الخاصة بك، فانقل نفس مجموعة البيانات إلى قاعدة أكبر.

الخطوة 2: قم بإعداد مجموعة البيانات الخاصة بك كما لو كانت بطاقة وصفة، وليست درج الخردة الخاص بك

مجموعة البيانات الخاصة بك هي الرافعة المالية الأكبر لجودة واحدة. يتعلم النموذج عن طريق التقليد؛ إذا كانت الأمثلة غامضة، فإن النموذج يتعلم أن يكون غامضًا. إذا كانت واضحة ومتسقة ومتنوعة، يصبح النموذج الخاص بك زميلًا في العمل مفيدًا يقرأ المذكرة بالفعل.

استهدف تنسيق JSONL (JSON Lines) مع أزواج تعليمات-استجابة صريحة. لضبط نمط الدردشة، قم بتضمين أدوارًا مثل النظام/المستخدم/المساعد. حافظ على كل مثال قصيرًا إلى متوسط؛ عشرات الأمثلة عالية الجودة تتفوق على ألف مثال صاخب.

مثال (نمط التعليمات):

{"instruction": "لخص تذكرة الدعم هذه في جملتين، بأسلوب ودود.", "input": "أبلغ العميل عن خطأ 404 عند النقر فوق 'تتبع الطلب'", "output": "شكرًا لك على الإبلاغ عن هذا! يظهر الموقع خطأ 404 عندما ينقر العملاء فوق 'تتبع الطلب'. نحن نحقق في رابط معطل في صفحة تتبع الطلب وسنتابع بإصلاح."

مثال (نمط الدردشة):

{"messages": [ {"role": "system", "content": "أنت وكيل دعم موجز وودود. استخدم اللغة الإنجليزية البسيطة.", {"role": "user", "content": "تم تجديد اشتراكي ولكن البطاقة منتهية الصلاحية. مساعدة؟"}, {"role": "assistant", "content": "آسف بشأن الصداع! لقد أعدت فحص خطتك - محاولة التجديد على بطاقة منتهية الصلاحية. يرجى تحديث بطاقتك على صفحة الفوترة؛ سأعيد محاولة تحصيل الرسوم بمجرد حفظها." ]}

نصائح لإعداد مجموعة البيانات للضبط الدقيق:

الاتساق هو الملكة. استخدم دائمًا نفس النبرة والتوقيعات والهيكل.

وازن بين مواضيعك. إذا كان 90% من الأمثلة عبارة عن عمليات استرداد، فسيصبح النموذج الخاص بك جنية الاسترداد.

ضع علامة على الحالات الصعبة. قم بتضمين أمثلة سلبية (ما لا يجب قوله)، إذا كان Tinker API يدعم إشارة تفضيل.

حافظ على سلامتها. قم بإزالة البيانات الشخصية. إذا كنت تعمل بمعلومات حساسة، فقم بإخفاء هويتها أو تجميعها.

احتفظ بنسبة 10-20% من بياناتك كمجموعة اختبار. إذا قمت بالتقييم على مجموعة التدريب، فسوف تخدع نفسك بالتفكير في أن النموذج عبقري. اسألني كيف أعرف.

الخطوة 3: قم بتحميل بياناتك إلى Tinker API بدون دموع

تقدم معظم منصات الضبط الدقيق نقطة نهاية تخزين. مع Tinker API، ستفعل عادةً ما يلي:

قم بإنشاء مورد مجموعة بيانات (على سبيل المثال، POST /datasets)

قم بتحميل ملف JSONL الخاص بك

تحقق من صحة المخطط (عادةً ما يُرجع Tinker تقريرًا مفيدًا: عدد مرات OK والأخطاء والحقول الغريبة)

مثال زائف (curl-ish):

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"

إذا كان Tinker API يدعم CLI، فستصبح الحياة أسهل:

تحميل

tinker datasets upload my_finetune_data.jsonl --purpose finetune

تحقق

tinker datasets validate DATASET_ID

أخطاء التحقق هي صديقك. إنها تبدو قاسية، لكنها تنقذك من حالات فشل التدريب الغامضة في الساعة 2 صباحًا.

الخطوة 4: ابدأ وظيفة ضبط دقيق واختر إعدادات سليمة

ستبدأ وظيفة تشير إلى مجموعة البيانات الخاصة بك والنموذج الأساسي الذي اخترته. تقبل معظم نقاط نهاية الضبط الدقيق في Tinker API معلمات مثل الحقب ومعدل التعلم وحجم الدفعة وتكرار التقييم. الترجمة: عدد مرات المرور على بياناتك، ومدى عدوانية تعلم النموذج، وعدد الأمثلة التي يدرسها مرة واحدة، وعدد المرات التي يعرض فيها تقريرًا مرحليًا.

مثال على الطلب:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-large-1", "dataset_id": "ds_abc123", "epochs": 3, "learning_rate": 1e-5, "batch_size": 8, "eval_dataset_id": "ds_eval789", "suffix": "support-tone-v1" }'

الإعدادات الافتراضية السليمة:

الحقب: 3-5 لمجموعات البيانات الصغيرة إلى المتوسطة. المزيد ليس دائمًا أفضل؛ في بعض الأحيان يكون مجرد تركيب زائد مع خطوات إضافية.

معدل التعلم: ابدأ متحفظًا (1e-5 أو 2e-5). إذا تعلم النموذج بسرعة كبيرة، فإنه ينسى ذكائه العام.

حجم الدفعة: أيًا كان الحصة المخصصة لك، ولكن لا تقلق - تأتي مكاسب الأداء في الغالب من البيانات الجيدة.

الإيقاف المبكر: إذا كان Tinker API يقدمه، فقم بتمكينه. إنه "هل وصلنا إلى هناك بعد؟" الخاص بالتعلم الآلي الذي يقول أحيانًا "نعم".

الخطوة 5: راقب التدريب مثل الصقر - ولكن الصقر الهادئ

عادةً ما يقوم Tinker ببث السجلات: فقدان التدريب، وفقدان التقييم، وربما المقاييس المخصصة التي تحددها (مثل المطابقة التامة للأسئلة والأجوبة). إليك كيفية قراءة أوراق الشاي:

فقدان التدريب آخذ في الانخفاض، وفقدان التقييم ثابت أو مرتفع؟ أنت تقوم بالتركيب الزائد - حفظ إجابات التدريب الخاصة بك ولكن ارتكاب أخطاء جديدة.

كلاهما يتجه نحو الأسفل؟ أنت على المسار الصحيح.

الخسارة ترتد مثل عصا بوجو؟ قد يكون معدل التعلم الخاص بك مرتفعًا جدًا، أو أن مجموعة البيانات الخاصة بك غير متسقة.

تحقق من المخرجات الجزئية إذا كان Tinker يقدم معاينات للجيل في منتصف التدريب. قم بأخذ عينة من عدد قليل من المطالبات من مجموعة الاختبار الخاصة بك وتحقق من النبرة/الدقة. نعم، إنه وصفي - لكنك تقوم بتدريب الأسلوب، وليس إثباتات الفيزياء.

الخطوة 6: قم بتسميته ونشره واستدعاءه

عندما تنتهي الوظيفة، سيباركك Tinker API بمعرف نموذج مثل ft:tinker-large-1:support-tone-v1:abc123. يمكنك بعد ذلك نشره خلف نقطة نهاية واستدعائه تمامًا مثل النموذج الأساسي - ولكن الآن يتحدث مثل فريقك.

مثال على استدعاء الإنشاء:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-large-1:support-tone-v1:abc123", "messages": [ {"role": "system", "content": "أنت وكيل دعم موجز وودود.", {"role": "user", "content": "استردادي متأخر وأنا منزعج." ], "temperature": 0.4 }'

يمكنك أيضًا تعيين "presence_penalty" أعلى أو "temperature" أقل إذا كان النموذج الخاص بك يصبح ثرثارًا جدًا أو مقتضبًا جدًا. ستوضح مستندات Tinker المقابض - لا تخجل من التجربة.

الخطوة 7: قم بالتقييم مثل المدرب، وليس القاضي

ستريد بطاقة أداء تلقائية وبطاقة أداء بشرية. المقاييس التلقائية (BLEU، ROUGE، الدقة) مرتبة ولكنها عمياء عن النبرة. يكتشف البشر مشكلة "هذا يبدو وقحًا".

قم بإعداد قاعدة تقييم صغيرة:

تطابق النبرة (1-5)

اتباع التعليمات (1-5)

الحقيقة (1-5)

التحكم في الطول (1-5)

السلامة/الامتثال (1-5)

قم بأخذ عينة من 50-100 مخرجات من المجموعة المحجوبة الخاصة بك. اطلب من شخصين تقييمها بشكل مستقل. إذا كان متوسط الفئة أقل من 3، فارجع بها إلى مجموعة البيانات الخاصة بك وأضف المزيد من الأمثلة التي توضح السلوك الذي تريده.

الخطوة 8: التكلفة والأداء: ما الذي تهتم به مديرة الشؤون المالية والخادم الخاص بك

الضبط الدقيق باستخدام Tinker API يكلف المال في مكانين: التدريب والاستدلال. التدريب هو سباق سريع لمرة واحدة؛ الاستدلال هو الماراثون.

تقليل طول الرمز المميز. المطالبات والمخرجات الأقصر = فواتير أصغر.

استخدم مطالبة نظام تؤطر أسلوبك، ولكن لا تكرر التعليمات الضخمة في كل مكالمة إذا كان Tinker يدعم إعدادًا افتراضيًا على مستوى النشر.

قم بتخزين المطالبات الشائعة مؤقتًا حيثما أمكن ذلك.

ضع في اعتبارك استراتيجية التوجيه: استخدم النموذج الكبير المضبوط بدقة فقط عند الحاجة؛ وإلا، فارجع إلى نموذج أصغر وأرخص.

يعد زمن الوصول مهمًا أيضًا. إذا كان النموذج المضبوط بدقة يعمل بشكل أبطأ، فحاول استخدام نوافذ سياق أصغر، أو استخدم النموذج الصغير للتصنيف والنموذج الكبير فقط للنصوص التوليدية.

الخطوة 9: استكشاف الأخطاء وإصلاحها: أعظم أغاني العفاريت

يكرر النموذج نفسه مثل تسجيل مكسور.

خفض درجة الحرارة؛ أضف أمثلة بإجابات واضحة وقصيرة؛ قلل عرض الحزمة إذا كان هذا خيارًا.

يتجاهل التعليمات.

عزز مطالبة النظام وقم بتضمين أمثلة تدريبية تعرض اتباعًا صارمًا للتعليمات.

يهلوس الحقائق بتبجح.

قم بتضمين أمثلة تقول "لا أعرف" أو تربط بالمصادر؛ خفض درجة الحرارة؛ قم بالاقتران بالاسترجاع لترسيخ الاستجابات.

إنه لطيف جدًا. (نعم، هذا شيء.)

أضف أمثلة تدريبية تحدد الحدود وتوضح السياسات - "لا يمكننا فعل X، ولكن إليك Y."

يفشل التدريب في منتصف الطريق.

تحقق من صحة مجموعة البيانات والأحرف الغريبة وأطوال الرمز المميز القصوى. حاول استخدام حجم دفعة أصغر أو عدد أقل من الحقب.

الخطوة 10: متى يتم الضبط الدقيق مقابل متى يتم استخدام المطالبات أو الاسترجاع

أنا أحب الضبط الدقيق، لكنه ليس المطرقة الوحيدة. ثلاث استراتيجيات شائعة:

هندسة المطالبات فقط: الأرخص والأسرع. رائع عندما تحتاج فقط إلى تعديل النبرة أو اتساق بسيط.

إنشاء معزز بالاسترجاع (RAG): رائع للحقائق الحديثة وقواعد المعرفة الكبيرة. يقرأ النموذج المستندات الخاصة بك في وقت التشغيل.

الضبط الدقيق: الأفضل للأسلوب والهيكل وأنماط المجال التي لا تتغير يوميًا.

غالبًا ما تكون الوصفة الفائزة عبارة عن القليل من كل شيء: استخدم RAG لجلب الحقائق، ثم مررها إلى النموذج المضبوط بدقة حتى يجيب بصوتك المميز.

برنامج تعليمي سريع لـ Tinker API يمكنك نسخه ولصقه

إليك شرح تفصيلي موحد وخيالي يعكس العديد من المنصات ذات النمط Tinker. استبدل نقاط النهاية والمعرفات بنقاطك الحقيقية.

إنشاء وتحميل مجموعات البيانات

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune"

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval"

بدء الضبط الدقيق

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-medium-1", "dataset_id": "ds_train", "eval_dataset_id": "ds_eval", "epochs": 4, "learning_rate": 2e-5, "suffix": "email-summarizer-v1" }'

دفق السجلات

curl -N -H "Authorization: Bearer $TINKER_KEY"

استخدم النموذج المضبوط بدقة

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-medium-1:email-summarizer-v1:xyz", "prompt": "لخص البريد الإلكتروني التالي في نقطتين، بأسلوب ودود:\n\n[لصق البريد الإلكتروني]", "max_tokens": 160, "temperature": 0.4 }'

سيناريوهات من الحياة الواقعية: ماذا يحدث عندما...

تقوم بالضبط الدقيق على وحدات الماكرو الخاصة بالدعم

فجأة، يجيب الذكاء الاصطناعي الخاص بك بنفس الهيكل الذي يستخدمه وكلاؤك: الاعتذار والإجراء والمتابعة. غالبًا ما يرتفع CSAT لأن الناس يحبون الاتساق أكثر من المفاجآت.

تقوم بالضبط الدقيق على صوت علامتك التجارية

يثبت النموذج أسلوبك "نحن مفيدون ولكن لسنا متشبثين". يتجنب حماس 17 علامة تعجب. يسود السلام على فريق التسويق.

تقوم بالضبط الدقيق لاقتراحات التعليمات البرمجية

قم بتضمين أزواج من أوصاف المهام ومقتطفات التعليمات البرمجية المثالية. حافظ على الأمثلة قصيرة ومركزة؛ التعليمات البرمجية الصاخبة تؤدي إلى عمليات إكمال صاخبة.

تقوم بالضبط الدقيق للتصنيف

نعم، يمكنك ذلك. قدم أمثلة مصنفة واستدعي النموذج بمطالبات قصيرة. للحصول على تسميات صارمة، اضبط درجة الحرارة على صفر.

السلامة أولاً وأخيرًا ودائمًا

إذا كانت حالة الاستخدام الخاصة بك تمس مجالات منظمة أو حساسة، فارسم خطوطًا مشرقة في مطالبة النظام وبيانات التدريب الخاصة بك. أضف أمثلة توضح الرفض بأدب. سجل المخرجات واسمح للمستخدمين بالإبلاغ عن المشكلات. يمكن أن تكون النماذج المضبوطة بدقة واثقة - قم بتدريبها على أن تكون حريصة بثقة.

أين تتناسب Sider.AI (وأين لا تتناسب)

إليك مفاجأة: يمكن أن تكون Sider.AI رفيقًا رائعًا بينما تكتشف كيفية استخدام Tinker API. إنه مثل وجود مساعد طيار حريص يقرأ المستندات دون شكوى. يمكنك صياغة أمثلة مجموعة البيانات في الشريط الجانبي لـ Sider أثناء تصفح رسائل البريد الإلكتروني أو قاعدة المعرفة الحالية، ثم تصدير JSONL نظيف ومتسق. لن يقوم بتشغيل وظيفة التدريب نيابة عنك - هذا هو مسار Tinker - ولكن لصياغة أمثلتك وإعادة هيكلتها وضمان جودتها، فهو عملي بشكل رائع. حاول أن تطلب منه، "أعد كتابة هذا الرد بصوت دعم هادئ باللغة الإنجليزية البسيطة، جملتين،" وشاهد جودة مجموعة البيانات الخاصة بك تقفز.

المآزق التي أتمنى أن يكون شخص ما قد أخبرني بها

المزيد من البيانات ليس دائمًا أفضل - المزيد من البيانات التمثيلية أفضل.

لا تبالغ في تركيب النبرة. احتفظ ببعض الأمثلة غير المتوقعة حتى يتمكن النموذج من الارتجال عندما يصبح المستخدمون مبدعين.

قم بوضع إصدار لكل شيء: مجموعة البيانات v1.1، النموذج v1.2، قالب المطالبة v3.0. سيشكرك المستقبل ويرسل لك كعكة مافن.

احتفظ بزر التراجع. إذا انحرفت عملية ضبط دقيق جديدة عن مسارها، فأعد نشر النموذج السابق بسرعة.

قم بالتقييم باستخدام مطالبات المستخدم الحقيقية، وليس فقط أجمل الأمثلة الخاصة بك. المستخدمون هم شعراء الفوضى.

شيء أخير...

الضبط الدقيق باستخدام Tinker API لا يتعلق ببناء Skynet. يتعلق الأمر بحلاقة الحواف الخشنة حتى يبدو الذكاء الاصطناعي الخاص بك وكأنه جزء من فريقك. ابدأ صغيرًا، وقم بالقياس بلا رحمة، ولا تخف من الاعتراف عندما تفعل حيلة أبسط (مثل المطالبات الأفضل) المهمة.

لأنه عندما يجيب الذكاء الاصطناعي الخاص بك أخيرًا بالطريقة التي تفعلها؟ هذا ليس مجرد كفاءة. هذا هو المنطق.

ورقة الغش

كيفية استخدام Tinker API لضبط النموذج الخاص بك من الذكاء الاصطناعي بدقة: قم بإعداد أزواج JSONL نظيفة ومتسقة؛ قم بالتحميل؛ ابدأ الضبط الدقيق بإعدادات افتراضية سليمة؛ قم بالتقييم مع البشر والمقاييس؛ انشر وكرر.

استخدم الضبط الدقيق للأسلوب والأنماط المستقرة؛ استخدم الاسترجاع للحقائق الحديثة.

تحكم في التكلفة باستخدام مطالبات أقصر ونماذج أصغر وتوجيه.

اجعل السلامة جزءًا صريحًا من مجموعة البيانات الخاصة بك.

دع أدوات مثل Sider.AI تساعدك على صياغة أمثلة أفضل قبل أن تضغط على "تدريب".

الأسئلة الشائعة

س1: كيف أقوم بإعداد البيانات لضبط النموذج الخاص بي من الذكاء الاصطناعي بدقة باستخدام Tinker API؟ استخدم JSONL مع أزواج تعليمات-استجابة أو أزواج نمط الدردشة الواضحة. حافظ على تناسق النبرة وإخفاء هوية المعلومات الحساسة واحتفظ بنسبة 10-20% للاختبار حتى لا تخدع نفسك بنتائج متضخمة.

س2: هل الضبط الدقيق باستخدام واجهة برمجة التطبيقات Tinker أفضل من هندسة المطالبات؟ استخدم المطالبات لإجراء تعديلات سريعة على النبرة والسلوكيات البسيطة؛ واستخدم الضبط الدقيق عندما تحتاج إلى نمط أو هيكل أو أنماط مجال دائمة. تجمع العديد من الفرق بين الاثنين - RAG للحقائق، والضبط الدقيق للصوت.

س3: ما مقدار البيانات التي أحتاجها لضبط نموذج باستخدام واجهة برمجة التطبيقات Tinker؟ الجودة تتفوق على الكمية. يمكن أن يتفوق بضع مئات من الأمثلة القوية على آلاف الأمثلة المشوشة. ابدأ صغيرًا، ثم قم بالتقييم، ثم أضف أمثلة مستهدفة حيث يعاني النموذج.

س4: كيف أقوم بنشر نموذج تم ضبطه بدقة في واجهة برمجة التطبيقات Tinker؟ بعد التدريب، تُرجع Tinker معرّف نموذج يمكنك الاتصال به عبر نقاط النهاية القياسية للإكمال أو الدردشة. اضبط مطالبة نظام مفيدة، واضبط درجة الحرارة، وراقب المخرجات في حركة المرور الحقيقية.

س5: كيف أمنع النموذج الذي تم ضبطه بدقة من الهلوسة؟ تدرب بأمثلة تقر بالشك، وخفض درجة الحرارة، واقرنها بالاسترجاع للحقائق. اجعل "ذكر المصادر" أو "قل إنك لا تعرف" جزءًا من التعليمات وبيانات التدريب.