How do I prepare data to fine-tune my own AI model with Tinker API?

Use JSONL with clear instruction–response or chat-style pairs. Keep tone consistent, anonymize sensitive info, and hold out 10–20% for testing so you don’t fool yourself with inflated scores.

Is fine-tuning with Tinker API better than prompt engineering?

Use prompts for quick tone tweaks and simple behaviors; use fine-tuning when you need durable style, structure, or domain patterns. Many teams combine both—RAG for facts, fine-tune for voice.

How much data do I need to fine-tune a model with Tinker API?

Quality beats quantity. A few hundred strong examples can outperform thousands of noisy ones. Start small, evaluate, then add targeted examples where the model struggles.

How do I deploy a fine-tuned model in Tinker API?

After training, Tinker returns a model ID you can call via the standard completions or chat endpoint. Set a helpful system prompt, tune temperature, and monitor outputs in real traffic.

How do I stop my fine-tuned model from hallucinating?

Train with examples that admit uncertainty, lower temperature, and pair with retrieval for facts. Make “cite sources” or “say you don’t know” part of the instruction and the training data.

เคยอยากให้ AI ของคุณฟังดูไม่เหมือนกับหุ่นยนต์พยากรณ์อากาศ แต่ฟังดูเหมือน... ตัวคุณเองไหม?

ลองนึกภาพนี้: คุณขอให้ AI สรุปอีเมลจากลูกค้า และมันตอบเหมือนกำลังเล่า Shipping Forecast ถูกต้องตามเทคนิคแต่ไม่ช่วยในแง่อารมณ์ สิ่งที่คุณต้องการจริงๆ คือ AI ของคุณ—ในโทนเสียงของคุณ ใช้ศัพท์เฉพาะและความชอบส่วนตัว โดยไม่ต้องสร้างห้องทดลองวิจัยในโรงรถของคุณเอง

นั่นคือเหตุผลที่การปรับแต่งแบบละเอียด (fine-tuning) มีประโยชน์ และถ้าคุณได้ยินชื่อ “Tinker API” นี่คือคู่มือทำอย่างไรให้ปรับแต่ง AI ของคุณเองด้วย Tinker API—เพื่อครั้งต่อไปที่คุณพิมพ์ “ร่างคำตอบ” คุณจะได้สิ่งที่ฟังดูเหมือนทีมของคุณ แทนที่จะเป็นญาติของ HAL 9000

เราจะพาคุณผ่านทั้งหมด: ความหมายของการปรับแต่งแบบละเอียด, วิธีเตรียมข้อมูล, วิธีรัน fine-tuning ด้วย Tinker API และวิธีไม่ให้ใช้งบหรือความอดทนเกินพอดี ผมจะแนะนำจุดที่อาจมีปัญหาให้ด้วย—เพราะ fine-tuning นั้นทรงพลัง แต่ไม่ใช่นางฟ้าแม่ทูนหัว

แจ้งล่วงหน้าเรื่องคีย์เวิร์ด: เราจะพูดคำว่า “วิธีใช้ Tinker API” บ่อยมาก เพราะนั่นคือคำถามที่คุณมาถาม เราจะสอดแทรกคำศัพท์แบบ long-tail อย่าง “ปรับแต่ง AI ของคุณเอง,” “บทเรียน Tinker API,” “เตรียม dataset สำหรับ fine-tuning,” และ “deploy โมเดลที่ได้รับการปรับแต่ง” ถ้าฟังดูเยอะ ไม่ต้องกังวล—ผมจะทำให้เข้าใจง่ายและเป็นกันเอง

Fine-tuning คืออะไร—และไม่ใช่อะไร

ถ้าโมเดล AI ทั่วไปเป็นเหมือนมีดสวิส (Swiss Army knife), fine-tuning คือคุณบอกมีดว่า “ฟังนะ เราจะทำให้คุณเก่งมากในการเปิดกล่องพัสดุ” คุณไม่ได้ประดิษฐ์มีดขึ้นมาใหม่ แต่คุณกำลังสอนมันเกี่ยวกับกระดาษลังที่คุณชอบใช้

ในทางปฏิบัติ fine-tuning หมายถึงคุณเอาโมเดลฐาน (ที่ถูกฝึกมาแล้วจากข้อมูลจำนวนมหาศาลบนอินเทอร์เน็ต) และปรับโดยใช้ตัวอย่างของคุณเอง—สไตล์การเขียน คำถาม-คำตอบเฉพาะโดเมน สคริปต์ซัพพอร์ต เพื่อให้มันตอบแบบที่คุณชอบ เหมือนส่งคู่มือสไตล์และแบบฝึกหัดให้โมเดล

แต่ fine-tuning ไม่ใช่เวทมนตร์ มันจะไม่เรียนรู้ข้อเท็จจริงที่ไม่เคยเห็นถ้าข้อมูลของคุณไม่สอนมัน และมันจะไม่ “จดจำ” เอกสารลับปริมาณมากถ้าคุณไม่ป้อนชิ้นส่วนตัวแทน และถ้าข้อมูลคุณรก ขัดแย้ง หรือน้อยเกินไป โมเดลของคุณจะรับนิสัยพวกนั้นไปเหมือนวงดนตรีวัยรุ่นที่ซ้อมตามจังหวะมือกลองของพวกเขา

เส้นทางแบบย่อ

นี่คือภาพรวมคร่าวๆ ของวิธีใช้ Tinker API เพื่อ fine-tune โมเดล AI ของคุณเอง:

เลือกโมเดลฐานใน Tinker API

เตรียม dataset ที่สะอาดและสมดุล มี prompt และคำตอบที่เหมาะสม

อัปโหลด dataset ของคุณไปที่ Tinker

สร้างงาน fine-tuning โดยระบุ hyperparameter อย่างชัดเจน

ติดตามการฝึก ประเมินผลด้วยชุดทดสอบที่แยกไว้

deploy และเรียกใช้โมเดลที่ได้รับการปรับแต่งใน production

วนลูปแก้ไขเมื่อเจอข้อผิดปกติ

เราจะไปทีละขั้นตอน พร้อมตัวอย่างโค้ดสไตล์ที่คุณสามารถคัดลอกได้ และเคล็ดลับที่ช่วยผมไม่ตะโกนใส่หน้าจอ

ขั้นตอนที่ 1: เลือกโมเดลฐานเหมือนเลือกเช่ารถ

คุณจะไม่เช่ารถตู้ 15 ที่นั่งเพื่อขับในแมนฮัตตันแบบจอดขนาน เช่นเดียวกัน อย่าเลือกโมเดลใหญ่เกินไปถ้าคุณต้องการตอบเร็วและถูกสำหรับการเรียกใช้ล้านครั้งต่อวัน Tinker API จะมีโมเดลครอบครัวให้เลือก หลากหลายแบบ: เบา กลาง และ “ว้าว นั่นฉลาดจริง”

ถ้าคุณต้องการความเร็วและประหยัด: เลือกโมเดลฐานขนาดเล็ก

ถ้าคุณต้องการความซับซ้อน การใช้เหตุผล หรือเขียนแบบยาว: เลือกโมเดลฐานขนาดใหญ่

ถ้าโดเมนของคุณมีศัพท์เฉพาะเยอะ (การแพทย์ กฎหมาย หรือสคริปต์ซัพพอร์ต): โมเดลกลางถึงใหญ่ปรับแต่งได้ผลดีกว่า

คำแนะนำมือโปร: เริ่มจากโมเดลขนาดเล็กเพื่อทดลอง ถ้าค่าตัวชี้วัดของคุณดีขึ้น ให้ย้าย dataset เดิมไปใช้โมเดลใหญ่กว่า

ขั้นตอนที่ 2: เตรียม dataset เหมือนบัตรสูตร ไม่ใช่ลิ้นชักขยะ

Dataset ของคุณคือคันโยกที่ใหญ่ที่สุดสำหรับคุณภาพ โมเดลเรียนรู้จากการเลียนแบบ ถ้าตัวอย่างคลุมเครือ โมเดลก็จะตอบแบบคลุมเครือ ถ้าชัดเจน สม่ำเสมอ และหลากหลาย โมเดลของคุณจะกลายเป็นเพื่อนร่วมงานที่อ่าน memo จริงๆ

ใช้รูปแบบ JSONL (JSON Lines) พร้อมคู่คำสั่ง-คำตอบที่ชัดเจน สำหรับการ fine-tuning แบบแชท ให้รวมบทบาท เช่น system/user/assistant แต่ละตัวอย่างควรสั้นถึงปานกลาง ตัวอย่างดีนับสิบดีกว่าตัวอย่างเยอะแต่คุณภาพต่ำพันตัว

ตัวอย่าง (แบบคำสั่ง):

{"instruction": "สรุปตั๋วสนับสนุนนี้ใน 2 ประโยค โทนเสียงเป็นมิตร", "input": "ลูกค้ารายงานเจอข้อผิดพลาด 404 เมื่อคลิก 'ติดตามคำสั่งซื้อ'", "output": "ขอบคุณที่แจ้ง! เว็บไซต์แสดงข้อผิดพลาด 404 เมื่อคลิก 'ติดตามคำสั่งซื้อ' เรากำลังตรวจสอบลิงก์ที่เสียในหน้าติดตามคำสั่งซื้อและจะแจ้งเมื่อแก้ไขเรียบร้อยแล้ว"}

ตัวอย่าง (แบบแชท):

{"messages": [ {"role": "system", "content": "คุณเป็นเจ้าหน้าที่สนับสนุนที่กระชับและเป็นมิตร ใช้ภาษาอังกฤษง่ายๆ"}, {"role": "user", "content": "ฉันสมัครสมาชิกรายเดือนต่ออายุโดยบัตรหมดอายุ ช่วยหน่อย?"}, {"role": "assistant", "content": "ขอโทษในความไม่สะดวกนะครับ! ฉันตรวจสอบแผนของคุณแล้ว—การต่ออายุพยายามใช้บัตรที่หมดอายุ กรุณาอัปเดตบัตรของคุณที่หน้าบัญชี บิล แล้วฉันจะลองเรียกเก็บเงินอีกครั้งเมื่อข้อมูลบัตรถูกบันทึก"} ]}

เคล็ดลับการเตรียม dataset สำหรับ fine-tuning:

ความสม่ำเสมอคือราชินี ใช้โทนเสียง ลายเซ็น และโครงสร้างเดิมเสมอ

บาลานซ์หัวข้อ ถ้าตัวอย่าง 90% เป็นเรื่องคืนเงิน โมเดลของคุณจะกลายเป็นนางฟ้าคืนเงิน

ติดป้ายกรณียาก รวมตัวอย่างลบ (สิ่งที่ไม่ควรพูด) ถ้า Tinker API สนับสนุนสัญญาณความชอบ

ทำให้ปลอดภัย ลบข้อมูลส่วนบุคคล ถ้าคุณทำงานกับข้อมูลละเอียดอ่อน ควรทำให้ไม่ระบุชื่อหรือสังเคราะห์ข้อมูล

แยกข้อมูลออก 10–20% เป็นชุดทดสอบ ถ้าคุณประเมินแค่ชุดฝึก คุณจะหลอกตัวเองว่าโมเดลเก่งมาก ถามผมได้ว่าเพราะอะไร

ขั้นตอนที่ 3: อัปโหลดข้อมูลเข้าสู่ Tinker API แบบไม่ให้ร้องไห้

แพลตฟอร์ม fine-tuning ส่วนใหญ่มี endpoint สำหรับเก็บข้อมูล กับ Tinker API คุณจะทำโดยทั่วไป:

สร้าง resource dataset (เช่น POST /datasets)

อัปโหลดไฟล์ JSONL ของคุณ

ตรวจสอบโครงสร้าง (Tinker มักคืนรายงานที่เป็นประโยชน์: จำนวนถูกต้อง, ข้อผิดพลาด, ฟิลด์แปลกๆ)

ตัวอย่างปลอม (คล้าย curl):

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"

ถ้า Tinker API มี CLI ชีวิตจะง่ายขึ้น:

อัปโหลด

tinker datasets upload my_finetune_data.jsonl --purpose finetune

ตรวจสอบ

tinker datasets validate DATASET_ID

ข้อผิดพลาดในการตรวจสอบคือเพื่อนของคุณ มันอาจดูเหมือนตัดสินแต่ช่วยคุณหลีกเลี่ยงความล้มเหลวที่ไม่คาดคิดตอนตีสอง

ขั้นตอนที่ 4: เริ่มงาน fine-tune และเลือกการตั้งค่าที่สมเหตุสมผล

คุณจะเริ่มงานที่ชี้ไปยัง dataset และโมเดลฐานที่เลือก พารามิเตอร์ที่รับได้ เช่น epochs, learning rate, batch size, และความถี่ในการประเมินผล แปลว่า จำนวนรอบผ่านข้อมูล, ความเร็วในการเรียนรู้, จำนวนตัวอย่างที่ดูพร้อมกัน, และความถี่ในการอัปเดตความคืบหน้า

ตัวอย่างคำขอ:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-large-1", "dataset_id": "ds_abc123", "epochs": 3, "learning_rate": 1e-5, "batch_size": 8, "eval_dataset_id": "ds_eval789", "suffix": "support-tone-v1" }'

ค่าเริ่มต้นที่สมเหตุสมผล:

Epochs: 3–5 สำหรับชุดข้อมูลขนาดเล็กถึงกลาง ไม่ใช่ว่ามากกว่าจะดีเสมอไป บางครั้งแสดงถึงการจำแบบเกินพอดี

Learning rate: เริ่มอย่างระมัดระวัง (1e-5 หรือ 2e-5) ถ้าเรียนเร็วเกิน โมเดลจะลืมความรู้ทั่วไป

Batch size: เท่าที่โควต้าของคุณจะอนุญาต แต่อย่ากังวลมาก ผลลัพธ์ขึ้นกับข้อมูลที่ดีมากกว่า

Early stopping: ถ้า Tinker API มี เปิดใช้งาน มันเหมือนคำถาม “ถึงแล้วหรือยัง?” ของ machine learning ที่บางครั้งตอบว่า “ถึงแล้ว”

ขั้นตอนที่ 5: ติดตามการฝึกอย่างระมัดระวัง—แต่ใจเย็น

Tinker มักจะส่งสตรีม log: การสูญเสียระหว่างฝึก (training loss), การสูญเสียประเมิน (eval loss), และเมตริกซ์พิเศษที่คุณกำหนด (เช่น exact match สำหรับ Q&A) วิธีอ่านสัญญาณ:

Training loss ลดลง, eval loss คงที่หรือเพิ่ม? คุณกำลัง overfitting—จำคำตอบชุดฝึกแต่ตอบชุดใหม่ผิด

ทั้งสองค่อยๆ ลดลง? คุณกำลังไปได้ดี

Loss กระโดดเหมือนไม้กระโดดทรงตัว? อาจ learning rate สูงเกิน หรือ dataset ขัดแย้ง

ตรวจสอบผลลัพธ์บางส่วนถ้า Tinker มี preview generation ระหว่างฝึก ลองใช้ prompt บางอันจากชุดทดสอบดูโทนเสียงและความถูกต้อง ใช่ นี่เป็นแบบประเมินด้วยสายตา—เพราะคุณกำลังฝึกสไตล์ ไม่ใช่พิสูจน์ทางฟิสิกส์

ขั้นตอนที่ 6: ตั้งชื่อ deploy เรียกใช้

เมื่อจบงาน Tinker API จะมอบ model ID ให้คุณ เช่น ft:tinker-large-1:support-tone-v1:abc123 แล้วคุณก็ deploy โมเดลนี้หลัง endpoint และเรียกใช้เหมือนโมเดลฐาน—แต่ตอนนี้มันพูดเหมือนทีมของคุณ

ตัวอย่างการเรียกใช้โมเดล:

curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-large-1:support-tone-v1:abc123", "messages": [ {"role": "system", "content": "คุณเป็นเจ้าหน้าที่ซัพพอร์ตที่กระชับและเป็นมิตร"}, {"role": "user", "content": "คำขอคืนเงินของฉันล่าช้าและฉันรู้สึกหงุดหงิด"} ], "temperature": 0.4 }'

คุณยังสามารถตั้งค่า presence_penalty สูงขึ้น หรือ temperature ต่ำลง ถ้าโมเดลของคุณพูดมากเกินไปหรือตอบสั้นเกินไป เอกสารของ Tinker จะบอกถึงการตั้งค่า อย่ากลัวที่จะทดลอง

ขั้นตอนที่ 7: ประเมินเหมือนโค้ช ไม่ใช่ผู้พิพากษา

คุณจะอยากมีคะแนนอัตโนมัติและคะแนนจากคนจริง เมตริกซ์อัตโนมัติ (เช่น BLEU, ROUGE, ความแม่นยำ) สะอาดแต่จับโทนไม่ได้ มนุษย์จะจับปัญหาว่า “ฟังดูหงุดหงิด” ได้ดี

ตั้ง Rubric เล็กๆ:

ความตรงโทน (1–5)

การทำตามคำสั่ง (1–5)

ความถูกต้องตามข้อเท็จจริง (1–5)

การควบคุมความยาว (1–5)

ความปลอดภัย/การปฏิบัติตามนโยบาย (1–5)

สุ่มตัวอย่าง 50–100 ผลลัพธ์จากชุดทดสอบ ร้องขอให้สองคนประเมินอย่างอิสระ ถ้าค่าเฉลี่ยน้อยกว่า 3 ให้ย้อนกลับไปดู dataset และเพิ่มตัวอย่างที่แสดงพฤติกรรมที่คุณต้องการ

ขั้นตอนที่ 8: ค่าใช้จ่ายและประสิทธิภาพ—สิ่งที่ CFO และเซิร์ฟเวอร์คุณสนใจ

การ fine-tuning กับ Tinker API มีค่าใช้จ่ายสองจุด: การฝึกและการเรียกใช้ การฝึกครั้งเดียวแต่การเรียกใช้เป็นกิจกรรมต่อเนื่อง

ลดความยาวโทเคน คำขอและผลลัพธ์สั้นกว่าจะช่วยลดบิล

ใช้ system prompt ที่กำหนดสไตล์ แต่ไม่ต้องทำซ้ำคำสั่งยาวทุกครั้งถ้า Tinker รองรับค่าเริ่มต้นในระดับ deploy

เก็บแคช prompt ที่พบบ่อยเมื่อทำได้

พิจารณากลยุทธ์เส้นทางการเรียกใช้: ใช้โมเดลใหญ่ fine-tuned เฉพาะเมื่อจำเป็น แล้ว fallback ไปโมเดลเล็กถูกกว่า

ความหน่วงเวลาก็สำคัญ ถ้าโมเดล fine-tuned ช้าลง ลองใช้ context window เล็กลง หรือใช้โมเดลเล็กสำหรับการจำแนก และโมเดลใหญ่สำหรับสร้างข้อความ

ขั้นตอนที่ 9: แก้ปัญหา—ปัญหาที่เจอบ่อย

โมเดลตอบซ้ำๆ เหมือนแผ่นเสียงเสีย

ลด temperature, เพิ่มตัวอย่างคำตอบสั้นชัดเจน ลด beam width ถ้ามี

โมเดลไม่ทำตามคำสั่ง

เสริม system prompt และเพิ่มตัวอย่างที่แสดงการทำตามคำสั่งเข้มงวด

โมเดลคิดไปเองแบบมั่นใจเกินไป

เพิ่มตัวอย่างที่บอกว่า “ฉันไม่รู้” หรือแนะนำแหล่งที่มา ลด temperature จับคู่กับ retrieval เพื่อยึดตามข้อเท็จจริง

โมเดลใจดีเกินไป (มีจริง!)

เพิ่มตัวอย่างฝึกที่ตั้งขอบเขตอย่างชัดเจน เช่น “เราไม่สามารถทำ X แต่เราทำ Y ได้”

การฝึกหยุดกลางคัน

ตรวจสอบ validation dataset, อักขระแปลก, และความยาว token สูงสุด ลอง batch size เล็กลง หรือจำนวน epoch น้อยลง

ขั้นตอนที่ 10: เมื่อไหร่ควร fine-tune กับเมื่อไหร่ใช้ prompt หรือ retrieval

ผมชอบ fine-tuning แต่มันไม่ใช่ค้อนเดียว มีสามกลยุทธ์ยอดนิยม:

การปรับ prompt อย่างเดียว: ถูกและเร็วที่สุด เหมาะเมื่อคุณแค่ต้องการปรับโทนหรือความสม่ำเสมอเรียบง่าย

RAG (retrieval-augmented generation): ดีสำหรับข้อมูลใหม่ล่าสุดและฐานความรู้ขนาดใหญ่ โมเดลอ่านเอกสารของคุณเวลารัน

fine-tuning: ดีสุดสำหรับสไตล์ โครงสร้าง และรูปแบบในโดเมนที่ไม่เปลี่ยนแปลงทุกวัน

บ่อยครั้งสูตรชนะคือผสมเล็กน้อย: ใช้ RAG ดึงข้อเท็จจริง แล้วส่งให้โมเดล fine-tuned ตอบในสไตล์เฉพาะของคุณ

บทเรียน Tinker API แบบรวบรัดที่คุณสามารถคัดลอกได้

นี่คือสรุปขั้นตอนจำลองที่คล้ายกับแพลตฟอร์มสไตล์ Tinker หลายแห่ง แทนที่ endpoint และ ID ด้วยของจริงของคุณ

สร้างและอัปโหลด datasets

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune"

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval"

เริ่ม fine-tuning

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "base_model": "tinker-medium-1", "dataset_id": "ds_train", "eval_dataset_id": "ds_eval", "epochs": 4, "learning_rate": 2e-5, "suffix": "email-summarizer-v1" }'

สตรีม log

curl -N -H "Authorization: Bearer $TINKER_KEY"

ใช้โมเดลที่ fine-tuned

curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{ "model": "ft:tinker-medium-1:email-summarizer-v1:xyz", "prompt": "สรุปอีเมลนี้เป็นข้อสั้น 2 ข้อ โทนเสียงเป็นมิตร:\n\n[วางอีเมลที่นี่]", "max_tokens": 160, "temperature": 0.4 }'

สถานการณ์จริง: เกิดอะไรขึ้นเมื่อ...

คุณ fine-tune บนสคริปต์ซัพพอร์ตของคุณ

ทันใดนั้น AI ของคุณตอบในโครงสร้างที่ทีมใช้: ขอโทษ, บอกว่าจะทำอะไร, ติดตามผล คะแนน CSAT มักเพิ่มขึ้นเพราะลูกค้าชอบความสม่ำเสมอมากกว่าความประหลาดใจ

คุณ fine-tune โทนเสียงแบรนด์ของคุณ

โมเดลตอบโต้สไตล์ “เราช่วยเหลืออย่างเป็นมิตรแต่ไม่กวนใจ” หลีกเลี่ยงความตื่นเต้นเยอะมาก เครื่องมือการตลาดนอนได้ดีขึ้น

คุณ fine-tune เพื่อแนะนำโค้ด

ใส่คู่คำอธิบายงานและโค้ดตัวอย่างที่เหมาะสม ตัวอย่างสั้นและเฉพาะทางช่วยได้ โค้ดที่ยุ่งเหยิงทำให้คำตอบสับสน

คุณ fine-tune สำหรับการจำแนกประเภท

ได้เลย ให้ตัวอย่างที่ติดป้าย และเรียกโมเดลด้วย prompt สั้น สำหรับการติดป้ายชัดเจน ตั้ง temperature เป็นศูนย์

ความปลอดภัยมาเป็นอันดับหนึ่งเสมอ

ถ้า use case ของคุณเกี่ยวข้องกับพื้นที่ควบคุมหรือข้อมูลละเอียดอ่อน ให้ตั้งเส้นชัดเจนใน system prompt และข้อมูลฝึก เพิ่มตัวอย่างแสดงการปฏิเสธอย่างสุภาพ บันทึกผลลัพธ์และให้ผู้ใช้รายงานปัญหา โมเดลที่ fine-tuned สามารถมั่นใจได้—แต่ให้เขียนให้ระวังอย่างมั่นใจ

ที่ที่ Sider.AI เหมาะ (และที่ที่ไม่เหมาะ)

เซอร์ไพรส์: Sider.AI เป็นเพื่อนร่วมทางที่ดีเมื่อต้องเรียนรู้การใช้ Tinker API เหมือนมี co-pilot ที่อ่านเอกสารโดยไม่บ่น คุณสามารถร่างตัวอย่าง dataset ใน sidebar ของ Sider ขณะท่องอีเมลเดิมหรือฐานความรู้ จากนั้นส่งออกเป็น JSONL ที่สะอาดและสม่ำเสมอ มันไม่ทำงาน training ให้คุณ—นั่นคือหน้าที่ของ Tinker—แต่สำหรับร่าง, ปรับแต่ง และตรวจสอบ ตัวอย่าง มันใช้ได้จริงมาก ลองถามมันว่า “เขียนตอบนี้ใหม่ด้วยโทนเสียงซัพพอร์ตที่ใจเย็น เป็นภาษาอังกฤษง่ายๆ สองประโยค” แล้วดูคุณภาพ dataset ของคุณพุ่งขึ้น

ข้อควรรู้ที่อยากให้ใครสักคนบอกผม

ข้อมูลมากกว่าไม่ใช่คำตอบ—ข้อมูลที่เป็นตัวแทนที่ดีต่างหาก

อย่าปรับโทนเสียงจนเกินไป เก็บตัวอย่าง wildcard ไว้สักเล็กน้อยเพื่อให้โมเดลเล่นได้เวลาผู้ใช้สร้างสรรค์

เวอร์ชันทุกอย่าง: dataset v1.1, model v1.2, template prompt v3.0 คุณในอนาคตจะขอบคุุณเอง

มีปุ่ม rollback ถ้า fine-tune ใหม่ทำงานผิดพลาด ให้ deploy โมเดลเดิมเร็วๆ

ประเมินด้วย prompt ที่ผู้ใช้จริงใช้ ไม่ใช่แค่ตัวอย่างที่ดีที่สุดของคุณ ผู้ใช้คือกวีแห่งความโกลาหล

อีกเรื่องสุดท้าย...

fine-tuning กับ Tinker API ไม่ใช่การสร้าง Skynet แต่มันคือการลบมุมหยาบให้ AI ของคุณเหมือนเป็นส่วนหนึ่งของทีม เริ่มจากเล็กๆ วัดผลอย่างแม่นยำ และอย่ากลัวที่จะยอมรับว่าเทคนิคง่ายๆ (เช่น prompt ที่ดี) ก็สามารถทำงานได้

เพราะเมื่อ AI ของคุณตอบเหมือนคุณจริงๆ? นั่นไม่ใช่แค่ประสิทธิภาพ แต่นั่นคือสติ

cheat sheet

วิธีใช้ Tinker API เพื่อ fine-tune โมเดล AI ของคุณเอง: เตรียมคู่ JSONL ที่สะอาดและสม่ำเสมอ; อัปโหลด; เริ่ม fine-tune ด้วยค่าสมเหตุสมผล; ประเมินด้วยคนและเมตริกซ์; deploy และปรับปรุง

ใช้ fine-tuning สำหรับสไตล์และรูปแบบที่มั่นคง; ใช้ retrieval สำหรับข้อเท็จจริงใหม่ๆ

ควบคุมค่าใช้จ่ายด้วย prompt สั้น โมเดลเล็ก และกลยุทธ์การเรียกใช้

ทำให้ความปลอดภัยเป็นส่วนสำคัญของ dataset ของคุณ

ให้เครื่องมืออย่าง Sider.AI ช่วยคุณร่างตัวอย่างดีขึ้นก่อนกด "Train"

FAQ

Q1: ฉันจะเตรียมข้อมูลเพื่อ fine-tune โมเดล AI ของฉันด้วย Tinker API อย่างไร? ใช้ JSONL ที่มีคู่คำสั่ง–คำตอบหรือแบบแชทที่ชัดเจน รักษาโทนเสียงให้สม่ำเสมอ ทำให้ข้อมูลละเอียดอ่อนไม่ระบุตัวตน และเก็บ 10–20% สำหรับทดสอบเพื่อไม่ให้หลงคิดว่าโมเดลเก่งเกินจริง

คำถามที่ 2: การปรับแต่งโมเดลด้วย Tinker API ดีกว่าการปรับแต่งพรอมต์หรือไม่ ใช้พรอมต์เพื่อปรับแต่งน้ำเสียงอย่างรวดเร็วและลักษณะการทำงานง่ายๆ ใช้การปรับแต่งโมเดลเมื่อคุณต้องการรูปแบบ สไตล์ โครงสร้าง หรือโดเมนที่ทนทาน หลายทีมรวมทั้งสองอย่างเข้าด้วยกัน—RAG สำหรับข้อเท็จจริง และปรับแต่งโมเดลสำหรับน้ำเสียง

คำถามที่ 3: ฉันต้องใช้ข้อมูลมากแค่ไหนในการปรับแต่งโมเดลด้วย Tinker API คุณภาพสำคัญกว่าปริมาณ ตัวอย่างที่ดีเพียงไม่กี่ร้อยตัวอย่างสามารถให้ผลลัพธ์ที่ดีกว่าตัวอย่างที่มีสัญญาณรบกวนนับพัน เริ่มต้นจากเล็กๆ ประเมินผล จากนั้นเพิ่มตัวอย่างที่ตรงเป้าหมายในจุดที่โมเดลมีปัญหา

คำถามที่ 4: ฉันจะปรับใช้โมเดลที่ปรับแต่งแล้วใน Tinker API ได้อย่างไร หลังจากการฝึกอบรม Tinker จะส่งคืน ID โมเดลที่คุณสามารถเรียกใช้ผ่าน endpoints การเติมข้อความหรือการแชทมาตรฐาน ตั้งค่า system prompt ที่เป็นประโยชน์ ปรับอุณหภูมิ และตรวจสอบผลลัพธ์ในการใช้งานจริง

คำถามที่ 5: ฉันจะป้องกันไม่ให้โมเดลที่ปรับแต่งแล้วของฉันสร้างข้อมูลที่ไม่ถูกต้องได้อย่างไร ฝึกอบรมด้วยตัวอย่างที่ยอมรับความไม่แน่นอน ลดอุณหภูมิ และจับคู่กับการดึงข้อมูลสำหรับข้อเท็จจริง ทำให้ "อ้างอิงแหล่งที่มา" หรือ "บอกว่าคุณไม่รู้" เป็นส่วนหนึ่งของคำแนะนำและข้อมูลการฝึกอบรม