กล้อง AI ของคุณคิดว่าผู้หญิงทุกคนเป็นพยาบาล และผู้ชายทุกคนเป็น CEO ช่างยอดเยี่ยมไปเลย
เคยไหมที่อัปโหลดรูปภาพไปยังแอปที่ "ปรับปรุงด้วย AI" แล้วเห็นมันระบุว่าส่าหรีของเพื่อนคุณเป็นเสื้อคลุมอาบน้ำอย่างมั่นใจ? หรือเคยเห็นระบบภาพทางการแพทย์ยืนยันว่าไฝบนแขนของคุณคือบลูเบอร์รี? นั่นคืออคติของชุดข้อมูลในการถ่ายภาพด้วย AI และมันไม่ได้แค่น่าอึดอัด แต่มันอาจเป็นอันตรายได้ ลองนึกภาพว่าเป็นการสอนตัวอักษรให้เด็กโดยใช้แต่สระ แน่นอนว่าพวกเขาจะร้องเพลงอะไรบางอย่างออกมา แต่คุณคงไม่อยากให้พวกเขาเขียนใบสั่งยา
เราอยู่ในช่วงเวลาที่แปลกประหลาดที่การมองเห็นของคอมพิวเตอร์ดีพอที่จะอยู่ได้ทุกที่ ไม่ว่าจะเป็นโทรศัพท์ รถยนต์ หรือสำนักงานแพทย์ แต่ก็ยังแย่พอที่จะพลาดประเด็น บริบท และบางครั้งก็พลาดกลุ่มคนทั้งหมด โดยทั่วไปแล้วผู้ร้ายไม่ใช่คณิตศาสตร์ แต่เป็นข้อมูล โดยเฉพาะอย่างยิ่ง ข้อมูลที่ฝึกฝนโมเดลเหล่านี้ให้มองโลกผ่านเลนส์ที่แคบมาก
มาดูกันว่าอคติของชุดข้อมูลในการถ่ายภาพด้วย AI แอบเข้ามา สร้างความเสียหาย และที่สำคัญที่สุดคือ คุณจะป้องกันไม่ให้มันเรียกแมวของคุณว่าครัวซองต์ได้อย่างไร
อคติของชุดข้อมูลในการถ่ายภาพด้วย AI คืออะไร? ฉบับย่อที่ป้าของคุณจะอ่าน
อคติของชุดข้อมูลในการถ่ายภาพด้วย AI เกิดขึ้นเมื่อรูปภาพที่ใช้ในการฝึกโมเดลไม่ได้แสดงถึงโลกแห่งความเป็นจริง หากชุดข้อมูลของคุณส่วนใหญ่เป็นใบหน้าจากกลุ่มประชากรกลุ่มเดียว โทนสีผิวจากช่วงที่จำกัด หรือวัตถุที่ถ่ายภาพในแสงสตูดิโอที่สมบูรณ์แบบ (สวัสดี ไฟวงแหวนของอินฟลูเอนเซอร์!) โมเดลจะเรียนรู้ความเป็นจริงที่บิดเบี้ยว
- อคติในการเลือก: คุณเลือกรูปภาพที่หาได้ง่ายที่สุด รูปภาพสต็อก พื้นหลังสีขาว และบางครั้งก็เป็นนักกินสลัดที่มีความสุขอย่างน่าสงสัย
- อคติในการติดป้ายกำกับ: มนุษย์ติดป้ายกำกับรูปภาพ มนุษย์นำความคิดเห็นมา บางครั้งความคิดเห็นเหล่านั้นเป็น "งานเขียนเชิงสร้างสรรค์" มากกว่า "ความจริงพื้นฐาน"
- อคติทางบริบท: หูฟังแพทย์ข้างผู้หญิง? ต้องเป็นพยาบาล วัตถุเดียวกันข้างผู้ชาย? หมอ โมเดลเรียนรู้แบบแผนจากชุดข้อมูล
- อคติของโดเมน: คุณฝึกฝนด้วยรูปภาพผลิตภัณฑ์ที่สวยงาม แล้วนำไปใช้ในโรงงานที่มีแสงสลัว น่าประหลาดใจ: รถยกดูเหมือนบิ๊กฟุต
หากคุณสอนให้ AI มองโลกผ่านแค่ย่านเดียว อย่าตกใจเมื่อมันหลงทางในเมือง
เดิมพันที่ไม่ตลก: เมื่ออคติหยุดเป็นมีม
อคติในการถ่ายภาพด้วย AI ไม่ได้แค่สร้างความล้มเหลวที่กลายเป็นมีมได้เท่านั้น แต่มันยังปรากฏใน:
- ภาพทางการแพทย์: โทนสีผิวที่แสดงน้อยเกินไปในชุดข้อมูลทางผิวหนังสามารถนำไปสู่อัตราการตรวจจับที่แย่ลงสำหรับสภาวะต่างๆ เช่น มะเร็งผิวหนัง เมื่อพิกเซลไม่ตรงกับตัวอย่างการฝึก อัตราความผิดพลาดจะสูงขึ้น
- ความปลอดภัยและการเฝ้าระวัง: การระบุตัวตนผิดพลาดในการจดจำใบหน้ามีความเชื่อมโยงกับการจับกุมที่ผิดพลาด โดยเฉพาะอย่างยิ่งสำหรับคนผิวสี ไม่ใช่ประสบการณ์ผู้ใช้ที่ดี
- การจ้างงานและการยืนยันตัวตน: การจับคู่ใบหน้าที่ผิดพลาดกับใบหน้าของผู้ที่ไม่ใช่ไบนารีหรือคนข้ามเพศไม่ได้แค่น่ารำคาญ แต่มันเป็นการกีดกัน
- ระบบอัตโนมัติ: รถยนต์ที่ขับเคลื่อนด้วยตนเองที่ได้รับการฝึกฝนส่วนใหญ่ในแสงแดดแคลิฟอร์เนียอาจไม่รู้จักป้ายหยุดที่ปกคลุมด้วยหิมะในมินนิโซตา รถไม่ได้ประมาท แต่มันได้รับการปกป้อง
เมื่อโลกของโมเดลเล็ก คนจริงๆ ต้องจ่ายราคา
มันแอบเข้ามาได้อย่างไร: สี่จตุรอาชาแห่งอคติของชุดข้อมูลรูปภาพ
1) "อคติของฟรี"
การขูดเว็บแบบเปิดเพื่อหารูปภาพนั้นเหมือนกับการดำน้ำในถังขยะเพื่อหาพิกเซล คุณจะพบภาพถ่ายศีรษะของคนดัง ป้ายการประชุมด้านเทคโนโลยี และภาพผลิตภัณฑ์ที่ดูเหมือนถ่ายบนดวงจันทร์มากมาย ความเป็นจริงที่ยุ่งเหยิงในชีวิตประจำวัน? น้อยกว่านั้น ที่ทำให้โมเดลของคุณเอียงไปทางใบหน้า สถานที่ และกลิ่นอายบางอย่าง
2) "การเลื่อนคำอธิบายประกอบ"
ผู้ติดป้ายกำกับสองคนเดินเข้าไปในงานติดป้ายกำกับ คนหนึ่งแท็กเสื้อฮู้ดว่า "ชุดกีฬา" อีกคนบอกว่า "ชุดลำลอง" และคนที่สามเรียกว่า "ชุดสตรีทแวร์" โมเดลเรียนรู้ว่าเสื้อผ้าคือความวุ่นวาย ที่แย่กว่านั้นคือผู้ติดป้ายกำกับนำสมมติฐานทางวัฒนธรรมมาด้วย เช่น ใครที่ดูเหมือน "เจ้านาย" หรืออะไรที่นับว่าเป็นทรงผม "ธรรมชาติ"
3) "ไม้ค้ำยันบริบท"
โมเดลชอบทางลัด หาก 90% ของรูปภาพเชฟในชุดข้อมูลของคุณเป็นผู้ชาย โมเดลจะใช้สัญญาณทางเพศเป็นทางลัดในการทำนาย "เชฟ" นั่นไม่ใช่สติปัญญา นั่นคือแผ่นโกงที่มีอคติ
4) "ความไม่ตรงกันของโดเมน"
ฝึกฝนด้วยภาพถ่ายสวยๆ จาก DSLR นำไปใช้กับกล้องวงจรปิดความละเอียดต่ำ ฝึกฝนด้วยภาพตอนกลางวัน นำไปใช้ในเวลากลางคืน ฝึกฝนบนถนนในเมือง นำไปใช้บนถนนในชนบท โดยพื้นฐานแล้วโมเดลของคุณกำลังเดินทางโดยไม่มีที่ชาร์จ
การตรวจจับอคติโดยไม่ต้องมีปริญญาเอก หรือเครื่องจับเท็จ
นี่คือวิธีที่คุณรู้ว่าโมเดลภาพ AI ของคุณมีปัญหาเรื่องอคติ นอกเหนือจากความรู้สึกแย่ๆ ในการสาธิตของคุณ:
- ช่องว่างด้านประสิทธิภาพ: แบ่งเมตริกการตรวจสอบความถูกต้องของคุณตามข้อมูลประชากร แสง ภูมิศาสตร์ หรือประเภทอุปกรณ์ หากความแม่นยำลดลงเหมือนโทรศัพท์ที่ไม่มีเคสสำหรับบางกลุ่ม คุณมีอคติ
- เมทริกซ์ความสับสนที่ทำให้คุณสับสน: หากโมเดลยังคงสับสนระหว่างคลาสเฉพาะ เช่น ฮิญาบกับหมวก นั่นคือการบอกถึงชุดข้อมูล
- การตรวจสอบคุณลักษณะ: เครื่องมือต่างๆ เช่น Grad-CAM สามารถเปิดเผยว่าตัวตรวจจับ "แมว" ของคุณกำลังจับรูปแบบโซฟาอยู่ ขอแสดงความยินดี คุณฝึกฝนการจดจำเบาะ
- การเลื่อนนำร่องในโลกแห่งความเป็นจริง: ดำเนินการนำร่องขนาดเล็กในป่า หากโมเดลตื่นตระหนกภายใต้แสงฟลูออเรสเซนต์เหมือนต้นไม้ในห้องใต้ดิน มันต้องการข้อมูลที่หลากหลายมากขึ้น
ชุดเครื่องมือ: วิธีลดอคติของชุดข้อมูลก่อนที่มันจะกัดกินแผนงานผลิตภัณฑ์ของคุณ
ลองนึกภาพการต่อสู้กับอคติเป็นการปรับปรุงบ้าน คุณสามารถปะ ซ่อมแซม หรือรื้อออกและสร้างใหม่ได้ งบประมาณของคุณ: เวลา ข้อมูล และความอ่อนน้อมถ่อมตน
1) จัดการเหมือนพิพิธภัณฑ์ (ไม่ใช่ตลาดนัด)
- กำหนดความครอบคลุม: เขียนข้อมูลประชากร สภาพแสง ประเภทกล้อง ภูมิศาสตร์ และสภาพแวดล้อมที่ระบบของคุณต้องจัดการ หากไม่ได้เขียนไว้ นั่นคือการคิดหวัง
- กำหนดโควต้า: ใช่ โควต้า หาก 30% ของผู้ใช้ของคุณอยู่ในที่แสงน้อย 30% ของชุดข้อมูลของคุณควรเป็นรูปภาพแสงน้อย เช่นเดียวกับช่วงสีผิว (ใช้สเกลเช่น Fitzpatrick เป็นตัวแทน) กลุ่มอายุ รูปแบบเสื้อผ้า และบริบททางวัฒนธรรม
- จัดหาข้อมูลจากหลายแหล่ง: รูปภาพสต็อกเป็นของหวาน คุณยังต้องมีอาหารปรุงเองที่บ้าน: รูปภาพที่ผู้ใช้มีส่วนร่วม (โดยได้รับความยินยอม) ชุดข้อมูลสาธารณะที่มีการตรวจสอบอคติ และการรวบรวมข้อมูลที่กำหนดเป้าหมายจากกลุ่มที่ด้อยโอกาส
2) ติดป้ายกำกับเหมือนทนายความ (แต่เป็นมิตรมากกว่า)
- อนุกรมวิธานที่ชัดเจน: เขียนคู่มือการติดป้ายกำกับ ไม่ใช่ คู่มือจริงๆ ใส่กรณีพิเศษ ตัวอย่าง และสิ่งที่ไม่ควรทำ ลด "กลิ่นอาย" ของผู้ติดป้ายกำกับ
- ผู้ใส่คำอธิบายประกอบที่หลากหลาย: หากผู้ใส่คำอธิบายประกอบของคุณทุกคนไปที่ร้านกาแฟสามร้านเดียวกัน ป้ายกำกับของคุณก็จะเหมือนกัน ความหลากหลายทางภูมิศาสตร์และวัฒนธรรมช่วยได้
- การตรวจสอบข้อตกลง: วัดข้อตกลงระหว่างผู้ใส่คำอธิบายประกอบและตัดสินข้อขัดแย้งกับผู้ติดป้ายกำกับนำ อย่าหาค่าเฉลี่ยให้ไร้สาระ
- คุณลักษณะที่ละเอียดอ่อน: เมื่อเหมาะสมและได้รับความยินยอม ให้รวบรวมแท็กคุณลักษณะที่ได้รับการปกป้องเพื่อการประเมิน เก็บไว้ในการฝึกอบรมเว้นแต่คุณจะทำการแทรกแซงความเป็นธรรมที่ควบคุมได้
3) ฝึกฝนเหมือนนักวิทยาศาสตร์ (พร้อมของว่าง)
- การสุ่มตัวอย่างแบบสมดุล: ใช้การสุ่มตัวอย่างแบบแบ่งชั้นและการถ่วงน้ำหนักคลาสใหม่ เพื่อไม่ให้โมเดลจมอยู่ในคลาสส่วนใหญ่
- การเพิ่มข้อมูลอย่างมีความรับผิดชอบ: เปลี่ยนแสง มุม การบดบัง และพื้นหลัง ข้อมูลสังเคราะห์ช่วยได้ แต่ปล่อยให้เอ็นจินเกมประดิษฐ์ความเป็นจริงทั้งหมดของคุณ
- วัตถุประสงค์ในการลดอคติ: รวมการสูญเสียหรือข้อ จำกัด ที่คำนึงถึงความเป็นธรรมซึ่งลดช่องว่างด้านประสิทธิภาพในกลุ่มต่างๆ
- การปรับโดเมน: หากการปรับใช้มืด มีเสียงดัง หรือมีความละเอียดต่ำ ให้จำลองโลกนั้น ดีกว่า: รวบรวมในโลกนั้น
4) ทดสอบเหมือนคนขี้ระแวง
- การประเมินแบบแบ่งส่วน: รายงานความแม่นยำ ความแม่นยำ/การเรียกคืน และการสอบเทียบโดยกลุ่มย่อย หากคุณมองไม่เห็น คุณจะไม่แก้ไขมัน
- การทดสอบแบบขัดแย้ง: สลับบริบทโดยให้เรื่องคงที่ ผู้หญิงที่ถือกระเป๋าเอกสารกลายเป็น "ครู" ในขณะที่ผู้ชายที่ถือกระเป๋าเอกสารเป็น "CEO" หรือไม่ นั่นคืออคติทางบริบทที่จับได้ใน 4K
- การทดสอบความเครียด: โยนแสงจ้า การเบลอจากการเคลื่อนไหว หิมะ หมอก หน้ากาก และหมวกใส่โมเดลของคุณ โดยพื้นฐานแล้วฮาโลวีนสำหรับโครงข่ายประสาทเทียม
5) ตรวจสอบเหมือนคุณตั้งใจ
- การตรวจจับการเลื่อน: ติดตามการเปลี่ยนแปลงในการกระจายอินพุตหลังจากการเปิดตัว เมื่อแอปของคุณได้รับความนิยมอย่างมากในบราซิล คุณจะต้องรู้
- Human-in-the-loop: ให้ผู้ใช้แจ้งข้อผิดพลาดและอคติ และอ่านรายงานจริง ใช่ แม้แต่รายงานที่เป็นตัวพิมพ์ใหญ่ทั้งหมด
- จังหวะการฝึกอบรมใหม่: กำหนดการรีเฟรช โมเดลที่เก่าแล้วคือโมเดลที่มีอคติที่มีอาการสูงอายุ
สถานการณ์ในโลกแห่งความเป็นจริง: เมื่ออคติของชุดข้อมูลทำลายบรรยากาศ
- AI ด้านผิวหนัง: หากภาพการฝึกอบรมของคุณส่วนใหญ่เป็นโทนสีผิวที่อ่อนกว่า รอยโรคบนผิวที่เข้มกว่าจะถูกตรวจพบน้อยเกินไป แก้ไข: กระจายแหล่งที่มาจากคลินิกต่างๆ ในกลุ่มประชากรและประเมินตามหมวดหมู่สีผิว
- การป้องกันการสูญเสียจากการค้าปลีก: โมเดลที่ได้รับการฝึกฝนจากฟุตเทจทดสอบจากร้านค้าที่สะอาดและสว่างสดใสจะทำงานผิดพลาดในร้านค้าที่แออัดและสลัว แก้ไข: รวบรวมจากร้านค้าจริงในภูมิภาคและฤดูกาลต่างๆ นอกจากนี้ อาจจะไม่ลงโทษเสื้อฮู้ด
- ภาพทางการเกษตร: โมเดลที่ได้รับการฝึกฝนจากภาพถ่ายโดรนตอนกลางวันพลาดศัตรูพืชในเวลาพลบค่ำ แก้ไข: รวมช่วงเวลาต่างๆ ของวันและประเภทเซ็นเซอร์ (RGB + ความร้อน) พืชก็มีชีวิตกลางคืนเช่นกัน
- การสแกนเอกสาร: การตรวจสอบภาพเซลฟี่หนังสือเดินทางล้มเหลวกับผมหยิกหรือผ้าคลุมศีรษะ แก้ไข: ขยายการฝึกอบรมและประเมินพื้นผิวผมและผ้าคลุมอย่างชัดเจน โบนัส: ปรับปรุงข้อความแจ้ง UI และคำแนะนำแสง
ตำนานที่ฉันได้ยินอยู่เสมอ (และใช่ ฉันนำใบเสร็จมาด้วย)
- "ชุดข้อมูลที่ใหญ่ขึ้น = อคติน้อยลง" หากชุดข้อมูลขนาดใหญ่ของคุณเป็นเพียงสิ่งเดิมๆ มากขึ้น คุณได้ขยายปัญหาให้ใหญ่ขึ้นแล้ว มันเหมือนกับการสั่งกาแฟผิดประเภทในปริมาณมาก
- "เราจะแก้ไขในภายหลังด้วยอัลกอริทึมที่ชาญฉลาด" อัลกอริทึมสามารถลดอคติได้ แต่คุณไม่สามารถขัดมันฝรั่งและเรียกมันว่าเพชรได้ เริ่มต้นด้วยหัวมันที่ดีกว่า เอ้อ ข้อมูล
- "ความเป็นธรรมหมายถึงความแม่นยำที่เท่าเทียมกันสำหรับทุกคน" บางครั้งความเท่าเทียมกันคือเป้าหมาย บางครั้งโอกาสที่เท่าเทียมกันหรือคะแนนที่สอบเทียบแล้วมีความสำคัญมากกว่า เลือกเมตริกที่ตรงกับอันตรายที่คุณต้องการป้องกัน
- "ข้อมูลสังเคราะห์แก้ปัญหาความหลากหลาย" มันช่วยเติมเต็มช่องว่าง แต่ถ้าเครื่องกำเนิดไฟฟ้าเรียนรู้เกี่ยวกับอคติจากภาพจริง คุณก็แค่โคลนปัญหาใน 4K
การตรวจสอบอคติเชิงปฏิบัติทีละขั้นตอนที่คุณสามารถดำเนินการได้จริงในสัปดาห์นี้
- ตรวจสอบชุดข้อมูลของคุณ: สร้างตารางง่ายๆ ว่าใครและอะไรอยู่ในนั้น ข้อมูลประชากร แสง อุปกรณ์ สถานที่ เน้นช่องว่างเป็นสีแดง แกล้งทำเป็นว่าคุณกำลังให้คะแนนโมเดลของคุณเอง
- สร้างชุดประเมินความเป็นธรรม: รูปภาพ 1,000–10,000 ภาพแบ่งชั้นตามกลุ่มที่คุณสนใจ นี่คือการตรวจร่างกายประจำปีของคุณ
- เลือกเมตริกอคติสองรายการ: เริ่มต้นด้วยความแม่นยำของกลุ่มย่อยและข้อผิดพลาดในการสอบเทียบ หากแอปของคุณมีความเสี่ยงสูง (การแพทย์ ข้อมูลประจำตัว) ให้เพิ่มโอกาสที่เท่าเทียมกันหรือช่องว่างของอัตราผลลบที่เป็นเท็จ
- กำหนดเกณฑ์: "ไม่มีกลุ่มย่อยใดต่ำกว่า 95% ของความแม่นยำโดยรวม" เป็นจุดเริ่มต้น เขียนมันลงไป แปะไว้บนผนัง
- คัดแยกและฝึกอบรมใหม่: เติมเต็มช่องว่างด้วยการรวบรวมข้อมูลที่กำหนดเป้าหมาย ถ่วงน้ำหนักตัวอย่างของคุณใหม่ และลองเพิ่มโดเมนที่คุณปรับใช้ เรียกใช้การประเมินความเป็นธรรมอีกครั้ง ทำซ้ำจนกว่าโปสเตอร์ติดผนังของคุณจะหยุดตะโกนใส่คุณ
ข้อควรระวัง: ข้อบังคับ การตรวจสอบ และเหตุผลที่ทีมกฎหมายของคุณชอบอาหารกลางวัน
กฎหมายและมาตรฐานกำลังตามทัน คาดหวังข้อกำหนดสำหรับการประเมินผลกระทบ เอกสารข้อมูลการฝึกอบรม และการตรวจสอบหลังการปรับใช้ โดยเฉพาะอย่างยิ่งในการดูแลสุขภาพ การจ้างงาน และการใช้งานในภาครัฐ คำแปล: เก็บบันทึก แผ่นข้อมูลสำหรับชุดข้อมูล บัตรโมเดลสำหรับโมเดล และเส้นทางการตรวจสอบสำหรับทุกการเปลี่ยนแปลงครั้งใหญ่ ตัวคุณในอนาคต และผู้ควบคุมกฎหมายจะขอบคุณคุณ
เครื่องมือที่ควรลองเมื่อสเปรดชีตของคุณเริ่มร้องไห้
- ไลบรารีการประเมินอคติ: มองหาชุดเครื่องมือโอเพนซอร์สที่รายงานเมตริกกลุ่มย่อย การสอบเทียบ และข้อจำกัดด้านความเป็นธรรม หลายรายการรวมเข้ากับเฟรมเวิร์ก ML ทั่วไป
- ความสามารถในการอธิบาย: แผนที่ความโดดเด่น Grad-CAM SHAP ใช้เพื่อดูว่าโมเดลกำลังดูอะไรอยู่ ถ้าเป็นโลโก้ไม่ใช่สินค้า คุณมีปัญหาเรื่องความคลั่งไคล้
- โปรแกรมเรียกดูข้อมูล: ระบบที่ให้คุณกรองตามเมตาดาต้า แสดงภาพช่องว่างในการกระจาย และตั้งค่าสถานะรายการที่ซ้ำกัน ตั้งเป้าหมายให้โคลนน้อยลง ความครอบคลุมมากขึ้น
สิ่งที่ควรทราบ: หากคุณต้องการตรวจสอบความถูกต้องในขณะที่คุณกำลังเลือกหรือตรวจสอบชุดข้อมูล Sider.AI สามารถช่วยคุณเปรียบเทียบการกระจายได้อย่างรวดเร็ว เน้นส่วนที่แสดงน้อยเกินไป และพื้นผิวความสัมพันธ์ "อุ๊ย" ก่อนที่พวกมันจะกลายเป็นข้อผิดพลาดในการผลิต คิดว่ามันเป็นเพื่อนที่บอกคุณว่ามีผักโขมติดฟันคุณ อย่างอ่อนโยนและมีแผนภูมิ ด้านมนุษย์: ทีมแก้ไขอคติ ไม่ใช่แถบเครื่องมือ
- ทีมที่หลากหลายสังเกตเห็นจุดบอดที่แตกต่างกัน หากทุกคนในทีมของคุณพักร้อนในสามเมืองเดียวกัน โมเดลของคุณก็จะทำเช่นกัน
- แรงจูงใจมีความสำคัญ หากความสำเร็จเป็นเพียง "ความแม่นยำโดยรวม" ผู้คนจะส่งโมเดลที่มีอคติที่ชนะลีดเดอร์บอร์ด กำหนดเป้าหมายความเป็นธรรมและให้รางวัลสำหรับการบรรลุเป้าหมายเหล่านั้น
- พูดคุยกับผู้ใช้ โดยเฉพาะผู้ที่ได้รับผลลัพธ์ที่แย่ที่สุด พวกเขาจะบอกคุณในสิ่งที่แดชบอร์ดของคุณจะไม่บอก
Quick Win เทียบกับการเดินทางระยะยาว: สิ่งที่ต้องทำตามกำหนดเวลาของคุณ
- จัดส่งพรุ่งนี้: เพิ่มการเพิ่มประสิทธิภาพที่กำหนดเป้าหมายสำหรับกลุ่มย่อยที่มีประสิทธิภาพแย่ที่สุดของคุณ ถ่วงน้ำหนักการสูญเสียของคุณใหม่ และแปะแดชบอร์ดการตรวจสอบพร้อมการแจ้งเตือนสำหรับการเลื่อน
- จัดส่งเดือนหน้า: รวบรวมชุดข้อมูลขนาดเล็กแต่ทรงพลังที่เน้นช่องว่าง ฝึกอบรมใหม่ด้วยข้อ จำกัด ด้านความเป็นธรรม และเรียกใช้ชุดทดสอบแบบขัดแย้ง
- จัดส่งในไตรมาสหน้า: ออกแบบไปป์ไลน์ข้อมูลของคุณใหม่เพื่อให้รวมการสุ่มตัวอย่างตามโควต้า การประเมินอคติอย่างต่อเนื่อง และการตรวจสอบข้ามสายงานก่อนการเปิดตัว
รายการตรวจสอบที่คุณจะใช้จริง
- เรารู้หรือไม่ว่าใครอยู่ในข้อมูลของเราและใครหายไป
- เราได้กำหนดเป้าหมายประสิทธิภาพกลุ่มย่อยหรือไม่
- ป้ายกำกับของเราสอดคล้องและตระหนักถึงวัฒนธรรมหรือไม่
- เราได้ทดสอบในสภาพแวดล้อมที่ผู้ใช้ของเราอาศัยอยู่ ไม่ใช่แค่ในห้องปฏิบัติการของเราหรือไม่
- เราสามารถอธิบายการตัดสินใจของโมเดลได้หรือไม่เมื่อสิ่งต่างๆ ผิดพลาด
- เรามีแผนที่จะอัปเดตและตรวจสอบหลังจากการเปิดตัวหรือไม่
พิมพ์มัน ใส่กรอบ หรือติดไว้กับเครื่องชงกาแฟเอสเปรสโซของคุณ
เมื่ออคติเป็นคุณสมบัติ ไม่ใช่ข้อบกพร่อง: การตระหนักถึงข้อจำกัด
งานสร้างภาพบางอย่างเข้ารหัสบรรทัดฐานทางวัฒนธรรม (แฟชั่น ท่าทาง สัญลักษณ์) ที่ไม่เป็นสากล บางครั้งคำตอบที่ถูกต้องคือการแปลโมเดลให้เป็นภาษาท้องถิ่นตามภูมิภาค วัฒนธรรม หรือกรณีการใช้งาน แทนที่จะไล่ตามความเป็นธรรมแบบเดียวที่เหมาะกับทุกคน เป้าหมายไม่ใช่การสร้าง AI ที่รู้ทุกอย่างเกี่ยวกับทุกคน แต่เป็นการสร้าง AI ที่รู้ว่าเมื่อไหร่ที่มันไม่รู้
บรรทัดล่าง: อย่าปล่อยให้ AI ของคุณเติบโตในฟองสบู่
อคติของชุดข้อมูลในการถ่ายภาพด้วย AI ก็เหมือนกับการสอนให้กล้องของคุณมองโลกผ่านท่อกระดาษชำระ: คุณจะได้มุมมองที่แคบและปวดหัว แต่คุณไม่ได้ถูกกำหนดไว้
- ตรวจสอบข้อมูลของคุณเหมือนว่ามันมีความสำคัญ เพราะมันเป็นเช่นนั้น
- ติดป้ายกำกับด้วยความตั้งใจ ฝึกฝนด้วยข้อ จำกัด และทดสอบด้วยความสงสัย
- ตรวจสอบ ฟัง และแก้ไขเมื่อโลกแห่งความเป็นจริงทำให้คุณประหลาดใจอย่างหลีกเลี่ยงไม่ได้
ทำเช่นนี้ แล้ว AI ของคุณจะหยุดสับสนส่าหรีกับเสื้อคลุมอาบน้ำและไฝกับผลิตผล มันอาจจะดีพอที่จะช่วยเหลือผู้คนได้อย่างปลอดภัย เป็นธรรม และในความเป็นจริงที่ยุ่งเหยิงที่เราทุกคนอาศัยอยู่
ตอนนี้ไปตรวจสอบชุดข้อมูลของคุณ ฉันจะรอ และฉันจะเป็นคนที่กระซิบกับโมเดลของคุณว่า: "ไม่ใช่คุณ แต่เป็นชุดการฝึกอบรมของคุณ"
คำถามที่พบบ่อย
Q1: อคติของชุดข้อมูลในการถ่ายภาพด้วย AI คืออะไร ในภาษาที่เข้าใจง่าย?
มันคือเมื่อภาพการฝึกอบรมไม่ตรงกับโลกแห่งความเป็นจริง โทนสีผิว สภาพแสง หรือบริบทน้อยเกินไป โมเดลเรียนรู้ความเป็นจริงที่แคบและทำการคาดการณ์ที่มีอคติหรือผิดพลาดเมื่อมันพบกับสิ่งใดก็ตามที่อยู่นอกฟองสบู่นั้น
Q2: ฉันจะตรวจจับอคติของชุดข้อมูลได้อย่างไรก่อนที่ฉันจะจัดส่ง?
แบ่งเมตริกของคุณตามกลุ่มย่อย ข้อมูลประชากร แสง อุปกรณ์ และมองหาช่องว่างด้านประสิทธิภาพ เพิ่มการทดสอบแบบขัดแย้งและชุดประเมินความเป็นธรรมที่ดูแลจัดการขนาดเล็กเพื่อจับบริบทและอคติในการติดป้ายกำกับตั้งแต่เนิ่นๆ
Q3: ข้อมูลสังเคราะห์สามารถแก้ไขอคติของชุดข้อมูลในการมองเห็นด้วยคอมพิวเตอร์ได้หรือไม่?
ข้อมูลสังเคราะห์สามารถเติมเต็มช่องว่างเช่นแสงหรือมุมที่หายากได้ แต่ก็สามารถโคลนอคติที่มีอยู่ของคุณได้เช่นกัน ใช้เพื่อเพิ่มสถานการณ์ที่แสดงน้อยเกินไป ไม่ใช่แทนที่ภาพจริงที่หลากหลาย
Q4: วิธีที่รวดเร็วในการลดอคติโดยไม่ต้องสร้างทุกอย่างใหม่คืออะไร?
ถ่วงน้ำหนักคลาสใหม่ เพิ่มการเพิ่มประสิทธิภาพที่กำหนดเป้าหมาย และรวบรวมชุดข้อมูลขนาดเล็กที่เน้นกลุ่มที่มีประสิทธิภาพแย่ที่สุดของคุณ จากนั้นฝึกอบรมใหม่ด้วยการสูญเสียที่คำนึงถึงความเป็นธรรมและตรวจสอบการเลื่อนหลังจากการเปิดตัว
Q5: ฉันควรใช้เมตริกใดในการวัดอคติในการถ่ายภาพ
เริ่มต้นด้วยความแม่นยำของกลุ่มย่อยและข้อผิดพลาดในการสอบเทียบ จากนั้นพิจารณาโอกาสที่เท่าเทียมกันหรือช่องว่างของอัตราผลลบที่เป็นเท็จสำหรับงานที่มีความเสี่ยงสูง เลือกเมตริกที่สอดคล้องกับอันตรายที่คุณต้องการป้องกันมากที่สุด