پس دوربین هوش مصنوعی شما فکر میکند هر زنی پرستار و هر مردی مدیرعامل است. باحال، باحال، باحال.
تا به حال عکسی را در یک برنامه «بهبود یافته با هوش مصنوعی» بارگذاری کردهاید و دیدهاید که چگونه با اطمینان کامل، ساری دوستتان را به عنوان حوله حمام برچسب میزند؟ یا یک سیستم تصویربرداری پزشکی را دیدهاید که اصرار دارد خال روی بازوی شما زغال اخته است؟ این در تصویربرداری هوش مصنوعی است، و فقط ناخوشایند نیست—میتواند خطرناک باشد. آن را مانند آموزش الفبا به یک کودک فقط با حروف صدادار در نظر بگیرید. مطمئناً، آنها چیزی میخوانند. اما نمیخواهید آنها برایتان نسخه بنویسند.
ما در لحظه عجیبی قرار داریم که بینایی کامپیوتر به اندازه کافی خوب است که همهجا باشد—تلفن شما، ماشین شما، مطب دکتر شما—اما هنوز به اندازه کافی بد است که اصل مطلب، زمینه و گاهی اوقات کل گروههای مردم را از دست بدهد. مقصر معمولاً ریاضیات نیست. بلکه دادهها هستند. به طور خاص، دادههایی که این مدلها را آموزش دادهاند تا جهان را از دریچه بسیار باریکی ببینند.
بیایید بررسی کنیم که چگونه در تصویربرداری هوش مصنوعی مخفیانه وارد میشود، خرابکاری میکند، و—مهمتر از همه—چگونه میتوانید از اینکه گربهتان را کروسان صدا کند، جلوگیری کنید.
در تصویربرداری هوش مصنوعی چیست؟ نسخه کوتاهی که عمهتان واقعاً آن را میخواند
در تصویربرداری هوش مصنوعی زمانی اتفاق میافتد که تصاویری که برای آموزش یک مدل استفاده میشوند، نمایانگر دنیای واقعی نباشند. اگر مجموعه داده شما بیشتر شامل چهرههایی از یک جمعیت خاص، رنگ پوستهایی از یک محدوده محدود، یا اشیائی که در نورپردازی استودیویی عالی عکاسی شدهاند (سلام، نورهای حلقوی اینفلوئنسرها!) باشد، مدل یک نسخه مغرضانه از واقعیت را یاد میگیرد.
- : شما تصاویری را انتخاب کردید که به دست آوردن آنها آسانتر بود—عکسهای استوک، پسزمینههای سفید، و گاهی اوقات یک سالاد خور مشکوکاً خوشحال.
- : انسانها تصاویر را برچسب میزنند. انسانها نظرات را وارد میکنند. گاهی اوقات این نظرات بیشتر «نوشتن خلاقانه» هستند تا «حقیقت محض».
- : گوشی پزشکی کنار یک زن؟ حتماً پرستار است. همان شیء کنار یک مرد؟ دکتر. مدل این کلیشه را از مجموعه داده یاد گرفته است.
- : شما روی عکسهای محصول براق آموزش دیدهاید، سپس در کف کارخانههای کم نور مستقر شدهاید. تعجب نکنید: لیفتراک شبیه پاگنده به نظر میرسد.
اگر به یک هوش مصنوعی آموزش دهید که جهان را فقط از طریق یک محله ببیند، تعجب نکنید وقتی در مرکز شهر گم میشود.
مخاطرات نه چندان خندهدار: جایی که از یک میم فراتر میرود
در تصویربرداری هوش مصنوعی فقط باعث شکستهای خندهدار نمیشود. بلکه در موارد زیر ظاهر میشود:
- : رنگ پوستهای کمتر نشان داده شده در مجموعههای داده پوستشناسی میتواند منجر به نرخ تشخیص بدتر برای شرایطی مانند ملانوما شود. وقتی پیکسلها با مثالهای آموزشی مطابقت ندارند، خطاها افزایش مییابند.
- : شناسایی نادرست در تشخیص چهره با دستگیریهای اشتباه مرتبط بوده است، به ویژه برای افراد رنگین پوست. تجربه کاربری خوبی نیست.
- : تطبیق چهره که چهرههای غیرباینری یا ترنس را خراب میکند، فقط آزاردهنده نیست—بلکه طرد کننده است.
- : یک خودروی خودران که بیشتر در آفتاب کالیفرنیا آموزش دیده است، ممکن است یک تابلوی توقف پوشیده از برف را در مینه سوتا تشخیص ندهد. خودرو بیاحتیاط نیست. بلکه محافظت شده است.
وقتی دنیای مدل کوچک است، افراد واقعی هزینه آن را میپردازند.
چگونه مخفیانه وارد میشود: چهار سوارکار تصویر
1) « چیزهای رایگان»
خراش دادن وب باز برای تصاویر اساساً غواصی در سطل زباله برای پیکسلها است. شما تعداد زیادی عکس از سر افراد مشهور، نشانهای کنفرانسهای فناوری و عکسهای محصولی پیدا خواهید کرد که به نظر میرسد روی ماه گرفته شدهاند. واقعیت روزمره و آشفته؟ کمتر. این مدل شما را به سمت چهرهها، مکانها و حسهای خاصی متمایل میکند.
2) «»
دو برچسبزن وارد یک کار برچسبزنی میشوند. یکی یک هودی را به عنوان «لباس ورزشی» برچسب میزند، دیگری میگوید «لباس غیررسمی»، و سومی آن را «لباس خیابانی» مینامد. مدل یاد میگیرد که لباسها هرج و مرج هستند. بدتر از آن، برچسبزنها فرضیات فرهنگی را به همراه میآورند—مانند اینکه چه کسی شبیه یک «رئیس» است یا چه چیزی به عنوان یک مدل موی «طبیعی» محسوب میشود.
3) «»
مدلها عاشق میانبرها هستند. اگر 90% از عکسهای سرآشپزها در مجموعه داده شما مرد باشند، مدل از نشانههای جنسیتی به عنوان میانبری برای پیشبینی «سرآشپز» استفاده میکند. این هوش نیست؛ این یک برگه تقلب مغرضانه است.
4) «»
روی عکسهای پر زرق و برق DSLR آموزش دهید، روی دوربینهای امنیتی کمرزولوشن مستقر کنید. روی تصاویر روز آموزش دهید، در شب مستقر کنید. روی خیابانهای شهری آموزش دهید، در جادههای روستایی مستقر کنید. مدل شما اساساً بدون شارژر سفر میکند.
تشخیص بدون مدرک دکترا—یا دروغسنج
در اینجا نحوه تشخیص اینکه مدل تصویربرداری هوش مصنوعی شما یک مشکل دارد، فراتر از آن احساس ناخوشایند در دمویتان آورده شده است:
- : معیارهای اعتبارسنجی خود را بر اساس جمعیتشناسی، نورپردازی، جغرافیا یا نوع دستگاه برش دهید. اگر دقت مانند یک تلفن بدون قاب برای گروههای خاصی کاهش مییابد، شما دارید.
- : اگر مدل مدام کلاسهای خاصی را اشتباه میگیرد—مثلاً حجابها را با کلاهها—این نشانهای از مجموعه داده است.
- : ابزارهایی مانند Grad-CAM میتوانند نشان دهند که آشکارساز «گربه» شما در واقع روی یک الگوی مبل متمرکز است. تبریک میگویم، شما تشخیص روکش را آموزش دادهاید.
- : آزمایشهای کوچک را در طبیعت اجرا کنید. اگر مدل زیر نور فلورسنت مانند یک گیاه در زیرزمین وحشت میکند، به دادههای متنوعتری نیاز دارد.
جعبه ابزار: چگونه را قبل از اینکه نقشه راه محصول شما را گاز بگیرد، کاهش دهیم
مبارزه با را به عنوان بازسازی خانه تصور کنید. شما میتوانید وصله کنید، تقویت کنید یا پاره کنید و دوباره بسازید. بودجه شما: زمان، دادهها و فروتنی.
1) مانند یک موزه (نه یک بازار کک) کیوریت کنید
- : جمعیتشناسی، شرایط نورپردازی، انواع دوربین، جغرافیا و محیطهایی را که سیستم شما باید از عهده آنها برآید، یادداشت کنید. اگر نوشته نشده باشد، آرزوی واهی است.
- : بله، سهمیه. اگر 30% از کاربران شما در نور کم هستند، 30% از مجموعه داده شما باید تصاویر کم نور باشد. همین امر برای محدودههای رنگ پوست (از مقیاسهایی مانند فیتزپاتریک به عنوان یک پروکسی استفاده کنید)، گروههای سنی، سبکهای لباس و زمینههای فرهنگی نیز صدق میکند.
- : عکسهای استوک دسر هستند. شما همچنین به وعدههای غذایی خانگی نیاز دارید: عکسهای ارسالی توسط کاربران (با رضایت)، مجموعههای داده عمومی با ممیزیهای ، و جمعآوری دادههای هدفمند از گروههای کمتر نشان داده شده.
2) مانند یک وکیل (اما دوستانهتر) برچسب بزنید
- : یک راهنمای برچسبزنی بنویسید. نه، یک راهنمای واقعی. موارد لبهای، مثالها و کارهایی که نباید انجام شوند را شامل کنید. «حسهای» برچسبزن را کاهش دهید.
- : اگر حاشیهنویسان شما همگی به همان سه کافیشاپ رفتهاند، برچسبهای شما نیز همینطور خواهند بود. تنوع جغرافیایی و فرهنگی کمک میکند.
- : توافق بین حاشیهنویسان را اندازهگیری کنید و اختلافات را با یک برچسبزن اصلی حل و فصل کنید. میانگینگیری نکنید تا به مهملات برسید.
- : در صورت لزوم و با رضایت، برچسبهای ویژگی محافظت شده را برای ارزیابی جمعآوری کنید. آنها را از آموزش دور نگه دارید، مگر اینکه در حال انجام مداخلات کنترل شده منصفانه باشید.
3) مانند یک دانشمند (با میان وعده) آموزش دهید
- : از نمونهبرداری طبقهبندی شده و وزندهی مجدد کلاس استفاده کنید تا مدل در کلاس اکثریت غرق نشود.
- : نورپردازی، زوایا، انسدادها و پسزمینهها را تغییر دهید. دادههای مصنوعی میتوانند کمک کنند، اما اجازه ندهید یک موتور بازی کل واقعیت شما را اختراع کند.
- </b>: از زیانها یا محدودیتهای آگاه از انصاف استفاده کنید که شکافهای عملکرد را در بین گروهها به حداقل میرساند.
- : اگر استقرار تاریک، پر سر و صدا یا کمرزولوشن است، آن جهان را شبیهسازی کنید. بهتر: در آن جهان جمعآوری کنید.
4) مانند یک بدبین آزمایش کنید
- : دقت، صحت/فراخوانی و کالیبراسیون را بر اساس زیرگروه گزارش دهید. اگر نتوانید آن را ببینید، آن را برطرف نخواهید کرد.
- : زمینه را عوض کنید در حالی که موضوع را ثابت نگه دارید. آیا زنی که کیف در دست دارد به «معلم» تبدیل میشود در حالی که مردی با کیف «مدیرعامل» است؟ این زمینه است که در 4K به دام افتاده است.
- : تابش خیرهکننده متخاصم، تاری حرکت، برف، مه، ماسک و کلاه را به مدل خود پرتاب کنید. اساساً هالووین برای شبکههای عصبی.
5) نظارت کنید انگار که جدی هستید
- : تغییرات در توزیع ورودی را پس از راهاندازی ردیابی کنید. وقتی برنامه شما به طور ناگهانی در برزیل بزرگ میشود، میخواهید بدانید.
- : به کاربران اجازه دهید خطاها و را پرچمگذاری کنند، و در واقع گزارشها را بخوانند. بله، حتی آنهایی که با حروف بزرگ هستند.
- : بازخوانی را زمانبندی کنید. مدلهای کهنه، مدلهای مغرضانه با سالمندی هستند.
سناریوهای دنیای واقعی: جایی که حس را خراب میکند
- : اگر تصاویر آموزشی شما بیشتر رنگ پوستهای روشنتر باشند، ضایعات روی پوستهای تیرهتر کمتر تشخیص داده میشوند. رفع: منابع را از کلینیکها در سراسر جمعیتها متنوع کنید و بر اساس دستههای رنگ پوست ارزیابی کنید.
- : مدلهایی که روی فیلم آزمایشی از فروشگاههای تمیز و روشن آموزش دیدهاند، در فروشگاههای شلوغ و کم نور اختلال ایجاد میکنند. رفع: از فروشگاههای واقعی در سراسر مناطق و فصول جمعآوری کنید. همچنین، شاید هودیها را جرم انگاری نکنید.
- : مدلی که روی تصاویر پهپادی روز آموزش دیده است، آفات را در هنگام غروب از دست میدهد. رفع: زمانهای مختلف روز و انواع حسگر (RGB + حرارتی) را شامل کنید. گیاهان هم زندگی شبانه دارند.
- : بررسیهای سلفی پاسپورت روی موهای فرفری یا پوشش سر ناموفق است. رفع: آموزش را گسترش دهید و به طور صریح بافتهای مو و پوششها را ارزیابی کنید. جایزه: اعلانهای رابط کاربری و راهنمایی نورپردازی را بهبود بخشید.
افسانههایی که مدام میشنوم (و بله، رسید آوردهام)
- «مجموعههای داده بزرگتر = کمتر.» اگر مجموعه داده بزرگ شما فقط بیشتر از همان باشد، شما مشکل را بزرگ کردهاید. این مانند سفارش یک قهوه اشتباه بزرگ است.
- «ما آن را در پست با یک الگوریتم هوشمند برطرف خواهیم کرد.» الگوریتمها میتوانند را کاهش دهند، اما شما نمیتوانید یک سیب زمینی را جلا دهید و آن را الماس بنامید. با سیب زمینیهای بهتر—یعنی دادهها—شروع کنید.
- «انصاف به معنای دقت یکسان برای همه است.» گاهی اوقات برابری هدف است. گاهی اوقات شانس برابر یا نمرات کالیبره شده مهمتر هستند. معیارهایی را انتخاب کنید که با آسیبی که میخواهید از آن جلوگیری کنید، مطابقت داشته باشند.
- «دادههای مصنوعی تنوع را حل میکنند.» این به پر کردن شکافها کمک میکند، اما اگر ژنراتور ها را از تصاویر واقعی یاد گرفته باشد، شما فقط مشکل را در 4K شبیهسازی کردهاید.
یک بررسی عملی و گام به گام که میتوانید در واقع این هفته اجرا کنید
- : یک جدول ساده از اینکه چه کسی و چه چیزی در آن وجود دارد ایجاد کنید—جمعیتشناسی، نورپردازی، دستگاهها، مکانها. شکافها را با رنگ قرمز برجسته کنید. طوری رفتار کنید که انگار در حال نمره دادن به مدل خود هستید.
- : 1000–10000 تصویر طبقهبندی شده در گروههایی که به آنها اهمیت میدهید. این معاینه فیزیکی سالانه شما است.
- را انتخاب کنید</b>: با دقت زیرگروه و خطای کالیبراسیون شروع کنید. اگر برنامه شما پرمخاطره است (پزشکی، هویت)، شانس برابر یا شکافهای نرخ منفی کاذب را اضافه کنید.
- : «هیچ زیرگروهی زیر 95% از دقت کلی نباشد» شروع خوبی است. آن را یادداشت کنید. به یک دیوار بچسبانید.
- : شکافها را با جمعآوری دادههای هدفمند پر کنید، نمونهبردار خود را دوباره وزن دهید و در جایی که مستقر میکنید، افزایش دامنه را امتحان کنید. ارزیابی انصاف را دوباره اجرا کنید. این کار را تکرار کنید تا زمانی که پوستر دیواری شما از فریاد زدن به شما دست بردارد.
هوشیار باشید: مقررات، ممیزیها و اینکه چرا تیم حقوقی شما ناگهان عاشق ناهار شده است
قوانین و استانداردها در حال رسیدن هستند. انتظار داشته باشید الزامات ارزیابیهای تأثیر، مستندسازی دادههای آموزشی و نظارت پس از استقرار—به ویژه در مراقبتهای بهداشتی، استخدام و استفادههای بخش دولتی. ترجمه: سوابق را نگه دارید. برگههای داده برای مجموعههای داده، کارتهای مدل برای مدلها و یک مسیر کاغذی برای هر تغییر عمده. خود آینده شما—و یک تنظیمکننده—از شما تشکر خواهند کرد.
ابزارهایی که ارزش امتحان کردن را دارند وقتی صفحه گسترده شما شروع به گریه میکند
- </b>: به دنبال جعبه ابزارهای منبع باز باشید که معیارهای زیرگروه، کالیبراسیون و محدودیتهای انصاف را گزارش میدهند. بسیاری با چارچوبهای رایج ML ادغام میشوند.
- : نقشههای برجستگی، Grad-CAM، SHAP. از آنها استفاده کنید تا ببینید مدل در واقع به چه چیزی نگاه میکند. اگر این لوگو باشد و نه محصول، شما یک مشکل وسواس دارید.
- : سیستمهایی که به شما امکان میدهند بر اساس فراداده فیلتر کنید، شکافهای توزیع را تجسم کنید و موارد تقریباً تکراری را پرچمگذاری کنید. هدف این است که کلونهای کمتری داشته باشید و پوشش بیشتری داشته باشید.
ارزش اشاره دارد: اگر میخواهید هنگام انتخاب یا ممیزی مجموعههای داده، یک بررسی سلامت عقل داشته باشید، Sider.AI میتواند به شما کمک کند تا به سرعت توزیعها را مقایسه کنید، برشهای کمتر نشان داده شده را برجسته کنید و همبستگیهای «اوه اوه» را قبل از اینکه به اشکالات تولید تبدیل شوند، نشان دهید. آن را به عنوان دوستی در نظر بگیرید که به شما میگوید اسفناج در دندانتان است—به آرامی و با نمودار. جنبه انسانی: تیمها را برطرف میکنند، نه نوار ابزارها
- تیمهای متنوع نقاط کور مختلف را متوجه میشوند. اگر همه افراد تیم شما در همان سه شهر تعطیلات میروند، مدل شما نیز همینطور خواهد بود.
- مشوقها مهم هستند. اگر موفقیت فقط «دقت کلی» باشد، افراد مدل مغرضانهای را که در جدول امتیازات برنده میشود، ارسال میکنند. اهداف انصاف را تعیین کنید و برای رسیدن به آنها پاداش دهید.
- با کاربران صحبت کنید، به ویژه کسانی که بدترین نتایج را میگیرند. آنها به شما خواهند گفت که داشبورد شما نمیگوید.
بردهای سریع در مقابل مسافتهای طولانی: چه کاری باید بر اساس مهلت خود انجام دهید
- فردا ارسال کنید: افزایش هدفمند را برای بدترین زیرگروه خود اضافه کنید، زیان خود را دوباره وزن دهید و یک داشبورد نظارت با هشدارهایی برای رانش روی آن بزنید.
- ماه آینده ارسال کنید: یک مجموعه داده کوچک اما قدرتمند متمرکز بر شکافها جمعآوری کنید، با محدودیتهای انصاف دوباره آموزش دهید و یک مجموعه آزمایشی خلاف واقع اجرا کنید.
- فصل بعد ارسال کنید: خط لوله داده خود را دوباره طراحی کنید تا شامل نمونهبرداری مبتنی بر سهمیه، ارزیابیهای مداوم و یک بررسی متقابل قبل از انتشار باشد.
فهرست کنترلی که در واقع از آن استفاده خواهید کرد
- آیا میدانیم چه کسی در دادههای ما وجود دارد و چه کسی غایب است؟
- آیا اهداف عملکرد زیرگروه را تعیین کردهایم؟
- آیا برچسبهای ما سازگار و از نظر فرهنگی آگاه هستند؟
- آیا در محیطهایی که کاربران ما در آن زندگی میکنند—نه فقط آزمایشگاه ما—آزمایش کردهایم؟
- آیا میتوانیم تصمیمات مدل را هنگام بروز اشتباه توضیح دهیم؟
- آیا برنامهای برای به روز رسانی و نظارت پس از راهاندازی داریم؟
آن را چاپ کنید. قاب کنید. یا به دستگاه اسپرسو خود بچسبانید.
وقتی یک ویژگی است، نه یک باگ: تشخیص محدودیتها
برخی از وظایف تصویربرداری هنجارهای فرهنگی (مد، حرکات، نمادها) را رمزگذاری میکنند که جهانی نیستند. گاهی اوقات پاسخ درست این است که مدلها را بر اساس منطقه، فرهنگ یا مورد استفاده بومیسازی کنیم تا اینکه به دنبال انصاف یک اندازه برای همه باشیم. هدف این نیست که یک هوش مصنوعی بسازیم که همه چیز را در مورد همه بداند—بلکه این است که یک هوش مصنوعی بسازیم که بداند چه زمانی نمیداند.
نتیجه نهایی: اجازه ندهید هوش مصنوعی شما در یک حباب بزرگ شود
در تصویربرداری هوش مصنوعی مانند آموزش دوربین خود برای دیدن جهان از طریق یک لوله دستمال کاغذی است: شما یک دید باریک و سردرد دریافت میکنید. اما شما محکوم نیستید.
- دادههای خود را ممیزی کنید انگار که مهم هستند—زیرا هستند.
- با نیت برچسب بزنید، با محدودیت آموزش دهید و با شک و تردید آزمایش کنید.
- نظارت کنید، گوش دهید و رفع کنید زیرا دنیای واقعی به ناچار شما را شگفتزده میکند.
این کار را انجام دهید، و هوش مصنوعی شما از اشتباه گرفتن ساری با حوله حمام و خال با محصول دست برمیدارد. حتی ممکن است به اندازه کافی خوب باشد که به افراد کمک کند—به طور ایمن، منصفانه، و در واقعیت آشفته و وحشی که همه ما در آن زندگی میکنیم.
حالا بروید مجموعه داده خود را بررسی کنید. من منتظر میمانم. و من همان کسی خواهم بود که در گوشه ایستادهام و در گوش مدل شما زمزمه میکنم: «مشکل از تو نیست، از مجموعه آموزشی تو است.»
سوالات متداول
س1: در تصویربرداری هوش مصنوعی، به زبان ساده چیست؟
زمانی است که تصاویر آموزشی با دنیای واقعی مطابقت ندارند—رنگ پوست، شرایط نورپردازی یا زمینههای خیلی کم. مدل یک واقعیت باریک را یاد میگیرد و هنگام مواجهه با هر چیزی خارج از آن حباب، پیشبینیهای مغرضانه یا اشتباهی انجام میدهد.
س2:چگونه را قبل از ارسال تشخیص دهم؟
معیارهای خود را بر اساس زیرگروه—جمعیتشناسی، نورپردازی، دستگاهها—برش دهید و به دنبال شکافهای عملکرد بگردید. تستهای خلاف واقع و یک مجموعه ارزیابی انصاف کوچک و انتخاب شده را اضافه کنید تا زمینه و برچسبزنی را زود تشخیص دهید.
س3:آیا دادههای مصنوعی میتوانند را در بینایی کامپیوتر برطرف کنند؟
دادههای مصنوعی میتوانند شکافهایی مانند نورپردازی یا زوایای نادر را پر کنند، اما همچنین میتوانند موجود شما را شبیهسازی کنند. از آن برای افزایش سناریوهای کمتر نشان داده شده استفاده کنید، نه جایگزینی تصاویر متنوع دنیای واقعی.
س4:راههای سریع برای کاهش بدون بازسازی همه چیز چیست؟
کلاسها را دوباره وزن کنید، افزایشهای هدفمند را اضافه کنید و یک مجموعه داده کوچک متمرکز بر گروههایی که بدترین عملکرد را دارند جمعآوری کنید. سپس با زیانهای آگاه از انصاف دوباره آموزش دهید و رانش را پس از راهاندازی نظارت کنید.
س5:از چه معیارهایی برای اندازهگیری تصویربرداری استفاده کنم؟
با دقت زیرگروه و خطای کالیبراسیون شروع کنید، سپس شانس برابر یا شکافهای نرخ منفی کاذب را برای وظایف پرمخاطره در نظر بگیرید. معیارهایی را انتخاب کنید که با آسیبی که بیشتر میخواهید از آن جلوگیری کنید، همسو باشند.