Torej, vaša kamera z umetno inteligenco misli, da je vsaka ženska medicinska sestra, vsak moški pa direktor. Super, super, super.
Ste že kdaj naložili fotografijo v aplikacijo, ki jo "izboljšuje umetna inteligenca", in opazovali, kako samozavestno označi sari vaše prijateljice kot kopalni plašč? Ali pa ste videli sistem medicinskega slikanja, ki je vztrajal, da je znamenje na vaši roki borovnica? To je pristranskost nabora podatkov pri slikanju z umetno inteligenco in ni samo nerodna – lahko je nevarna. Predstavljajte si, kot da bi otroka učili abecedo samo s samoglasniki. Seveda, nekaj bo zapel. Ne želite pa, da piše recepte.
Smo v nenavadnem trenutku, ko je računalniški vid dovolj dober, da je povsod – v vašem telefonu, vašem avtomobilu, ordinaciji vašega zdravnika – a še vedno dovolj slab, da zgreši bistvo, kontekst in včasih cele skupine ljudi. Krivec običajno ni matematika. To so podatki. Natančneje, podatki, ki so usposobili te modele, da vidijo svet skozi zelo ozko lečo.
Poglejmo, kako se pristranskost nabora podatkov pri slikanju z umetno inteligenco prikrade, pokvari stvari in – kar je najpomembneje – kako lahko preprečite, da bi vašo mačko poimenovala rogljiček.
Kaj je pristranskost nabora podatkov pri slikanju z umetno inteligenco? Kratka različica, ki jo bo vaša teta dejansko prebrala
Do pristranskosti nabora podatkov pri slikanju z umetno inteligenco pride, ko slike, uporabljene za usposabljanje modela, ne predstavljajo resničnega sveta. Če vaš nabor podatkov večinoma vsebuje obraze ene demografske skupine, tone kože iz omejenega območja ali predmete, fotografirane v popolni studijski osvetlitvi (živjo, influencerski obročni luči!), se model nauči izkrivljene različice resničnosti.
- Pristranskost izbire: Izbrali ste slike, ki jih je bilo najlažje dobiti – fotografije iz fotobanke, bela ozadja in občasnega sumljivo srečnega jedca solate.
- Pristranskost označevanja: Ljudje označujejo slike. Ljudje prinašajo mnenja. Včasih so ta mnenja bolj "kreativno pisanje" kot "resnica na terenu."
- Kontekstualna pristranskost: Stetoskop poleg ženske? Verjetno je medicinska sestra. Ista stvar poleg moškega? Zdravnik. Model se je stereotip naučil iz nabora podatkov.
- Pristranskost domene: Usposobili ste se na sijajnih fotografijah izdelkov, nato pa ste se razporedili v temnih tovarniških halah. Presenečenje: viličar je videti kot Bigfoot.
Če umetno inteligenco naučite videti svet samo skozi eno sosesko, ne bodite šokirani, ko se izgubi v centru mesta.
Ne tako smešne nevarnosti: ko pristranskost preneha biti meme
Pristranskost pri slikanju z umetno inteligenco ne povzroča samo memov. Pojavlja se v:
- Medicinsko slikanje: Premalo zastopane barve kože v dermatoloških naborih podatkov lahko povzročijo slabše stopnje odkrivanja bolezni, kot je melanom. Ko se slikovne pike ne ujemajo s primeri usposabljanja, se napake povečajo.
- Varnost in nadzor: Napačna identifikacija pri prepoznavanju obrazov je bila povezana z nezakonitimi aretacijami, zlasti za temnopolte ljudi. Ni odlična uporabniška izkušnja.
- Zaposlovanje in preverjanje identitete: Ujemanje obrazov, ki ne ujema nebinarnih ali transspolnih obrazov, ni samo moteče – izključuje.
- Avtonomni sistemi: Samovozeči avtomobil, ki je bil večinoma usposobljen v kalifornijskem soncu, morda ne bo prepoznal s snegom prekritega znaka za ustavitev v Minnesoti. Avto ni nepremišljen. Je zaščiten.
Ko je svet modela majhen, pravi ljudje plačajo ceno.
Kako se prikrade: štirje jezdeci apokalipse pristranskosti nabora podatkov slik
1) "Pristranskost brezplačnih stvari"
Strganje odprtega spleta za slike je v bistvu potapljanje v smeti za slikovne pike. Našli boste veliko posnetkov slavnih oseb, značk s tehnoloških konferenc in posnetkov izdelkov, ki so videti, kot da so bili posneti na Luni. Vsakdanja, neurejena resničnost? Manj. To nagne vaš model k določenim obrazom, krajem in vibracijam.
2) "Zanašanje na že znano"
Označevalca prideta na delo. Eden označi pulover s kapuco kot "športna oblačila", drugi pravi "casualwear", tretji pa ga imenuje "streetwear." Model se nauči, da so oblačila kaos. Še huje, označevalci prinašajo kulturne predpostavke – na primer, kdo je videti kot "šef" ali kaj velja za "naravno" pričesko.
3) "Bližnjica"
Modeli obožujejo bližnjice. Če 90 % fotografij kuharjev v vašem naboru podatkov prikazuje moške, bo model uporabil spol kot bližnjico za napoved "kuharja." To ni inteligenca; to je pristranski pripomoček.
4) "Neskladje domen"
Usposabljajte se na glamuroznih posnetkih DSLR, uvajajte na varnostnih kamerah z nizko ločljivostjo. Usposabljajte se na dnevnih slikah, uvajajte ponoči. Usposabljajte se na mestnih ulicah, uvajajte na podeželskih cestah. Vaš model v bistvu potuje brez polnilnika.
Odkrivanje pristranskosti brez doktorata znanosti – ali detektorja laži
Evo, kako veste, da ima vaš model slikanja z umetno inteligenco težavo s pristranskostjo, poleg tistega neprijetnega občutka v vaši predstavitvi:
- Vrzeli v uspešnosti: Razdelite svoje metrike preverjanja po demografiji, osvetlitvi, geografiji ali vrsti naprave. Če natančnost pri določenih skupinah pade kot telefon brez etuija, imate pristranskost.
- Matrike zmede, ki vas zmedejo: Če model nenehno meša določene razrede – recimo, hidžabe s klobuki – je to pokazatelj nabora podatkov.
- Revizije pripisovanja funkcij: Orodja, kot je Grad-CAM, lahko razkrijejo, da vaš detektor "mačk" dejansko deluje po vzorcu kavča. Čestitke, usposobili ste prepoznavanje oblazinjenja.
- Drsenje pilotnega programa v resničnem svetu: Izvedite majhne pilotne programe v naravi. Če model paničari pod fluorescentno razsvetljavo kot rastlina v kleti, potrebuje bolj raznolike podatke.
Komplet orodij: kako zmanjšati pristranskost nabora podatkov, preden vas ugrizne v načrt izdelka
Predstavljajte si boj proti pristranskosti kot prenovo doma. Lahko popravite, ojačate ali raztrgate in obnovite. Vaš proračun: čas, podatki in ponižnost.
1) Kurirajte kot muzej (ne kot bolšji trg)
- Določite pokritost: Zapišite demografijo, pogoje osvetlitve, vrste kamer, geografijo in okolja, ki jih mora vaš sistem obvladati. Če ni napisano, je to pobožna želja.
- Določite kvote: Da, kvote. Če je 30 % vaših uporabnikov v slabi svetlobi, mora biti 30 % vašega nabora podatkov slik v slabi svetlobi. Enako velja za območja tona kože (uporabite lestvice, kot je Fitzpatrick, kot posrednik), starostne skupine, sloge oblačil in kulturne kontekste.
- Izvor podatkov iz več virov: Fotografije iz fotobanke so sladica. Potrebujete tudi domače obroke: fotografije, ki jih prispevajo uporabniki (s soglasjem), javne nabore podatkov z revizijami pristranskosti in ciljno zbiranje podatkov iz premalo zastopanih skupin.
2) Označujte kot odvetnik (a prijaznejši)
- Jasna taksonomija: Napišite vodnik za označevanje. Ne, pravi. Vključite mejne primere, primere in kaj ne smete storiti. Zmanjšajte "vibracije" označevalca.
- Raznoliki označevalci: Če so vsi vaši označevalci obiskovali iste tri kavarne, bodo tudi vaše oznake. Geografska in kulturna raznolikost pomaga.
- Preverjanje sporazumov: Izmerite sporazum med označevalci in rešite nesoglasja z vodilnim označevalcem. Ne povprečujte do nesmisla.
- Občutljivi atributi: Kadar je primerno in s soglasjem, zbirajte oznake zaščitenih atributov za vrednotenje. Hranite jih zunaj usposabljanja, razen če izvajate nadzorovane intervencije za pravičnost.
3) Trenirajte kot znanstvenik (s prigrizki)
- Uravnoteženo vzorčenje: Uporabite stratificirano vzorčenje in ponovno uteževanje razredov, da se model ne utopi v večinskem razredu.
- Povečanje podatkov, odgovorno: Spremenite osvetlitev, kote, okluzije in ozadja. Sintetični podatki lahko pomagajo, vendar ne dovolite, da igralni motor izumi celotno vašo resničnost.
- Cilji za odpravo pristranskosti: Vključite izgube ali omejitve, ki se zavedajo pravičnosti in zmanjšujejo vrzeli v uspešnosti med skupinami.
- Prilagajanje domene: Če je uvajanje temno, hrupno ali nizke ločljivosti, simulirajte ta svet. Bolje: zbirajte v tem svetu.
4) Preizkusite kot cinik
- Vrednotenje po rezinah: Poročajte o natančnosti, natančnosti/odzivu in umerjanju po podskupinah. Če ga ne morete videti, ga ne boste popravili.
- Protitestovi: Zamenjajte kontekst, medtem ko subjekt ostane konstanten. Ali ženska, ki drži aktovko, postane "učiteljica", medtem ko je moški z aktovko "direktor"? To je kontekstualna pristranskost, ujeta v 4K.
- Stresni testi: V model vrzite sovražni sijaj, zamegljenost gibanja, sneg, meglo, maske in klobuke. V bistvu noč čarovnic za nevronske mreže.
5) Spremljajte, kot da to mislite resno
- Zaznavanje drsenja: Sledite spremembam v vhodni distribuciji po lansiranju. Ko vaša aplikacija nenadoma postane velika v Braziliji, boste želeli vedeti.
- Človek v zanki: Dovolite uporabnikom, da označijo napake in pristranskost, in dejansko preberite poročila. Da, tudi tiste z velikimi tiskanimi črkami.
- Ritem ponovnega usposabljanja: Načrtujte osvežitve. Zastareli modeli so pristranski modeli s senioritisom.
Scenariji iz resničnega sveta: kjer pristranskost nabora podatkov uniči vibracijo
- Dermatologija AI: Če so vaše slike za usposabljanje večinoma svetlejše barve kože, se lezije na temnejši koži premalo zaznajo. Popravek: diverzificirajte vire iz klinik po populacijah in ocenite po kategorijah tonov kože.
- Preprečevanje izgube v maloprodaji: Modeli, usposobljeni na testnih posnetkih iz čistih, svetlih trgovin, se v prenatrpanih, temnih trgovinah ne izidejo. Popravek: zbirajte iz pravih trgovin po regijah in letnih časih. Prav tako morda ne kriminalizirajte puloverjev s kapuco.
- Slikanje v kmetijstvu: Model, usposobljen na dnevnih slikah drona, ponoči zamudi škodljivce. Popravek: vključite različne ure dneva in vrste senzorjev (RGB + termalno). Tudi rastline imajo nočno življenje.
- Skeniranje dokumentov: Preverjanje selfijev potnih listov ne uspe na kodrastih laseh ali pokrivalih za glavo. Popravek: razširite usposabljanje in izrecno ocenite teksture las in pokrivala. Bonus: izboljšajte pozive uporabniškega vmesnika in navodila za osvetlitev.
Miti, ki jih nenehno poslušam (in ja, prinesel sem račune)
- "Večji nabori podatkov = manj pristranskosti." Če je vaš veliki nabor podatkov le več istega, ste povečali težavo. To je kot naročiti venti napačne kave.
- "Popravili ga bomo v objavi s pametnim algoritmom." Algoritmi lahko ublažijo pristranskost, vendar ne morete polirati krompirja in ga imenovati diamant. Začnite z boljšimi krompirji – oziroma podatki.
- "Pravičnost pomeni enako natančnost za vse." Včasih je cilj pariteta; včasih so izenačene možnosti ali umerjeni rezultati pomembnejši. Izberite metrike, ki ustrezajo škodi, ki jo želite preprečiti.
- "Sintetični podatki rešujejo raznolikost." Pomaga zapolniti vrzeli, če pa se je generator naučil pristranskosti iz pravih slik, ste pravkar klonirali težavo v 4K.
Praktičen kontrolni pregled pristranskosti po korakih, ki ga lahko dejansko izvedete ta teden
- Popišite svoj nabor podatkov: Ustvarite preprosto tabelo, kdo in kaj je v njej – demografija, osvetlitev, naprave, lokacije. Označite vrzeli z rdečo barvo. Pretvarjajte se, da ocenjujete svoj model.
- Sestavite nabor za vrednotenje pravičnosti: 1.000–10.000 slik, stratificiranih po skupinah, ki vas zanimajo. To je vaša letna telesna vadba.
- Izberite dve metriki pristranskosti: Začnite z natančnostjo podskupine in napako pri umerjanju. Če je vaša aplikacija zelo pomembna (medicinska, identiteta), dodajte izenačene možnosti ali vrzeli v stopnji lažno negativnih rezultatov.
- Nastavite pragove: "Nobena podskupina pod 95 % celotne natančnosti" je začetek. Zapišite. Prilepite ga na steno.
- Razvrščanje in ponovno usposabljanje: Zapolnite vrzeli s ciljno usmerjenim zbiranjem podatkov, ponovno uravnotežite svoj vzorčevalnik in poskusite povečati domeno, kjer izvajate. Ponovno zaženite vrednotenje pravičnosti. Ponavljajte, dokler vaš plakat na steni neha kričati na vas.
Pozor: Predpisi, revizije in zakaj ima vaša pravna ekipa nenadoma rada kosilo
Zakoni in standardi dohitevajo. Pričakujte zahteve za ocene vpliva, dokumentacijo podatkov o usposabljanju in spremljanje po uvedbi – zlasti v zdravstvu, zaposlovanju in uporabi v javnem sektorju. Prevod: vodite evidence. Podatkovni listi za nabore podatkov, kartice modelov za modele in sled papirja za vsako večjo spremembo. Vaša prihodnost – in regulator – vam bosta hvaležna.
Orodja, ki jih je vredno poskusiti, ko vaša preglednica začne jokati
- Knjižnice za vrednotenje pristranskosti: Poiščite odprtokodne komplete orodij, ki poročajo o metrikah podskupin, umerjanju in omejitvah pravičnosti. Mnogi se integrirajo s skupnimi okviri ML.
- Pojasljivost: Zemljevidi pomembnosti, Grad-CAM, SHAP. Uporabite jih, da vidite, kaj model dejansko gleda. Če je to logotip in ne izdelek, imate težavo z zaljubljenostjo.
- Brskalniki podatkov: Sistemi, ki vam omogočajo filtriranje po metapodatkih, vizualizacijo vrzeli v distribuciji in označevanje skorajšnjih dvojnikov. Prizadevajte si za manj klonov, več pokritosti.
Omeniti velja: Če želite preveriti zdrav razum med izbiranjem ali revidiranjem naborov podatkov, vam lahko Sider.AI pomaga hitro primerjati distribucije, poudariti premalo zastopane rezine in prikazati korelacije "uh-oh", preden postanejo produkcijske napake. Predstavljajte si ga kot prijatelja, ki vam pove, da imate špinačo v zobeh – nežno in z grafikoni. Človeška plat: ekipe popravijo pristranskost, ne orodne vrstice
- Raznolike ekipe opazijo različne slepe pege. Če vsi v vaši ekipi letujejo v istih treh mestih, bo tudi vaš model.
- Spodbude so pomembne. Če je uspeh le "splošna natančnost," bodo ljudje dobavili pristranski model, ki zmaga na lestvici najboljših. Določite cilje pravičnosti in nagradite njihovo doseganje.
- Pogovarjajte se z uporabniki, zlasti s tistimi, ki dobijo najslabše rezultate. Povedali vam bodo, česar vaša nadzorna plošča ne bo.
Hitre zmage proti dolgim prevozom: kaj storiti glede na vaš rok
- Dostavite jutri: Dodajte ciljno usmerjeno povečanje za vašo najslabšo podskupino, ponovno uravnotežite izgubo in nalepite nadzorno ploščo za spremljanje z opozorili za drsenje.
- Dostavite naslednji mesec: Zberite majhen, a mogočen nabor podatkov, osredotočen na vrzeli, ponovno usposobite z omejitvami pravičnosti in zaženite nabor protitestov.
- Dostavite naslednje četrtletje: Prenovite svoj podatkovni kanal, da vključite vzorčenje na podlagi kvot, stalne vrednotenja pristranskosti in medfunkcijsko oceno pred izdajo.
Kontrolni seznam, ki ga boste dejansko uporabili
- Ali vemo, kdo je v naših podatkih in kdo manjka?
- Ali smo določili cilje uspešnosti podskupin?
- Ali so naše oznake dosledne in kulturno ozaveščene?
- Ali smo testirali v okoljih, v katerih živijo naši uporabniki – ne samo v našem laboratoriju?
- Ali lahko pojasnimo odločitve modela, ko gre kaj narobe?
- Ali imamo načrt za posodobitev in spremljanje po lansiranju?
Natisnite ga. Uokvirite ga. Ali pa ga prilepite na svoj aparat za espresso.
Ko je pristranskost funkcija, ne napaka: prepoznavanje omejitev
Nekatere naloge slikanja kodirajo kulturne norme (moda, geste, simboli), ki niso univerzalne. Včasih je pravi odgovor lokalizirati modele po regiji, kulturi ali primeru uporabe, namesto da bi lovili pravičnost, ki ustreza vsem. Cilj ni ustvariti umetne inteligence, ki ve vse o vseh – ampak ustvariti tisto, ki ve, kdaj ne ve.
Bistvo: ne dovolite, da vaša umetna inteligenca odrašča v mehurčku
Pristranskost nabora podatkov pri slikanju z umetno inteligenco je kot učenje kamere, da vidi svet skozi cev iz papirnate brisače: dobite ozek pogled in glavobol. Ampak niste obsojeni.
- Revidirajte svoje podatke, kot da so pomembni – ker so.
- Označite z namenom, usposabljajte z omejitvami in preizkušajte s skepticizmom.
- Spremljajte, poslušajte in popravljajte, saj vas bo resnični svet neizogibno presenetil.
Storite to in vaša umetna inteligenca ne bo več zamenjevala sarijev za kopalne plašče in znamenj za pridelke. Morda bo celo dovolj dober, da bo pomagal ljudem – varno, pošteno in v divji, neurejeni resničnosti, v kateri dejansko živimo vsi.
Zdaj pojdite preverit svoj nabor podatkov. Počakal bom. In jaz bom tisti v kotu, ki bo šepetal vašemu modelu: "Ni problem v tebi, ampak v tvojem naboru podatkov."
Pogosta vprašanja
V1: Kaj je pristranskost nabora podatkov pri slikanju z umetno inteligenco, v preprostem jeziku?
Do nje pride, ko se slike za usposabljanje ne ujemajo z resničnim svetom – premalo tonov kože, pogojev osvetlitve ali kontekstov. Model se nauči ozke resničnosti in daje pristranske ali napačne napovedi, ko sreča kaj zunaj tega mehurčka.
V2: Kako zaznam pristranskost nabora podatkov, preden ga pošljem?
Razdelite svoje metrike po podskupinah – demografija, osvetlitev, naprave – in poiščite vrzeli v uspešnosti. Dodajte protitestove in majhen, kuriran nabor za vrednotenje pravičnosti, da zgodaj ujamete kontekst in pristranskost pri označevanju.
V3: Ali lahko sintetični podatki popravijo pristranskost nabora podatkov pri računalniškem vidu?
Sintetični podatki lahko zapolnijo vrzeli, kot so redka osvetlitev ali koti, lahko pa tudi klonirajo vašo obstoječo pristranskost. Uporabite ga za povečanje premalo zastopanih scenarijev, ne pa za zamenjavo raznolikih slik iz resničnega sveta.
V4: Kateri so hitri načini za zmanjšanje pristranskosti brez ponovne izgradnje vsega?
Ponovno utežite razrede, dodajte ciljno usmerjena povečanja in zberite majhen nabor podatkov, osredotočen na vaše najslabše delujoče skupine. Nato ponovno usposobite z izgubo, ki se zaveda pravičnosti, in spremljajte drsenje po lansiranju.
V5: Katere metrike naj uporabim za merjenje pristranskosti slikanja?
Začnite z natančnostjo podskupine in napako pri umerjanju, nato pa razmislite o izenačenih možnostih ali vrzelih v stopnji lažno negativnih rezultatov za naloge z visokimi vložki. Izberite metrike, ki so usklajene s škodo, ki jo najbolj želite preprečiti.