Are GPT detectors accurate enough to catch AI writing reliably?

They’re decent at flagging unedited AI text, but they falter with short passages, paraphrased AI, and polished human writing. Use them as a nudge to review, not a final verdict.

How can I test the accuracy of a GPT detector myself?

Run a small study with four buckets: pure human, pure AI, human-edited AI, and obfuscated AI. Measure precision and recall, and note false positives on your own real samples.

Why did my original essay get flagged as AI?

Clean, consistent prose can look “too smooth,” and ESL patterns are sometimes misread as AI artifacts. Defend your work with drafts, timestamps, sources, and a quick chat about your process.

Can I make AI text pass as human with a few tweaks?

Often, yes. Paraphrasing, adding personal details, and varying sentence rhythm can fool detectors. That’s why scores alone shouldn’t be used to punish or reject work.

What’s a fair policy for using GPT detectors in class or hiring?

Publish that detectors are one data point among several, never a sole basis for penalties. Require corroboration, allow appeals with draft evidence, and prioritize substance over style.

Vai tiešām var atpazīt AI ģenerētu tekstu? GPT detektoru testēšana (bez prāta zaudēšanas)

Vai esat kādreiz mēģinājis pamanīt robotu pārpildītā telpā?

Pirms dažiem mēnešiem kāda draudzene-skolotāja man vēlu vakarā atsūtīja īsziņu ar tekstu: “Man šķiet, ka pusi no maniem esejām ir sarakstījuši roboti.” Viņa bija ievietojusi savu skolēnu darbus vienā no tiem GPT detektoriem — servisos, kas apgalvo, ka var noteikt, vai tekstu ir radījis cilvēks vai mākslīgais intelekts, piemēram, ChatGPT —, un rādījums iedegās kā Ziemassvētku eglīte. Visur sarkani karogi. Panika. Apsūdzības. Viss komplektā.

Bet te ir pavērsiens: divas no atzīmētajām esejām bija no bērniem, kuri raksta tā, it kā viņi gatavotos noklausīšanās “The New Yorker”. Īsti brīnumbērni. Ja jūs jau dzirdat “Likums un kārtība” dun-dun savā galvā, jūs neesat viens.

Tāpēc es darīju to, ko darītu jebkurš ziņkārīgs dīvainis ar vāju vietu uz taisnīgumu: es pavadīju nedēļu, testējot GPT detektorus. Vai viņi tiešām varēja atšķirt cilvēka rakstīšanu no AI rakstīšanas? Kā viņi strādā? Vai skolotājiem, redaktoriem vai pieņemšanas vadītājiem vajadzētu viņiem uzticēties? Un kas notiek, kad viņi kļūdās?

Spoilers: tie nav melu detektori. Tie ir… noskaņas detektori. Un noskaņas ir mīkstas.

Ko mēs saprotam ar “GPT detektoru precizitātes testēšanu”

Ieviesīsim skaidrību. Kad cilvēki runā par GPT detektoru precizitātes testēšanu, viņi parasti vēlas atbildes uz ļoti cilvēcīgiem jautājumiem:

Vai es varu noķert AI ģenerētas esejas savā klasē vai savā komandā?

Vai es varu droši ievietot tekstu detektorā un rīkoties, pamatojoties uz rezultātu?

Vai ir kādi soļi, lai mans raksts “izietu” kā cilvēka raksts — pat ja tas ir cilvēka raksts?

Lietotāja nolūks šeit ir daļēja skepse, daļēja izdzīvošanas rokasgrāmata. Jūs vēlaties veidu, kā pārbaudīt, vai jūsu detektors ir labs — ideālā gadījumā pirms tas iznīcina kāda atzīmi, darba pieteikumu vai reputāciju.

Šis raksts ir jūsu praktiskā ekskursija. Mēs:

Demistificēsim, kā detektori domā.

Veiksim vienkāršu DIY testa plānu, kuru varat atkārtot.

Izpētīsim atteices režīmus (tie ir traki).

Piedāvāsim gudrākas, godīgākas alternatīvas, kad likmes ir augstas.

Es izmantošu vienkāršu valodu un praktiskumu — un jā, nedaudz bezkaunības —, jo tas ir pietiekami mulsinoši arī bez statistikas doktora grāda.

Kā GPT detektori “min”: ātrs, cilvēkiem draudzīgs skaidrojums

Lielākā daļa detektoru faktiski nezina, no kurienes teksts ir nācis. Viņi veic modeļu atpazīšanu — meklē statistiskus rādītājus, kas ir biežāk sastopami AI tekstā nekā cilvēka tekstā. Iedomājieties to kā Šerloku Holmsu vārdu secībai.

Divas galvenās norādes, kuras detektori meklē:

Prognozējamība: AI mēdz radīt vienmērīgākas, ļoti ticamas vārdu secības. Iedomājieties ceļu bez bedrēm. No otras puses, cilvēki klūp, atkāpjas, iemet dīvainas metaforas un reizēm raksta tā, it kā sūtītu īsziņas amerikāņu kalniņos.

Sprādzienveidīgums: Cilvēki raksta uzliesmojumos — īsi teikumi, kam seko gari, pēkšņas ritma izmaiņas. AI bieži izklausās konsekventi, it kā tas būtu apmeklējis šarma skolu.

Ķeršanās? Labi cilvēku rakstnieki var būt vienmērīgi un paredzami. Un AI var likt “Rakstīt kā cilvēkam, kurš ir dzēris kafiju un kam ir jūtas.” Robežas izplūst.

Arī: Dažādi detektori aplūko dažādus signālus. Daži pārbauda sintakses daudzveidību, citi analizē vārdu retumu vai teikumu entropiju. Neviens no viņiem nevar izsekot autorību tā, kā to varētu darīt ūdenszīme. Tie ir tiesu meteorologi, nevis DNS laboratorijas.

Labi, slikti un smieklīgi nepareizi: Kas detektoriem izdodas (un kas neizdodas)

Kur tie spīd: Ātra triāža. Ja jūs pārlūkojat satura kaudzes, detektors var izcelt tekstu, kas ir aizdomīgi vispārīgs, atkārtots vai īpaši vienmērīgs — vērts tuvāk apskatīt.

Kur tie klūp: Augsta riska spriedums. Detektori var nepatiesi apsūdzēt spēcīgus rakstniekus (skaidru, konsekventu, labi strukturētu prozu) un ļaut AI iziet cauri, ja jūs pakustinat pogas (pievienojiet drukas kļūdas, sajauciet teikumus vai pārfrāzējiet ar tēzauru).

“Nepareizi pozitīva” problēma: Īsti cilvēki tiek atzīmēti kā AI. Tas bieži notiek ar ESL rakstniekiem, formulu stila rakstniekiem un ikvienu, kurš ir rediģējis savu darbu tīros, līdzsvarotos paragrāfos. Iedomājieties, ka jums saka, ka jūsu oriģinālais darbs ir viltots, jo tas ir… pārāk labs.

Secinājums: detektors nav spriedums; tas ir mājieni. Līdzīgi kā jūsu dūmu detektors, kad jūs piededzināt grauzdiņus. Jā, ir dūmi. Nē, mājai nav obligāti jādeg.

DIY, atkārtojams veids, kā pārbaudīt GPT detektora precizitāti

Jums nav nepieciešams laboratorijas mētelis. Jums vienkārši ir nepieciešams plāns. Šeit ir vienkāršs, mājās veicams protokols, ko varat izmantot, lai pārbaudītu GPT detektoru precizitāti savā klasē, redakcijā vai uzņēmumā.

Izveidojiet četrus teksta spaiņus (katrs apmēram 300–500 vārdu):

Tīrs cilvēks: Kaut kas, ko jūs uzrakstījāt no nulles. Saglabājiet melnrakstus, lai to pierādītu.

Tīrs AI: Lūdziet GPT modelim rakstīt par to pašu tēmu, bez rediģēšanas.

Cilvēka rediģēts: Sāciet ar AI melnrakstu, pēc tam pārskatiet kā cilvēks — pievienojiet anekdotes, sajauciet rindkopas, ievietojiet personisku informāciju.

AI nomaskēts: Paņemiet AI melnrakstu un palaidiet to caur pārfrāzētājiem, sinonīmu maisītājiem un teikumu sadalītājiem. Palieliniet haosu.

Izvēlieties 3–5 detektorus, ko testēt. Dažādi rīki, dažādas noskaņas.

Akls etiķetes. Palūdziet kolēģim pārdēvēt failus A, B, C, D, lai jūs neietekmētu sevi.

Palaidiet katru paraugu caur katru detektoru. Ierakstiet neapstrādātus rezultātus un kategorisko etiķeti (piemēram, “Visticamāk AI”, “Jaukts”, “Cilvēks”).

Aprēķiniet pamatus:

Patiesi pozitīvi: AI pareizi atzīmēts kā AI.

Patiesi negatīvi: Cilvēks pareizi atzīmēts kā cilvēks.

Nepareizi pozitīvi: Cilvēks atzīmēts kā AI.

Nepareizi negatīvi: AI atzīmēts kā cilvēks.

Aprēķiniet precizitāti, precizitāti, atsaukšanu:

Precizitāte = (TP + TN) / Kopā.

Precizitāte (AI) = TP / (TP + FP). Tas jums parāda: kad tas saka “AI”, cik bieži tas ir pareizi?

Atsaukšana (AI) = TP / (TP + FN). Tas jums parāda: cik daudz AI teksta tas faktiski noķēra?

Stresa tests ar stila dažādību:

Pievienojiet ESL rakstīšanu, ļoti tehnisku rakstīšanu un radošu rakstīšanu.

Iekļaujiet attīrītu cilvēka tekstu: gramatiski pārbaudīts un kārtīgi formatēts.

Izmēģiniet īsus fragmentus (zem 150 vārdiem). Daudzi detektori aizrijas ar īsumu.

Dokumentējiet robežgadījumus. Ekrānšāviņi, teksta paraugi un jūsu melnrakstu vēsture palīdz jums saprast, kāpēc — ne tikai rezultātu.

Ja detektora precizitāte ir zema, tas nozīmē, ka tas zem autobusa met daudz nevainīgu cilvēku. Ja atsaukšana ir zema, AI izslīd cauri. Ja abi ir meh… nu, šis detektors var būt vairāk Magic 8-Ball nekā mikroskops.

Praktisks piemērs: kas notiek, kad jūs bakstāt lāci

Pieņemsim, ka mēs lūdzam AI: “Uzrakstiet 400 vārdus par to, vai elektriskie skūteri padara pilsētas labākas.” Rezultāts: labi strukturēta, viduvēja eseja bez personiskas intereses. Tagad mēs to palaižam caur trim detektoriem. Divi saka “Visticamāk AI.” Viens saka “Neskaidrs.”

Tagad mēs pievienojam cilvēka pirkstu nospiedumus:

Mēs ievietojam konkrētu anekdoti: “Es noslaucīju skrejriteni ārpus maizes ceptuves, un puisis banānu kostīmā jautāja, vai man viss kārtībā.”

Mēs dažādojam teikumu garumus. Iemetiet jautājumus, iekavas un asu vienrindnieku.

Mēs iekļaujam vietējo informāciju, piemēram, krustojumu un autostāvvietu biļešu izmaksas.

Palaidiet to vēlreiz. Pēkšņi detektori sadalās: viens joprojām saka “Visticamāk AI”, viens pārslēdzas uz “Cilvēks”, un viens saka “Jaukts.”

Visbeidzot, mēs pilnībā nomaskējam sākotnējo AI tekstu — pārfrāzētājs, sinonīmu griezējs, plus sauja drukas kļūdu — un detektori galvenokārt parausta plecus: “Izskatās cilvēciski.”

Morāle: ja jūsu rīku var apmānīt ar banānu kostīmiem un drukas kļūdām, iespējams, tas nav gatavs būt tiesnesis, žūrija un GPA izpildītājs.

Kāpēc labi cilvēki tiek atzīmēti kā boti

Tīra proza ir aizdomīga. Ja jūs rakstāt saspringtus, gramatiski pārbaudītus teikumus ar konsekventu struktūru, jūs varat iedarbināt “pārāk vienmērīgu” trauksmi.

ESL rakstnieki tiek sodīti. Daži detektori jauc nemācītas shēmas ar AI artefaktiem. Tas ir neglīts aizspriedums — negodīgs un atbaidošs.

Formulas žanri sajauc modeli. Ziņojumiem, korporatīvajiem atjauninājumiem vai piecu rindkopu esejām ir paredzami ritmi. Detektori domā: paredzamība = AI.

Īsas atbildes ir haotiskas. Ar maziem paraugiem matemātika kļūst trokšņaina un pārliecība krītas. Detektori bieži saka “AI”, jo nevar būt pārliecināti.

Ja detektors kāda darbu sauc par AI, izturieties pret to kā pret laika prognozi. Paņemiet līdzi lietussargu, bet neatceliet kāzas.

Gudrākas, godīgākas darbplūsmas, kad likmes ir augstas

Jūs varat turēt detektorus instrumentu jostā — vienkārši nepadariet tos par āmuru katrai naglai.

Lūdziet procesa pierādījumus. Melnraksti, laika zīmogi, piezīmes un pārskatīšanas vēsture pārspēj noskaņas. Google Docs un Microsoft Word izseko versiju vēsturi; tāpat arī daudzas piezīmju lietotnes un rakstīšanas platformas.

Izmantojiet mērķtiecīgus aicinājumus. Ja jums ir aizdomas par vispārīgu AI, uzdodiet papildu jautājumus: “Kādu avotu jūs izmantojāt šim apgalvojumam?” vai “Aprakstiet savu personīgo pieredzi, kas saistīta ar otro rindkopu.” AI ir grūti improvizēt reālu dzīvi.

Novērtējiet saturu, nevis tikai stilu. Sīkumi, avoti un oriģināla analīze ir svarīgāki par teikumu ritmu.

Apsveriet mutiskas pārbaudes. Divu minūšu saruna — “Izstāstiet man savu argumentu” — var atklāt, vai idejas ir dzīvotas vai kopētas-ielīmētas no ētera.

Esiet caurspīdīgs. Ja jūs izmantojat detektoru klasē vai pieņemšanas darbā, publicējiet savu politiku, savus sliekšņus, savu pārsūdzības procesu un nepatiesu pozitīvu risku. Saule ir labākais dezinfekcijas līdzeklis.

Ja jums ir jāizmanto detektors, noregulējiet to kā dūmu detektoru

Iestatiet konservatīvus sliekšņus. Izturieties pret “Visticamāk AI” kā pret pārskatīšanas karogu — nevis notiesāšanu.

Pieprasiet apstiprinājumu. Divi detektori piekrīt, plus neatbilstības melnrakstos, plus trūkstoši avoti? Tagad jums ir lieta.

Kalibrējiet savā korpusā. Ievietojiet detektorā īstus cilvēku paraugus no savas komandas vai klases, lai redzētu, cik bieži tas nepatiesi atzīmē jūsu cilvēkus.

Izvairieties no sīkiem paraugiem. Zem 150–200 vārdiem rezultāti kļūst nestabili. Lūdziet garākus fragmentus vai papildu piezīmes.

Informējiet cilvēkus. Cilvēkam, kurš pārskata brīdinājumu, jāizprot rīka ierobežojumi un aizspriedumi.

Vai AI ūdenszīme var palīdzēt? Varbūt — ja tā patiešām tiek piegādāta

Ir paralēls darbs, ko sauc par ūdenszīmi: AI sistēmas iegulda slēptus statistiskus modeļus savos izvades datos, lai tos varētu identificēt vēlāk. Teorētiski tas ir uzticamāk nekā minēt pēc fakta. Praksē jums būtu nepieciešama sadarbība starp AI modeļiem, un zīmes var tikt zaudētas, rediģējot, tulkojot vai pat ekrānuzņēmumos.

Tas ir daudzsološs virziens platformām, kas kontrolē abus caurules galus. Pārējiem no mums tas vēl nav šeit konsekventā, universālā veidā. Neaizturiet elpu, vērtējot finālus.

Vārds par godīgumu, bailēm un nākotni

GPT detektoru parādīšanās ir pārvērtusi rakstīšanu par lidostas drošību: visi novelk apavus, pat mazuļi. Tas nav ilgtspējīgi. Mums ir vajadzīgi rīki, kas atbalsta mācīšanos un godīgumu, nepārvēršot klases un darba vietas aizdomu rūpnīcās.

Tas nozīmē pāreju no “Vai jūs izmantojāt AI?” uz “Kā jūs izmantojāt AI?” Mācieties caurspīdīgi iekļaut AI — ideju ģenerēšanu, izklāstu veidošanu, melnrakstu veidošanu, pārskatīšanu — ar skaidriem noteikumiem par citēšanu un oriģinalitāti. Tas ir kalkulatora debates vēlreiz, bet ar teikumiem, nevis sinusa viļņiem.

Kur Sider.AI iederas (un kur ne)

Šeit ir pārsteigums: Sider.AI patiesībā var palīdzēt jums veikt tādu godīgu testu, kādu es izklāstīju iepriekš. Ielīmējiet savus paraugus, izsekojiet savas melnrakstu versijas un salīdziniet labojumus blakus. Tā nav tiesas zāle; tā ir darbnīca. Ja jūs mēģināt izmantot kādu AI rīku kā pakāršanas tiesnesi, tad — veiksmi. Izmantojiet to kā pavadoni procesam un pierādījumiem, un jūs esat uz stingrāka pamata.

Jūsu ātrās palaišanas komplekts: veidnes, kuras varat kopēt šodien

Noteikšanas žurnāla veidne:

Parauga ID:

Avota etiķete (paslēpta līdz vērtēšanai):

Detektora 1 rezultāts/etiķete:

Detektora 2 rezultāts/etiķete:

Detektora 3 rezultāts/etiķete:

Piezīmes par funkcijām (sīkumiem, avotiem, personisku informāciju):

Spriedums: Pārskatīt / Pieņemt / Izmeklēt

Politikas fragments mācību programmām vai darba sludinājumiem:

“Mēs varam izmantot AI detektorus kā vienu ievadi starp vairākām. Paši rezultāti nekad netiks izmantoti, lai piešķirtu sodus. Ja tiks atzīmēts, jums var lūgt kopīgot melnrakstus, avotus vai apspriest savu procesu. Mēs augstu vērtējam mācīšanos un oriģinalitāti, nevis perfektu pulēšanu.”

Sarunu aicinājumi, ja neesat pārliecināts:

“Izstāstiet man, kā jūs izdomājāt trešo rindkopu.”

“Parādiet man agrāku melnrakstu vai savu izklāstu — kas mainījās?”

“Ko jūs pievienotu, ja jums būtu vēl 10 minūtes?”

Problēmu novēršanas stūrītis: biežas detektora galvassāpes

Rīks saka, ka viss ir AI. Kas tagad?

Kalibrējiet ar zināmu cilvēka paraugu, ko uzrakstījāt pirms gadiem. Ja tas joprojām kliedz “AI”, slieksnis ir pārāk agresīvs — vai arī rīkam ir diena.

Mans oriģinālais darbs tika atzīmēts. Kā man to aizstāvēt?

Iesniedziet melnrakstus, laika zīmogus, pētniecības piezīmes un avotus. Norādiet uz konkrētu personisku informāciju. Piedāvājiet apspriest savu procesu. Saglabājiet toni mierīgu un faktuālu.

AI teksts pēc pārfrāzēšanas joprojām tiek atzīts par cilvēku.

Detektori nav veidoti tā, lai izturētu smagu nomaskēšanu. Mainiet savu pieeju: meklējiet trūkstošus avotus, seklu analīzi vai pretrunīgus faktus.

Organizācija vēlas stingru slieksni, piemēram, “80% AI = nulle kredītu.”

Atspiedieties. Kopīgojiet nepatiesu pozitīvu rādītājus no saviem testiem. Ierosiniet “pārskatīšanas rindu” automātisku sodu vietā.

Ātra zinātniska daļa (bez laboratorijas brillēm)

Lielākā daļa detektoru paļaujas uz tādiem mēriem kā apjukums (cik “pārsteigts” valodu modelis ir par nākamo vārdu) un sprādzienveidīgums (teikumu garumu un struktūru variācijas). AI bieži rada zema apjukuma, zema sprādzienveidīguma tekstu — vienmērīgu un gludu. Cilvēku rakstīšana ir smailīgāka.

Bet, AI uzlabojoties un cilvēkiem pieņemot AI draudzīgus rīkus (sveiki, gramatikas pārbaudītāji), sadalījumi pārklājas. Tāpēc mūsdienu detektori nevar solīt noteiktību, tikai varbūtību. Kas ir labi — ja vien jūs nemēģināt izmantot varbūtību kā pierādījumu.

Tātad… vai GPT detektori ir precīzi?

Precīzi ko? Vai tas dod jums grūdienu apskatīt tuvāk? Bieži vien jā. Vai tie paši pieņem lēmumus par HR vai akadēmiskiem jautājumiem? Ne uzticami. Kontrolētos testos jūs atradīsiet:

Viņi diezgan labi noķer acīmredzamu, nerediģētu AI.

Viņiem ir grūtības ar īsu tekstu, labi rediģētu AI un pulētu cilvēku prozu.

Tie var būt tendenciozi pret ESL rakstniekiem un formulas žanriem.

Izturieties pret tiem kā pret pareizrakstības pārbaudi aizdomām. Noderīgi, bet ne svēti.

Nobeiguma vārdi: jūsu godīgas spēles lauka rokasgrāmata

Izmantojiet detektorus kā agrīnās brīdināšanas sistēmu, nevis āmuru.

Apstipriniet ar melnrakstiem, avotiem un ātru sarunu.

Kalibrējiet savus datus; dokumentējiet nepatiesus pozitīvus un negatīvus.

Izvairieties no lēmumiem par īsiem fragmentiem un atsevišķiem rezultātiem.

Māciet atbildīgu AI izmantošanu. Jautājiet “kā”, nevis tikai “vai.”

Pēdējais: Tehnoloģija neatceļ uzticību; tā to pārveido. Labākais veids, kā saglabāt cilvēku rakstīšanu cilvēcisku, ir apbalvot tās daļas, ko var darīt tikai cilvēki — ziņkāri, specifiku, balsi — un izveidot sistēmas, kas atpazīst īstas domas netīros, krāšņos pirkstu nospiedumus.

Ja jūsu detektors nevar atšķirt sirsnīgu eseju no anekdotes par banānu kostīmu, iespējams, ir pienācis laiks atgriezt cilvēkus apritē.

BUJ

Q1:Vai GPT detektori ir pietiekami precīzi, lai uzticami noķertu AI rakstīšanu? Tie ir diezgan labi atzīmējot nerediģētu AI tekstu, bet tie kļūdās ar īsiem fragmentiem, pārfrāzētu AI un pulētu cilvēku rakstīšanu. Izmantojiet tos kā grūdienu pārskatīšanai, nevis galīgo spriedumu.

Q2:Kā es pats varu pārbaudīt GPT detektora precizitāti? Veiciet nelielu pētījumu ar četriem spaiņiem: tīrs cilvēks, tīrs AI, cilvēka rediģēts AI un nomaskēts AI. Izmēriet precizitāti un atsaukšanu, un atzīmējiet nepatiesus pozitīvus uz saviem īstajiem paraugiem.

Q3:Kāpēc mana oriģinālā eseja tika atzīmēta kā AI? Tīra, konsekventa proza var izskatīties “pārāk gluda”, un ESL modeļi dažreiz tiek nepareizi interpretēti kā AI artefakti. Aizstāviet savu darbu ar melnrakstiem, laika zīmogiem, avotiem un ātru sarunu par savu procesu.

Q4:Vai es varu panākt, lai AI teksts izietu kā cilvēka teksts ar dažiem pielāgojumiem? Bieži vien jā. Pārfrāzēšana, personiskas informācijas pievienošana un teikumu ritma dažādošana var apmānīt detektorus. Tāpēc tikai rezultātus nevajadzētu izmantot, lai sodītu vai noraidītu darbu.

Q5:Kāda ir godīga politika GPT detektoru izmantošanai klasē vai pieņemšanā darbā? Publicējiet, ka detektori ir viens datu punkts starp vairākiem, nekad vienīgais pamats sodiem. Pieprasiet apstiprinājumu, atļaujiet pārsūdzības ar melnrakstu pierādījumiem un piešķiriet prioritāti saturam pār stilu.