Ar kada nors norėjote, kad dirbtinis intelektas parodytų savo darbą – kaip prašė jūsų matematikos mokytojas 7 klasėje?
Kartą paprašiau pokalbių roboto suplanuoti šeimos kelionę į Jeloustouną. Jis pateikė nuostabų penkių dienų maršrutą, išskyrus tai, kad 3 dieną reikėjo vairuoti 11 valandų, kirsti trijų valstijų sienas ir kažkaip teleportuotis per bizonų bandą. Kai paklausiau, kaip jis sugalvojo tokį planą, jis gūžtelėjo pečiais. (Gerai, jis negūžtelėjo pečiais; jis haliucinavo su pasitikėjimu.)
Tai yra pagrindinė daugelio DI „argumentavimo“ problema: dažnai jaučiasi kaip stebint iliuzionistą. Jūs matote klestėjimą pabaigoje, bet net neįsivaizduojate, kas įvyko po stalu. Būtent todėl atvirojo kodo bendruomenė susidomėjo nauju vaikinu argumentavimo srityje: . Jis žada skaidrų, žingsnis po žingsnio mąstymą, griežtesnę minčių grandinės kontrolę ir geresnį realybės laikymąsi – neužrakindamas jūsų į patentuotą juodąją dėžę. Šiandien mes išnagrinėsime, kodėl sulaukia dėmesio, ką iš tikrųjų reiškia „atvirojo kodo argumentavimas“ ir kaip jį išbandyti realioje aplinkoje neaukojant savo savaitgalio ar proto.
Taip, aš jums parodysiu, kur spindi, kur jis klysta ir kaip su juo dirbti kaip profesionalui. Ir taip, aš neleisiu Jeloustouno kelionėms trukti ilgiau nei aštuonias valandas.
Kas yra – ir kodėl jums turėtų rūpėti?
Įsivaizduokite, kad mokote draugą gaminti jūsų močiutės lazaniją. Jūs tiesiog nepaduotumėte jam lėkštės ir nepasakytumėte: „Štai. Tai skanu.“ Jūs paaiškintumėte visus sluoksnius: padažas, makaronai, rikotos sūris, pakartoti, kepti, girtis. Būtent tai siekia padaryti DI: jis tiesiog neišspjauna atsakymų; jis parodo argumentavimo sluoksnius, kuriuos naudojo, kad ten patektų. DI terminais tai yra aiški „minčių grandinė“ arba „įrankiais papildytas argumentavimas“.
yra platesnės atvirojo kodo argumentavimo sistemų bangos dalis, kuri koordinuoja mažesnius, specializuotus žingsnius – planavimą, paiešką, įrankių naudojimą ir patikrinimą – į patikimesnę visumą. Pagalvokite apie tai kaip apie orkestro dirigentą savo DI užduotims: smuikas (planavimas) nebando būti trimitu (skaičiavimas), o mušamieji (paieška) žino, kada nustoti daužyti ir leisti kalbėti pučiamiesiems (projektavimas).
Kodėl tai svarbu? Nes patikimas argumentavimas yra skirtumas tarp:
- „Štai nugludintas atsakymas su trimis subtiliomis klaidomis“ ir
- „Štai patikimas sprendimas, plius būtent tai, kaip aš ten patekau“.
„“ nėra tik įsimintinas pavadinimas; atvirojo kodo pasaulyje jis aptariamas kaip naujas standartas atvirojo kodo argumentavime, nes jis orientuojasi į tris dalykus, kurie iš tikrųjų rūpi daugumai kūrėjų ir kasdienių vartotojų:
- Skaidrumas: galite patikrinti ir pritaikyti žingsnius.
- Kontrolė: galite nuspręsti, kada planuoti, kada ieškoti ir kada dar kartą patikrinti.
- Komponuojamumas: galite maišyti ir derinti įrankius (naršykles, skaičiuotuvus, vektorių paiešką) neapjungdami viso paketo lipnia juosta.
Kodėl jaučiasi kitaip: parodyk savo darbą faktorius
Senais laikais mokytojai norėjo, kad ilgas dalijimas būtų užrašytas, nes tai padarė klaidas akivaizdžiomis. taiko tą pačią idėją DI. Vietoj vieno didelio, paslaptingo šuolio, jis suskaido problemas į dalis ir leidžia jums pažvelgti į tarpinius žingsnius. Praktiškai tai reiškia, kad galite:
- Pamatyti, kaip modelis suplanavo užduotį.
- Patikrinti, kokius šaltinius jis nusprendė gauti.
- Peržiūrėti, kaip jis pats save patikrino (arba ne – bet kuriuo atveju naudinga!).
Tai nėra tik akademinis parodymas ir papasakojimas. Kai jūsų DI rašo kodą, kuris nesikompiliuoja, arba rekomenduoja finansinę strategiją, kuri atrodo... optimistiška, tie tarpiniai žingsniai yra grynas auksas. Jie suteikia jums kažką, ką galima derinti.
Atvirojo kodo aspektas: kodėl tai ne tik malonu, bet ir būtina
Jei kada nors bandėte priversti patentuotą modelį paaiškinti save, jūs žinote, kas tai yra. Jūs gaunate „Mes vertiname skaidrumą“ tinklaraščio įrašą ir nustatymų jungiklį, pavadintą „argumentavimo režimu“. Tačiau jei norite pakeisti, kaip jis argumentuoja – tarkime, pridėkite patikrinimo žingsnį arba priverskite atlikti paiešką internete prieš jam pareiškiant nuomonę – sėkmės.
Atvirojo kodo argumentavimo sistemos, tokios kaip , apverčia tą galios dinamiką. Jūs galite:
- Atsišakoti saugyklą, patobulinti planuotoją ir įtraukti patikrinimo žingsnį prieš galutinius atsakymus.
- Pakeisti savo mėgstamą paieškos API arba vietinį paieškos indeksą.
- Apriboti sistemą taisyklėmis, tokiomis kaip „niekada neatlikti matematikos be skaičiuotuvo įrankio“ (mano asmeninis moto).
Būtent todėl komandos, kurios kuria saugai kritines arba atitikties reikalavimus atitinkančias darbo eigas, atidžiai stebi . Tai ne tik „nemokama“. Tai reguliuojama. Tai patikrinama. Tai jūsų.
Kaip iš tikrųjų veikia (be daktaro laipsnio)
Tarkime, jūs klausiate: „Palyginkite tris debesų saugyklos paslaugų teikėjus 10 žmonių startuoliui ir rekomenduokite geriausią pagal kainą ir saugumą.“ paprastai vykdo tokį žaidimo planą:
- Suskirstykite ją į potaskius: išvardykite tiekėjus, surinkite kainas, išanalizuokite saugumo funkcijas, įvertinkite kompromisus.
- Sugeneruokite kontrolinį sąrašą: reikalingi šaltiniai, skaičiavimai, kuriuos reikia atlikti, raudonos vėliavos, į kurias reikia atkreipti dėmesį.
- Užklauskite internetą dėl planų, apribojimų ir gudrybių.
- Įtraukite dokumentus į vietinį indeksą, kad jis nuolat neieškotų „Google“ kaip išsiblaškęs auksaspalvis retriveris.
- Parašykite preliminarią analizę.
- Atlikite patikrinimo žingsnį: patikrinkite skaičius, nustatykite neryškius žodžius („pramonėje pirmaujantis“) ir pažymėkite neaiškumus.
- Pateikite rekomendaciją su šaltiniais, matematika ir prielaidomis, kad žmogus galėtų patvirtinti arba grąžinti ją į klasę.
Tai yra skirtumas: jis bando padaryti apgalvotą argumentavimą numatytuoju, o ne antriniu dalyku.
Praktinė demonstracija: šaltas el. laiškas, kuris nesugedo ir nesudegė
Tikras pavyzdys. Aš paprašiau argumentavimo sistemos, naudojančios stiliaus darbo eigą: „Parašykite šaltą el. laišką vidutinio dydžio gamintojui apie perėjimą prie LED sandėlio apšvietimo. Laikykitės 120 žodžių, pacituokite naujausią statistiką ir įtraukite dviejų sakinių atvejo analizę.“
Štai kas nutiko po gaubtu:
- Planas: nustatykite tikslinį vaidmenį (objektų tvarkytojas), apibrėžkite vertės pasiūlymus (energijos taupymas, priežiūra), raskite statistiką (DOE arba komunalinių paslaugų duomenys) ir raskite atitinkamą atvejo analizę.
- Paieška: jis ieškojo patikimos energijos taupymo statistikos ir atvejo analizių, teikdamas pirmenybę vyriausybės šaltiniams.
- Juodraštis: jis parašė versiją, kuri parodė 50–70 % sutaupymą, bet pažymėjo, kad šis diapazonas priklauso nuo konteksto.
- Patikrinimas: jis patikrino statistiką su antruoju šaltiniu ir sugriežtino teiginį iki konkretaus diapazono su citata.
Rezultatas buvo ne tik įtikinamas; jis buvo tinkamas auditui. Jei vadovas paklausė: „Iš kur tai gavote?“, atsakymas nebuvo „Ahm... nuotaikos?“. Jame buvo įtrauktos nuorodos ir pastabos.
Kodėl komandos džiaugiasi: mažiau veido kritimų, greitesnės iteracijos
Jokia sistema nėra tobula, bet darbo eiga gali sumažinti tris dažnas klaidas:
- Priešlaikinis tikrumas: priversti ieškoti internete arba naudoti įrankius prieš darant išvadas.
- Tylios matematikos klaidos: aritmetikos nukreipimas į skaičiuotuvo įskiepį.
- Šaltinio dreifas: teiginių susiejimas su citatomis, kurias modelis iš tikrųjų perskaitė (radikali koncepcija, žinau).
Užimtoms komandoms grynasis rezultatas yra mažiau gėdingų pataisymų vėliau. Ir jei kažkas vis tiek pasisuka ne ta linkme, turite duonos trupinių taką.
Kompromisai: ko negali ištaisyti (dar)
Prieš atiduodant jam automobilio raktelius, reikia patikrinti tikrovę:
- Daugiau žingsnių gali reikšti didesnį vėlavimą. Planavimas, paieška, patikrinimas – visa tai užtrunka.
- Skaidrumas gali įvilioti mus į pernelyg didelį pasitikėjimą. Vien tai, kad žingsniai yra matomi, nereiškia, kad žingsniai yra teisingi.
- Įrankių kokybė yra svarbi. Puikus planas, maitinantis netikrą paieškos API, yra tarsi „Michelin“ šefas, gaminantis su sugedusiu skrudintuvu.
Vertimas: yra stiprus numatytasis atvirojo kodo argumentavimo sprendimas, o ne stebuklinga lazdelė. Atsineškite savo žmogiškąjį vertinimą – ir įkrovimo laidą.
Nustatymas: kaip išbandyti neįklimpus į pelkę
Jei kada nors bandėte rankiniu būdu sujungti agentus, įrankius ir paiešką, žinote, kaip greitai tai virsta siūlų ir smeigtukų siena. Štai paprastas būdas išbandyti stiliaus sąranką neišradinėjant elektros:
- Pradėkite nuo pirmumo argumentavimui šablono
- Naudokite starterį, kuris apima planavimą, įrankių nukreipimą ir patikrinimo žingsnius. Ieškokite konfigūracijų, kurios leidžia perjungti „visada ieškoti pirmiausia“ ir „reikalauti skaičiuotuvo skaičiams“.
- Paieška internete: pasirinkite tokį, kuris grąžina švarius metaduomenis. Jums reikės pavadinimų, datų ir autorių citatoms.
- Skaičiuotuvas: net paprastas matematikos įrankis yra vertas savo svorio aukso žvaigždėmis.
- Paieška: indeksuokite savo PDF, wiki ir „Slack“ eksportus, kad modelis galėtų žvejoti iš jūsų tvenkinio.
- Pridėkite apsaugos priemones
- Apibrėžkite raudonos vėliavos frazes („kaip visi žino“) ir reikalaukite šaltinio arba perrašykite.
- Apribokite argumentavimo žingsnių skaičių užduotims, kurios yra jautrios vėlavimui.
- Išsaugokite planą, tarpines mintis, iškviestus įrankius ir galutinę išvestį. Kai kažkas negerai – o taip bus – džiaugsitės, kad tai padarėte.
Kaip įvertinti : paprastas, sąžiningas bandomasis važiavimas
Štai mano standartinis testų rinkinys bet kuriai argumentavimo sistemai, teigiančiai, kad ji yra „naujas standartas“ atvirojo kodo argumentavime:
- Paieškos patikrinimas: „Išvardykite tris faktus iš šio PDF ir pacituokite puslapių numerius.“ Jei jis sugalvoja puslapių numerius, turite problemą.
- Matematika su posūkiu: „Apskaičiuokite šį ROI su diskonto norma ir pateikite formulę, kurią naudojote.“ Neteisinga matematika ar trūkstamos formulės? Atgal į dirbtuves.
- Įrankių atitiktis: „Niekada neatsakykite neieškoję. Apibendrinkite tris naujausius šaltinius ir paaiškinkite nesutarimus.“ Jis turėtų laikytis jūsų taisyklės.
- Neapibrėžtumo testas: „Suplanuokite realistišką 2 dienų maršrutą mieste, kurį pavadinsiu vėliau.“ Jis turėtų paklausti apie miestą, o ne jį sugalvoti. (Žiūriu į tave, Jeloustouno teleportuotojau.)
Įvertinkite rezultatus pagal tikslumą, citatas ir taisyklių laikymąsi. Jei nuolat pasiekia aukštus įvertinimus, ta „naujo standarto“ etiketė pradeda jaustis mažiau kaip reklama.
prieš įprastus įtariamuosius: kas iš tikrųjų skiriasi?
- Juodosios dėžės asistentai: greitas, glotnus, bet sunkiai derinamas. Puiku, kol nereikia pakeisti jų mąstymo būdo.
- „Pasidaryk pats“ agentų scenarijai: maksimali laisvė, maksimali lipni juosta. Jūs esate mechanikas ir pagalba kelyje.
- stiliaus sistemos: nuomonę formuojantys numatytieji nustatymai planavimui, įrankių naudojimui ir patikrinimui; keičiamos dalys; skaidrūs žurnalai.
Kitaip tariant, bando nuvesti jus 80 % kelio – struktūruotas, patikrinamas argumentavimas – neversdamas jūsų tapti visą darbo dieną dirbančiu orkestro dirigentu.
Realaus pasaulio žaidimo planas: penkios užduotys, kurias gerai atlieka
- Tyrimų santraukos su citatomis
- Kai prašote „šaltinių iš pastarųjų 12 mėnesių“, jis suplanuoja paiešką, reitinguoja šviežumą ir paaiškina juodraštį.
- Duomenų apie turinį generavimas
- Jis kuria aplink citatas ar lenteles, kurias jam pateikiate, o ne haliucinuoja citatas iš lordo Bairono (tikra istorija).
- Klientų aptarnavimo triažas
- Jis užduoda patikslinančius klausimus, konsultuojasi su vidaus dokumentais ir siūlo pataisymus su nuorodomis į tikslius puslapius.
- Kodavimas su apsaugos priemonėmis
- Jis sukuria sprendimą, paleidžia testus ir paaiškina nesėkmes, o ne tyliai spėlioja.
- Jis išvardija prielaidas ir pasitikėjimo lygius. Spoileris: pasitikėjimo lygiai yra ten, kur dauguma DI tampa drovūs. paverčia juos išvesties dalimi.
Kur guma susiduria su keliu: našumo patarimai
- Būkite aiškūs dėl taisyklių. „Visada pacituokite datą; teikite pirmenybę pirminiams šaltiniams“ geriau nei „Prašome būti tikslūs“.
- Atskirkite planavimą nuo projektavimo. Pirmiausia paprašykite plano; patvirtinkite jį; tada leiskite jam rašyti. Dvi minutės priekyje sutaupo dvidešimt vėliau.
- Apdovanokite patikrinimą. „Paryškinkite bet kokį teiginį, kurio negalėjote patvirtinti“ apmoko sistemą iškelti neaiškumą į paviršių, o ne jį slėpti po kilimu.
- Laikykitės įrankių biudžeto. Apribokite žiniatinklio skambučius ir argumentavimo ciklus užduotims, kurioms reikia greičio. Naudokite gilesnį žingsnį didelio masto užduotims.
Trikčių šalinimo šoninė juosta: kai ratai kliba
- Simptomas: Puikus rašymas, netvirti faktai.
Pataisymas: Priverskite atlikti paiešką internete prieš bet kokį teiginį viršijant ribą („procentas“, „milijardas“, „FDA“).
- Simptomas: Lėtas kaip melasa.
Pataisymas: Sumažinkite patikrinimo žingsnius; talpinkite paieškos rezultatus; apribokite paieškos blokus.
- Simptomas: Pasitikėdamas klaidinga matematika.
Pataisymas: Nukreipkite bet kokią išraišką su +, −, ×, ÷, % arba ^ į skaičiuotuvo įrankį. Jokių išimčių.
- Simptomas: Neaiškūs šaltiniai („pramonės ataskaitos“).
Pataisymas: Reikalaukite pavadinimo, autoriaus, datos ir URL kiekvienai citatai.
Kaip Sider.AI įsilieja į šią istoriją
Štai staigmena: Sider.AI gerai dera su argumentavimu pagrįstomis darbo eigos. Mano bandymuose jis yra patogus kaip lengvas prievadas stiliaus paketui: galite pakartotinai raginti, palikti planą matomą ir pastūmėti sistemą link geresnių citatų su keliais gerai išdėstytais nurodymais. Jis nepataisys sugedusio paieškos API, bet jei jūsų tikslas yra vadovauti modeliui žingsnis po žingsnio – planuoti, ieškoti, patikrinti, rašyti – Sider.AI suteikia jums prieinamą kabiną be piloto licencijos. Profesionalo patarimas: Sider.AI pradėkite nuo „Suplanuokite savo požiūrį sunumeruotais žingsniais, tada užduokite patikslinančius klausimus, tada pacituokite.“ Pamatysite, kaip argumentavimo kelias formuojasi labai panašiai į . Saugumas ir privatumas: atvirojo kodo pranašumas
Kai galite perskaityti kodą, kuris nusprendžia, kaip jūsų modelis mąsto – ką jis registruoja, kuriuos įrankius jis iškviečia, kaip jis apvalo URL – galite iš tikrųjų įgyvendinti savo įmonės politiką. Tai yra didelė priežastis, kodėl apie kalbama kaip apie naują standartą atvirojo kodo argumentavime: galite jį paleisti vietoje, atskirti nuo interneto ir vis tiek gauti struktūruotą planavimą ir patikrinimą pagal savo dokumentus. Reguliuojamose pramonės šakose tai nėra malonus dalykas; tai yra įėjimo kaina.
Lakmuso testas: ar jis gali pasakyti „Aš nežinau“?
Mano mėgstamiausia bet kurios argumentavimo sistemos funkcija yra intelektualus sąžiningumas. Jei gali pažiūrėti jums į akis ir pasakyti: „Nerasta naujausių šaltinių; štai ką galiu patikrinti, ir štai ko trūksta“, jūs turite gerą darbuotoją. Jei, kita vertus, jis užtikrintai sugalvoja citatą iš Abrahamo Lincolno apie debesų saugumą, lėtai atsitraukite ir uždarykite naršyklę.
Greita, praktinė sąranka, kurią galite nukopijuoti šiandien
Išbandykite šią trijų pranešimų choreografiją stiliaus sesijai Sider.AI arba savo mėgstamoje sąsajoje: - Jūs: „Prieš atsakydami, parengkite sunumeruotą planą. Nustatykite reikalingus įrankius (paieška internete, skaičiuotuvas, paieška). Užduokite patikslinančius klausimus.“
- Jūs (po jo plano): „Tęskite. Pacituokite šaltinius su pavadinimu, autoriumi, data ir URL. Naudokite skaičiuotuvą bet kokiems skaičiams.“
- Jūs (juodraštyje): „Atlikite patikrinimo žingsnį. Paryškinkite neaiškius teiginius [skliaustuose] ir pasiūlykite, kaip juos patikrinti.“
Nuostabu, kiek toli tos apsaugos priemonės eina.
Platesnis vaizdas: kodėl „naujas standartas“ nėra tik reklama
„Standartas“ skamba nuobodžiai – kaip saugos diržai. Ir vis dėlto niekas neliūdi dėl dramos prieš saugos diržų erą. Argumentavimo standartas atvirojo kodo DI reiškia, kad mes kolektyviai susitariame dėl kelių gerų įpročių: planuoti pirmiausia, ieškoti antra, visada patikrinti, pacituoti šaltinius, pripažinti neaiškumą. supakuoja tuos įpročius į numatytuosius nustatymus, kuriuos galite iš tikrųjų naudoti.
Jei bendruomenė susiburs aplink tuos numatytuosius nustatymus – ir ankstyvieji naudotojai toliau stums našumą, registravimą ir saugą – mes atsigręšime į vienkartinę, gūžtelėk ir tikėkis DI erą su tokiu pačiu sumišusiu nostalgija, kurią skiriame modemams ir AOL CD.
Apibendrinimas: ką reikia atsiminti prieš paspaudžiant „Paleisti“
- pabrėžia planavimą, įrankių naudojimą, patikrinimą ir skaidrumą. Būtent todėl žmonės vadina jį nauju standartu atvirojo kodo argumentavime.
- Tai nėra magija; tai metodas. Daugiau žingsnių, geresnis auditas, mažiau staigmenų.
- Galite jį pritaikyti: pakeisti įrankius, nustatyti taisykles, tvarkyti žurnalus. Tai yra atvirojo kodo pranašumas.
- Kasdieniam darbui – tyrimams, kodavimui, palaikymui, sprendimų atmintinėms – jis reikšmingai sumažina veido kritimus.
- Pateikite jam aiškias taisykles, stebėkite vėlavimą ir apdovanokite sąžiningumą. Protingiausios sistemos yra tos, kurios žino, kada pasakyti: „Aš nesu tikras – dar ne“.
Vienas paskutinis dalykas: jei jūsų DI vis dar tvirtina, kad galite nuvažiuoti iš Jeloustouno į Josemitą per popietę, pabandykite pridėti šią taisyklę – „Niekada nesiūlykite plano nepatikrinę žemėlapio.“ Tinka kelionėms. Tinka argumentavimui.
DUK
1 klausimas: kas daro nauju standartu atvirojo kodo argumentavime?
įtraukia planavimą, įrankių naudojimą, patikrinimą ir citatas kaip numatytuosius nustatymus, o ne antrinius dalykus. Tas skaidrumas ir kontrolė daro atvirojo kodo argumentavimą patikimesnį ir lengviau audituojamą realiose projektuose.
2 klausimas: kaip sumažina DI haliucinacijas?
Jis priverčia parengti planą, gauna tikrus šaltinius ir atlieka patikrinimo žingsnius prieš galutinius atsakymus. Parodydamas minčių grandinės žingsnius ir susiedamas teiginius su citatomis, paverčia spėliojimą patikrinamu argumentavimu.
3 klausimas: ar „K2 Think“ veikia lėčiau nei įprasti pokalbių robotai?
Kartais, taip – mąstymas garsiai užtrunka. Galite apriboti veiksmų skaičių, talpyklos paieškas ir naudoti skaičiuotuvo įrankį, kad išlaikytumėte priimtiną delsą, tuo pačiu išsaugodami atvirojo kodo pagrįstumo pranašumus.
4 klausimas: ar galiu integruoti „K2 Think“ su savo esamais įrankiais?
Tai yra atvirojo kodo pagrįstumo privalumas: įdiekite savo paieškos API, skaičiuotuvą ir dokumentų gavimo funkciją. „K2 Think“ modulinė konstrukcija leidžia pritaikyti darbo eigą be {duct-taping} savo rietuvės.
5 klausimas: kur Sider.AI padeda vykdant „K2 Think“ darbo eigas?
Sider.AI suteikia jums aiškų valdymo skydelį, kuris padeda planuoti, cituoti ir tikrinti žingsnis po žingsnio. Jis neištaisys blogų duomenų šaltinių, tačiau leidžia lengvai valdyti „K2 Think“ stiliaus argumentaciją kasdienėse užduotyse.