Uvod: Ko vaš brskalnik postane preveč vmešljiv
Se vam kdaj zgodi, da vsako jutro ponavljate istih pet klikov – odprete nadzorno ploščo prodaje, izvozite CSV datoteko, jo prilepite v preglednico, pošljete e-pošto šefu – in si mislite: »Se mi računalniki zagotovo smejijo«? Meni tudi. Obljubljajo nam avtomatizacijo že tako dolgo, da »nastavi in pozabi« zveni kot tehnološki ekvivalent oglasu za dieto.
Vstopite v Agent Mode v <a0>ChatGPT
Atlas – funkcijo, ki trdi, da lahko dejansko opravi vaša spletna opravila namesto vas, kot vljuden robotski pomočnik, ki živi v vašem brskalniku. Ni znanstvenofantastična fantazija; resničen, rahlo čaroben, včasih muhast pomočnik, ki lahko izpolnjuje obrazce, strga strani, navzkrižno preverja podatke in celo ponavlja naloge, medtem ko vi srkate kavo in se pretvarjate, da trdo delate na »strategiji«.</a0>V tem priročniku vas bom vodil skozi uporabo Agent Mode v <a0>ChatGPT
Atlas za avtomatizacijo vaših spletnih nalog – skupaj s tem, v čem je odličen, kje se spotika in majhnimi rituali, ki jih boste želeli sprejeti, da bodo zobniki delovali. Mislite na to kot na vašo šolo vožnje za zelo pametnega šoferja.</a0>Kaj Agent Mode v <a0>ChatGPT
Atlas v resnici je?</a0>Agent Mode je s brskalnikom povezana funkcija v <a0>ChatGPT
Atlas, ki lahko sprejme visokonivojska navodila – »prijavite se na moje spletno mesto za analitiko, pridobite tedenski promet in objavite poudarke v Slacku« – in jih spremeni v verigo dejanj: navigacija, klik, tipkanje, strganje, shranjevanje in ponavljanje. Namesto, da vi klikate po spletnih mestih kot laboratorijska podgana, ki pritiska ročico za pelete, Agent Mode postane tisti, ki pritiska ročico.</a0>- Lahko bere strani, klika gumbe, izpolnjuje obrazce, sledi strani in izvaža datoteke.
- Lahko si zapomni korake (znotraj seje ali shranjenega poteka dela) in jih izvaja po urniku.
- Lahko prenaša podatke iz enega koraka v drugega – kot kopiranje/lepljenje, vendar brez obremenitve zapestja.
Če ste kdaj poskusili posneti makro ali napisati skript Selenium in si mislili: »Nisem se prijavil za to raven nerdovstva,« je Agent Mode bratranec brez kode, ki se dejansko pojavi na dan selitve.
Kdo bi moral uporabljati Agent Mode (in kdo ne)
- Vi: Ponavljajoče se spletne naloge, jasni vzorci, preproste odločitvene veje.
- Tudi vi: Rahlo strganje podatkov za poročila; oddaja obrazcev; večstopenjske sekvence.
- Morda vi: Prijavljeni poteki dela, ki se dotikajo lahke avtentikacije.
- Verjetno ne vi (še): Zelo dinamične aplikacije, ki se ponovno izrisujejo vsako milisekundo; spletna mesta, ki agresivno blokirajo avtomatizacijo; karkoli, kar vključuje občutljive poverilnice izven vašega območja udobja.
Da, je močan. Ne, ni čarovnik. Bolj je kot zelo sposoben pripravnik – hiter, navdušen in občasno zmeden zaradi enakih gumbov z imenom »Pošlji«.
Pregled goljufivega lista ()
- Vklopite Agent Mode v <a0>ChatGPT
Atlas.</a0>- Opišite svoj cilj v preprosti angleščini.
- Izvedite nadzorovano izvajanje: opazujte, popravljajte in označite korake.
- Shranite potek dela s spremenljivkami za ponovno uporabo.
- Načrtujte ga ali pritisnite Zaženi, ko je potrebno.
- Dodajte varovala: časovne omejitve, pravila za ponovni poskus in nadomestne rešitve.
- Zabeležite vse, kot da so vaši davki.
Če si ne zapomnite ničesar drugega, si zapomnite: nadzirajte prvo izvajanje. To so priprave pred sezono.
Korak za korakom: Kako uporabljati Agent Mode v <a0>ChatGPT
Atlas za avtomatizacijo spletnih nalog</a0>1) Vklopite Agent Mode in povežite svoj brskalnik
Atlas in poiščite Agent Mode (običajno v levi stranski vrstici ali pod Orodja/Avtomatizacija).</a0>- Odobrite potrebna dovoljenja, da lahko vidi in komunicira z vašimi zavihki brskalnika.
- Če vaše naloge vključujejo prijave, se odločite, kako boste ravnali s poverilnicami: vbrizgavanje upravitelja gesel, začasni žetoni ali namenski račun z nizkimi privilegiji, za katerega ne boste jokali, če gre kaj narobe.
Strokovni nasvet: Začnite z neobčutljivim spletnim mestom, da si pridobite samozavest. Nihče ne želi, da bi njihova prva avtomatizacija vključevala plačilno listo.
2) Opišite izid, ne klikov
Agent Mode razume cilje, kot so: »Vsak ponedeljek ob 9. uri se prijavite v Acme Analytics, prenesite CSV datoteko »Tedenski obiskovalci«, jo naložite v Google Drive v mapo »Poročila/2025« in nato objavite povzetek na kanalu #marketing Slack.«
Bistvo je opisati, kaj želite, da se naredi – kot da bi to razlagali prijatelju, ki je pameten, vendar ni videl vašega zaslona. Atlas bo predlagal načrt: Pomaknite se sem, kliknite to, izvlecite to in tako naprej.
Preverite načrt. Če piše »odpri Twitter« in ste zahtevali »PDF-je računov«, zahtevajte prekinitev.
3) Izvedite nadzorovano suho izvajanje
Tukaj se zgodi čarovnija. Atlas začne izvajati korake, medtem ko vi opazujete v predoglednem oknu (ali v vašem brskalniku v živo). Označuje elemente, na katere namerava klikniti, prikazuje izbrane DOM in beleži vsak korak.
- Če napačno prepozna gumb, ga popravite: »Uporabite gumb z oznako 'Izvozi kot CSV' – ne 'Izvozi kot PDF'.«
- Če zamudi korak, ga vstavite: »Po prijavi se pomaknite na 'Poročila > Tedensko' pred izvozom.«
- Če spletno mesto uporablja neskončno drsenje ali strani, ga naučite: »Drsite, da naložite 50 elementov, nato kliknite 'Naprej', dokler ni več naslednje strani.«
Mislite na to, kot da učite najstnika voziti avto. Držite roke blizu volana, opozarjate na znake za ustavljanje in upate, da ni veveric.
4) Označite, poimenujte in parametrizirajte svoje korake
Ko suho izvajanje deluje, se uprite želji, da bi zavpili »Pošlji!« Namesto tega dodajte varovala:
- Korake jasno poimenujte: »Prijava,« »Pomakni se na Tedensko,« »Izvozi CSV,« »Naloži v Drive,« »Objavi v Slack.« Prihodnji Jaz se bo zahvalil Pretekli Jaz.
- Uvedite spremenljivke: {week_start}, {folder_path}, {channel_name}. Zdaj vaš potek dela ni enkraten; je predloga.
- Shranite kopijo z opombami o različici: »v1.2 – obravnava strani in zakasnitev z dvema faktorjema.« Presenečeni boste, kako pogosto opombe premagajo spomin.
5) Naučite ga obvladovati težave iz resničnega sveta
Splet je kaotična juha. Gumbi se premikajo. Spletna mesta vas odjavijo. Pojavno okno vas vpraša, ali želite piškotke (ne tiste zabavne vrste). Dodajte odpornost:
- Časovne omejitve in ponovni poskusi: »Počakajte do 10 sekund na gumb 'Izvozi'; poskusite znova dvakrat, preden eskalirate.«
- Pogojne veje: »Če se prikaže 2FA, začasno ustavite in me obvestite; sicer nadaljujte.«
- CSS/XPath nadomestne rešitve: »Najprej poskusite z aria-label; če to ne uspe, uporabite kombinacijo besedila role/button.«
- Strukturirano izločanje: »Pridobite tabelo, pretvorite v CSV in preverite veljavnost glav stolpcev pred shranjevanjem.«
Atlas je dober, vendar je »dober z odbijači« boljši.
6) Shranite, preizkusite in načrtujte svojo avtomatizacijo
- Shranite potek dela s prijaznim imenom: »Tedenski izvoz spletne analitike.«
- Izvedite drugo izvajanje, nenadzorovano, vendar vi stojite ob strani. Preverite izhodno mapo, velikost datoteke, objavo v Slacku.
- Načrtujte ga: ponedeljki, 9. ura zjutraj. Namerno nastavite časovne pasove – »9. ura zjutraj v New Yorku« pomeni nekaj zelo drugačnega, če Atlas misli, da živite v Reykjaviku.
- Dodajte obvestila o uspehu in neuspehu: e-pošto za uspeh, SMS za napake. In da, sporočila o napakah lahko izgovorijo »Womp womp.«
7) Bodite pozorni na dnevnike (vaš prihodnji jaz vas bo objel)
Atlas beleži vsako dejanje s časovnimi žigi, izbirniki in posnetki zaslona (če jih omogočite). Ko se nekaj pokvari – in se bo, ker spletna mesta – so ti dnevniki vaš črni zabojnik.
- Preglejte delte: »Ta teden se je gumb premaknil v novo pogovorno okno.«
- Posodobite izbirnike ali vrstni red korakov.
- Ponovno zaženite z istimi vhodi. Potrdite, da je popravljeno.
Teh deset minut raziskovanja dnevnika vam lahko prihrani ure kasneje.
Vodnik iz resničnega življenja: Od nadzorne plošče do Drive do Slacka
Izvedimo konkreten scenarij, ki ga lahko prilagodite.
Cilj: Pridobite tedenski promet iz Acme Analytics, ga naložite v Google Drive in objavite povzetek v Slacku.
- Poziv: »Vsak ponedeljek se prijavite v Acme Analytics, odprite 'Poročila > Tedenski promet', izvozite kot CSV, shranite kot 'traffic-{week_start}.csv' v Google Drive v '/Poročila/2025', nato objavite 'Tedenski obiskovalci: X; Najboljši napotitelj: Y' v #marketing.«
- Atlas načrt: Predlaga korake. Vi pregledate.
- Suho izvajanje: Uspešno se prijavi, vendar izbere 'Izvozi kot PDF'. Popravite ga in označite gumb CSV. Dodate pogoj: »Če se odpre modalno okno z izbiro formata, izberite CSV.«
- Izločanje podatkov: Predogled tabele. Glave pridejo kot [Datum, Obiskovalci, Vir]. Povežete ga, da izračuna sum(Obiskovalci) in najvišji Vir.
- Nalaganje: Povežete svoj Drive, odobrite dostop in določite spremenljivko poti do mape.
- Slack: Prilepite webhook ali žeton aplikacije. Oblikujete sporočilo s spremenljivkami.
- Preizkus: CSV pristane v pravi mapi. Sporočilo Slack: »Tedenski obiskovalci: 32.481; Najboljši napotitelj: organski.« Izvedete svoj zmagovalni krog.
Zdaj imate tedenskega robota. Lahko dodate drugega robota za mesečne povzetke in tretjega, ki bo opozoril Garyja iz prodaje, ko bo spet pozabil označiti kampanje. (Žal mi je, Gary.)
Pametni triki, ki prihranijo ure kasneje
- Zabeležite nadomestne izbirnike: Če ima spletno mesto 'Izvozi' in 'Prenesi', zajamite oba s prednostnim vrstnim redom.
- Sidro po besedilu in položaju: »Kliknite gumb desno od 'Tedenski promet'.« Presenetljivo je robusten, ko se razredi spremenijo.
- Uporabite čakanja, ki imajo smisel: »Počakajte, dokler število vrstic v tabeli > 0« premaga »počakajte 4 sekunde.«
- Preverite veljavnost izhodov: Datoteka ni prazna? Imena stolpcev se ujemajo? Število vrstic znotraj pričakovanega obsega? Hitro neuspešno premaga neuspešno pozneje.
- Zgradite majhen podatkovni slovar: Kaj pomeni vsak stolpec, sprejemljivi obsegi, formati datuma. Zahvalili si boste med izpadi.
- Posnemite ključne strani: Ko se izbirniki pokvarijo, vam posnetki zaslona pomagajo popraviti, ne da bi ponovno zagnali celoten potek.
Pogoste pasti (in kako se jim izogniti)
- Skriti elementi: Če Atlas poskuša klikniti, česar ne more videti, se najprej pomaknite v pogled ali preklopite na vidni dvojnik.
- Preveč pameten CSS: Izogibajte se krhkim izbirnikom, kot je »div:nth-child(42)«. Dajte prednost ID-jem, vlogam in besedilu.
- Blokatorji pojavnih oken: Če spletno mesto ustvari prenos v novem zavihku, naj Atlas odpre pojavna okna za to spletno mesto.
- Časovne omejitve seje: Načrtujte prijave v bližini korakov dejanja; naj bodo izvajanja kratka; obravnavajte »odjavljeni ste bili.«
- Proti-robotske stene: Nekatera spletna mesta ne želijo avtomatizacije. Naj bo tempo človeški in etičen. Spoštujte robots.txt in pogoje storitve.
Ravnanje s podatki: Bodite odrasli v sobi
- Poverilnice: Uporabite račune z najmanj privilegiji. Redno obračajte žetone. Ne kodirajte gesel v pozivih.
- Občutljivi podatki: Pri dnevniki jih zamaskirajte. Vklopite redakcijo za polja PII.
- Shranjevanje: Izvoze hranite na varni lokaciji z varnostno kopijo. Šifrirajte, kjer je pomembno.
- Skladnost: Če ste v zdravstvu, financah ali izobraževanju, se pred avtomatizacijo posvetujte z ljudmi z akronimi (HIPAA, SOC 2, FERPA).
Da, varnost dodaja korake. Toda tudi kraja identitete.
Povečevanje obsega: Od enega agenta do majhne ekipe
Ko imate enkrat potek dela Agent Mode, boste želeli več. Izogibajte se skledi špagetov s sprejetjem neke lahke strukture:
- Konvencije o poimenovanju: »Oddelek-Naloga-Pogostost,« kot je »Mktg-TedenskiPromet-Pon0900.«
- Moduli za ponovno uporabo: Ustvarite mini potek dela »Prijava v Acme«, ki ga lahko uvozite drugje.
- Osrednje spremenljivke: Shranite skupne bitove – kanal Slack, korenski imenik Drive – na enem mestu.
- Različice: »v1.4 doda premor z dvema faktorjema.« Hranite dnevnike sprememb v opombah poteka dela.
- Nadzorna plošča zdravja: Ena stran, ki prikazuje zadnje stanje izvajanja, trajanje in naslednji urnik. Tudi preglednica deluje.
Vaša prihodnja celovita platforma za avtomatizacijo je morda domiselna. Vaša prva je lahko urejena in dolgočasna. Dolgočasno je dobro.
Stranske vrstice za odpravljanje težav
- »Klikne napačen gumb.«
Dodajte razločevanje po besedilu, aria-label ali sosednjem elementu. Ali dodajte prejšnji korak: »Odprite meni kebab poleg 'Tedenski promet', nato izberite 'Izvozi CSV'.«
- »Stran se nenehno znova izrisuje.«
Preklopite čakanja na sprožilce, ki temeljijo na dogodkih: »Počakajte, da element z role=progressbar izgine« ali »počakajte, da se XHR '/api/report' konča.«
- »Prenosi so prazni.«
Preverite število vrstic tabele pred izvozom; poskusite znova, če je nič. Nekatera spletna mesta potrebujejo 'Osveži' ali izpolnitev časovnega obdobja, preden se napolnijo.«
- »2FA uniči vse.«
Za visoko varnostna spletna mesta razmislite o nadzorovanem koraku, žetonih, specifičnih za aplikacijo, ali časovno omejenih sejah. Ali pa sprejmite, da nekatere naloge še vedno bolje opravijo življenjske oblike na osnovi ogljika.«
Tukaj je presenečenje: Sider.AI se lepo igra v tem peskovniku. Če vaše življenje poteka znotraj brskalnika – raziskovanje prodajalcev, pridobivanje konkurenčnih informacij, povzemanje dolgih strani – lahko stranska vrstica Sider osnutke pozivov, povzema strani in strukturira strgano vsebino, preden jo predate Agent Mode v <a0>ChatGPT Atlas. Moj najljubši trik: uporabite Sider za ustvarjanje pravil za čisto izločanje (»Poiščite H2 'Cenik', nato zajemite prvo tabelo«) in jih prilepite neposredno kot smernice za korake. Ni popolno, a ko ga usmerite v tisto, za kar je zgrajen – urejanje neurejenih spletnih informacij – se zdi, kot da bi najeli urednika za svojega robota.</a0>Napredne poteze: Razvejanje, zanke in združevanje podatkov
Ko vam bo udobno, si lahko privoščite domišljijo – ne da bi postali popolni programer.
- Veje: »Če je vrsta poročila 'Mesečno', uporabite drugačno časovno obdobje.«
- Zanke: »Za vsako vrstico v tej tabeli odprite podrobnosti, kopirajte ID in dodajte v preglednico.«
- Združevanje: »Navzkrižno preverite strgane SKU-je s Google Sheet; preskočite že videne elemente.«
- Dušenje: »Omejite na 30 dejanj na minuto.« Ohranja vas prijazne z omejitvami hitrosti – in z administratorji spletnih mest.
To zveni tehnično. V resnici so to le recepti: »Če to, naredi to, ponavljaj, dokler ni končano.«
Kdaj je Agent Mode napačno orodje
- Enkratna raziskava, kjer je vsaka stran drugačna? Ročno plus Siderjev povzemalnik bi lahko bil hitrejši.
- Spletna mesta, ki prepovedujejo avtomatizacijo v svojih pogojih? To spoštujte.
- Karkoli, kar zahteva presojo, kot je »ali je to videti kot neželen komentar?« – lahko avtomatizirate triažo, vendar za končne odločitve obdržite človeka v zanki.
Izberite svoje bitke. Uporabite avtomatizacijo tam, kjer so vzorci dolgočasni in ponovljivi. Zabavne, mehke, človeške stvari obdržite zase.
Varnostne mreže: Poskrbite, da bo tudi neuspeh dolgočasen
- Prekinjevalci tokokroga: Če se v 15 minutah pojavi več kot 3 napake, začasno ustavite urnik in vas opozorite.
- Povratne informacije: Če nalaganje ne uspe, izbrišite delne datoteke; če objava ne uspe, se izognite dvojnim objavam.
- Utripi srca: Dnevni pingi »živ sem«, da veste, da so vaši roboti budni – tudi ko ni ničesar za početi.
Ne potrebujete kontrolne sobe. Potrebujete nekaj dobrih navad.
Predloga za hiter začetek, ki jo lahko ukradete
Kopirajte to ogrodje poziva v Agent Mode <a0>ChatGPT
Atlas in izpolnite prazna polja:</a0>»Cilj: Vsak [dan v tednu] ob [časovni pas/čas] se prijavite na [URL spletnega mesta], se pomaknite na [pot], nastavite časovno obdobje na [obdobje], izvozite [format], preverite, ali obstajajo [stolpci] in število vrstic > [N], nato naložite v [shrambo] na [mapo], po imenu [vzorec imena datoteke]. Če izvoz ne uspe, poskusite znova [število]; če še vedno ne uspe, opozorite prek [kanala]. Uporabite izbirnike, ki imajo raje aria-label, vlogo in vidno besedilo. Počakajte, da [spinner/element] izgine, preden nadaljujete. Redagirajte vse [PII] v dnevnikih.«
Zaženite ga enkrat s pomožnimi kolesi. Popravite nihanje. Shranite ga. Načrtujte ga. Nasmehnite se.
Zaključek: Vaš brskalnik, zdaj z nasprotnimi palci
Agent Mode v <a0>ChatGPT
Atlas ne bo izpolnil vaših davkov ali sprehajal vašega psa. Toda zagotovo bo odpravil bolečino dolgočasnih spletnih opravil: izvozi, nalaganja, kopiranje-lepljenja, neumnosti »kliknite Naprej 17-krat«, ki vam kradejo jutra. Začnite majhno, opišite izid, nadzirajte prvo izvajanje in dodajte ravno dovolj varoval, da bo odporen.</a0>Kmalu boste imeli urejeno majhno ekipo brskalniških robotov. Ne bodo zahtevali povišic. Ne bodo klicali bolniške. In blagoslovljeno vam bodo pustili več časa za delo, ki dejansko potrebuje vaše možgane.
Še zadnja stvar: imejte proračun za krofe za dan, ko pokažete svoji ekipi, kako se tedenska poročila zdaj delajo sama. Vi boste junak. In robotom ne bo nič hudega.
Pogosta vprašanja
V1:Kako zaženem Agent Mode v <a0>ChatGPTChatGPT
Atlas za spletno avtomatizacijo?
Odprite V1:Kako zaženem Agent Mode v <a0>ChatGPTChatGPT
Atlas, omogočite Agent Mode in odobrite dovoljenja brskalnika. Opišite svoj cilj v preprosti angleščini (ne vsak klik), nato izvedite nadzorovano suho izvajanje, da popravite korake, preden shranite potek dela.</a0>V2:Ali lahko Agent Mode v <a0>ChatGPT
Atlas obravnava prijave in 2FA?
Da, Agent Mode lahko izvaja prijave in čaka na strani, vendar 2FA pogosto potrebuje človeški dotik ali žeton aplikacije. Dodajte pogojni korak: začasno ustavite pri 2FA in vas obvestite, nato nadaljujte, ko odobrite.</a0>V3:Katere vrste spletnih nalog so najboljše za Agent Mode v <a0>ChatGPT
Atlas?
Ponavljajoči se, predvidljivi poteki dela: izvoz poročil, izpolnjevanje obrazcev, strganje tabel in objava povzetkov. Če je postavitev spletnega mesta stabilna in se vaši koraki ponavljajo tedensko, Agent Mode blesti.</a0>V4:Kako lahko naredim svoje poteke dela Agent Mode bolj zanesljive?
Uporabite robustne izbirnike (aria-label, vloga, vidno besedilo), čakanja na osnovi dogodkov, poskuse in jasno preverjanje veljavnosti, kot je preverjanje imen stolpcev ali števila vrstic. Hranite dnevnike in opombe o različici, tako da popravki trajajo minute, ne ure.
V5: Ali je Sider.AI uporaben z načinom Agent v ChatGPT Atlas?
Da – stranska vrstica Sider.AI je odlična za pripravo pozivov, povzemanje dolgih strani in ustvarjanje jasnih pravil za ekstrakcijo, preden predate naloge načinu Agent. Ni čarobna, vendar je koristen kopilot za neurejene spletne informacije.