Wprowadzenie: Kiedy Twoja przeglądarka staje się wścibska
Czy zdarzyło Ci się wykonywać te same pięć kliknięć każdego ranka – otwierać pulpit sprzedażowy, eksportować plik CSV, wklejać go do arkusza kalkulacyjnego, wysyłać e-mail do szefa – i myśleć: „Na pewno komputery się ze mnie śmieją”? Mnie też. Obiecywano nam automatyzację tak długo, że „ustaw i zapomnij” brzmi jak technologiczny odpowiednik reklamy diety.
Poznaj Tryb Agenta w ChatGPT Atlas – funkcję, która twierdzi, że faktycznie może wykonywać za Ciebie obowiązki internetowe, jak uprzejmy robot-asystent, który mieszka w Twojej przeglądarce. To nie fantazja science fiction; to prawdziwy, odrobinę magiczny, czasem kapryśny pomocnik, który może wypełniać formularze, skrobać strony, porównywać dane, a nawet wykonywać zadania w pętli, podczas gdy Ty sączysz kawę i udajesz, że ciężko pracujesz nad „strategią”.
W tym przewodniku pokażę, jak używać Trybu Agenta w ChatGPT Atlas do automatyzacji zadań internetowych – wraz z tym, w czym jest świetny, gdzie się potyka i jakie małe rytuały warto przyjąć, aby utrzymać wszystko w ruchu. Pomyśl o tym jak o kursie prawa jazdy dla bardzo sprytnego szofera.
Czym tak naprawdę jest Tryb Agenta w ChatGPT Atlas?
Tryb Agenta to funkcja ChatGPT Atlas podłączona do przeglądarki, która może przyjmować instrukcje wysokiego poziomu – „zaloguj się na moją stronę analityczną, pobierz tygodniowy ruch i opublikuj najważniejsze informacje na Slacku” – i przekształcać je w łańcuch działań: nawiguj, kliknij, wpisz, skrob, zapisz i powtórz. Zamiast klikać po stronach internetowych jak szczur laboratoryjny naciskający dźwignię dla nagrody, Tryb Agenta staje się tym, który naciska dźwignię.
- Może czytać strony, klikać przyciski, wypełniać formularze, śledzić paginację i eksportować pliki.
- Może zapamiętywać kroki (w ramach sesji lub zapisanego przepływu pracy) i uruchamiać je zgodnie z harmonogramem.
- Może przekazywać dane z jednego kroku do drugiego – jak kopiowanie/wklejanie, ale bez nadwyrężania nadgarstka.
Jeśli kiedykolwiek próbowałeś nagrać makro lub napisać skrypt Selenium i pomyślałeś: „Nie zapisywałem się na taki poziom nerdostwa”, Tryb Agenta jest kuzynem no-code, który faktycznie pojawia się w dniu przeprowadzki.
Kto powinien używać Trybu Agenta (a kto nie)
- Ty: Powtarzalne zadania internetowe, jasne wzorce, proste gałęzie decyzyjne.
- Również Ty: Lekkie skrobanie danych do raportów; przesyłanie formularzy; wieloetapowe sekwencje.
- Może Ty: Zalogowane przepływy pracy, które dotykają lekkiego uwierzytelniania.
- Prawdopodobnie nie Ty (jeszcze): Wysoce dynamiczne aplikacje, które przeładowują się co milisekundę; strony, które agresywnie blokują automatyzację; wszystko, co wiąże się z wrażliwymi danymi uwierzytelniającymi poza Twoją strefą komfortu.
Tak, to potężne. Nie, to nie czarodziej. To bardziej jak bardzo kompetentny stażysta – szybki, entuzjastyczny i czasami zdezorientowany przez identyczne przyciski o nazwie „Wyślij”.
Ściągawka – przegląd ()
- Włącz Tryb Agenta w ChatGPT Atlas.
- Opisz swój cel prostym językiem.
- Wykonaj nadzorowane uruchomienie: obserwuj, poprawiaj i oznaczaj kroki.
- Zapisz przepływ pracy z możliwością ponownego wykorzystania zmiennych.
- Zaplanuj go lub uruchom, gdy zajdzie taka potrzeba.
- Dodaj zabezpieczenia: limity czasu, reguły ponawiania i awarie.
- Rejestruj wszystko, jakby to były Twoje podatki.
Jeśli nic więcej nie zapamiętasz, pamiętaj: nadzoruj pierwsze uruchomienie. To trening wiosenny przed sezonem.
Krok po kroku: Jak używać Trybu Agenta w ChatGPT Atlas do automatyzacji zadań internetowych
1) Włącz Tryb Agenta i połącz swoją przeglądarkę
- Otwórz ChatGPT Atlas i zlokalizuj Tryb Agenta (zwykle w lewym pasku bocznym lub w sekcji Narzędzia/Automatyzacja).
- Przyznaj niezbędne uprawnienia, aby mógł widzieć i wchodzić w interakcje z kartami przeglądarki.
- Jeśli Twoje zadania obejmują logowanie, zdecyduj, jak będziesz obsługiwać dane uwierzytelniające: wstrzykiwanie menedżera haseł, tymczasowe tokeny lub dedykowane konto o niskich uprawnieniach, którego nie będziesz opłakiwać, jeśli coś pójdzie nie tak.
Wskazówka dla profesjonalistów: Zacznij od niewrażliwej strony, aby zbudować swoją pewność siebie. Nikt nie chce, aby jego pierwsze rodeo z automatyzacją dotyczyło listy płac.
2) Opisz wynik, a nie kliknięcia
Tryb Agenta rozumie cele takie jak: „W każdy poniedziałek o 9:00 zaloguj się do Acme Analytics, pobierz plik CSV 'Tygodniowi goście', prześlij go do Dysku Google w folderze 'Raporty/2025', a następnie opublikuj podsumowanie na kanale #marketing Slack”.
Chodzi o to, aby opisać, co chcesz zrobić – tak jakbyś wyjaśniał to przyjacielowi, który jest inteligentny, ale nie widział Twojego ekranu. Atlas zaproponuje plan: Przejdź tutaj, kliknij to, wyodrębnij to i tak dalej.
Sprawdź plan. Jeśli jest napisane „otwórz Twittera”, a poprosiłeś o „faktury PDF”, wezwij limit czasu.
3) Wykonaj nadzorowane uruchomienie testowe
W tym miejscu dzieje się magia. Atlas zaczyna wykonywać kroki, podczas gdy Ty obserwujesz w panelu podglądu (lub w swojej przeglądarce na żywo). Podświetla elementy, które zamierza kliknąć, pokazuje znalezione selektory DOM i rejestruje każdy krok.
- Jeśli błędnie zidentyfikuje przycisk, popraw go: „Użyj przycisku oznaczonego 'Eksportuj jako CSV' – a nie 'Eksportuj jako PDF'”.
- Jeśli pominie krok, wstaw go: „Po zalogowaniu przejdź do 'Raporty > Tygodniowe' przed eksportem”.
- Jeśli witryna używa nieskończonego przewijania lub paginacji, naucz ją: „Przewiń, aby załadować 50 elementów, a następnie kliknij 'Dalej', aż nie będzie następnej strony”.
Pomyśl o tym jak o uczeniu nastolatka prowadzenia samochodu. Trzymasz ręce blisko kierownicy, wskazujesz, gdzie są znaki stopu i masz nadzieję, że nie ma wiewiórek.
4) Oznacz, nazwij i sparametryzuj swoje kroki
Gdy uruchomienie testowe działa, oprzyj się pokusie krzyknięcia „Wysyłaj!”. Zamiast tego dodaj zabezpieczenia:
- Nazwij kroki w jasny sposób: „Zaloguj się”, „Przejdź do Tygodniowe”, „Eksportuj CSV”, „Prześlij do Dysku”, „Opublikuj na Slacku”. Przyszły Ty podziękuje przeszłemu Tobie.
- Wprowadź zmienne: {week_start}, {folder_path}, {channel_name}. Teraz Twój przepływ pracy nie jest jednorazowy; to szablon.
- Zapisz kopię z notatkami o wersji: „v1.2 – obsługuje paginację i opóźnienie dwuskładnikowe”. Będziesz zaskoczony, jak często notatki pokonują pamięć.
5) Naucz go radzić sobie z prawdziwymi niedogodnościami
Internet to zupa chaosu. Przyciski się przesuwają. Witryny Cię wylogowują. Wyskakujące okienko pyta, czy chcesz ciasteczka (nie te fajne). Dodaj odporność:
- Limity czasu i ponawianie: „Poczekaj do 10 sekund na przycisk 'Eksportuj'; ponów próbę dwa razy przed eskalacją”.
- Gałęzie warunkowe: „Jeśli pojawi się 2FA, zatrzymaj się i powiadom mnie; w przeciwnym razie kontynuuj”.
- Alternatywy CSS/XPath: „Najpierw spróbuj z aria-label; jeśli to się nie uda, użyj kombinacji tekstu roli/przycisku”.
- Ustrukturyzowane wyodrębnianie: „Pobierz tabelę, przekonwertuj na CSV i zweryfikuj nagłówki kolumn przed zapisaniem”.
Atlas jest dobry, ale „dobry z odbojnikami” jest lepszy.
6) Zapisz, przetestuj i zaplanuj swoją automatyzację
- Zapisz przepływ pracy z przyjazną nazwą: „Tygodniowy eksport analizy internetowej”.
- Wykonaj drugie uruchomienie, bez nadzoru, ale z Tobą w pobliżu. Sprawdź folder wyjściowy, rozmiar pliku, wpis na Slacku.
- Zaplanuj go: poniedziałki, 9:00. Ustaw strefy czasowe celowo – „9:00 w Nowym Jorku” oznacza coś zupełnie innego, jeśli Atlas myśli, że mieszkasz w Reykjaviku.
- Dodaj powiadomienia o powodzeniu i niepowodzeniu: e-mail o powodzeniu, SMS o błędach. I tak, możesz sprawić, że komunikaty o błędach będą brzmiały „Womp womp”.
7) Miej oko na dzienniki (Twój przyszły Ja Cię uściska)
Atlas rejestruje każde działanie ze znacznikami czasu, selektorami i zrzutami ekranu (jeśli je włączysz). Kiedy coś się zepsuje – a tak się stanie, ponieważ strony internetowe – te dzienniki są Twoim czarnym pudełkiem.
- Przejrzyj różnice: „W tym tygodniu przycisk został przeniesiony do nowego okna dialogowego”.
- Zaktualizuj selektory lub kolejność kroków.
- Uruchom ponownie z tymi samymi danymi wejściowymi. Potwierdź, że zostało to naprawione.
Te dziesięć minut przeszukiwania dzienników może zaoszczędzić Ci godziny później.
Prawdziwy przykład: Z pulpitu do Dysku do Slacka
Uruchommy konkretny scenariusz, który możesz dostosować.
Cel: Pobierz tygodniowy ruch z Acme Analytics, prześlij do Dysku Google i opublikuj podsumowanie na Slacku.
- Zapytanie: „W każdy poniedziałek zaloguj się do Acme Analytics, otwórz 'Raporty > Tygodniowy ruch', wyeksportuj jako CSV, zapisz jako 'traffic-{week_start}.csv' na Dysku Google w '/Raporty/2025', a następnie opublikuj 'Tygodniowi goście: X; Najlepszy odsyłacz: Y' na #marketing”.
- Plan Atlasa: Proponuje kroki. Ty sprawdzasz.
- Uruchomienie testowe: Zalogowuje się pomyślnie, ale wybiera 'Eksportuj jako PDF'. Poprawiasz to i oznaczasz przycisk CSV. Dodajesz warunek: „Jeśli otworzy się okno modalne z opcjami formatu, wybierz CSV”.
- Wyodrębnianie danych: Podglądasz tabelę. Nagłówki są wyświetlane jako [Data, Goście, Źródło]. Mówisz mu, żeby obliczył sum(Goście) i najlepsze Źródło.
- Przesyłanie: Podłączasz swój Dysk, zatwierdzasz dostęp i określasz zmienną ścieżki folderu.
- Slack: Wklejasz webhook lub token aplikacji. Formatujesz wiadomość za pomocą zmiennych.
- Test: Plik CSV trafia do właściwego folderu. Wiadomość na Slacku: „Tygodniowi goście: 32 481; Najlepszy odsyłacz: organiczny”. Wykonujesz rundę zwycięstwa.
Teraz masz cotygodniowego robota. Możesz dodać drugiego robota do miesięcznych podsumowań i trzeciego, żeby szturchać Gary'ego z działu sprzedaży, kiedy zapomni ponownie otagować kampanie. (Przepraszam, Gary.)
Sprytne sztuczki, które oszczędzają godziny później
- Nagrywaj alternatywne selektory: Jeśli witryna ma zarówno 'Eksportuj', jak i 'Pobierz', przechwyć oba z kolejnością priorytetów.
- Zakotwiczaj tekstem i położeniem: „Kliknij przycisk po prawej stronie 'Tygodniowego ruchu'”. Jest zaskakująco solidny, gdy klasy się zmieniają.
- Używaj oczekiwań, które coś znaczą: „Poczekaj, aż liczba wierszy tabeli > 0” jest lepsze niż „poczekaj 4 sekundy”.
- Sprawdzaj poprawność danych wyjściowych: Plik nie jest pusty? Nazwy kolumn pasują? Liczba wierszy mieści się w oczekiwanym zakresie? Szybka porażka jest lepsza niż późniejsza.
- Zbuduj mały słownik danych: Co oznacza każda kolumna, dopuszczalne zakresy, formaty dat. Podziękujesz sobie podczas awarii.
- Rób migawki kluczowych stron: Kiedy selektory się psują, zrzuty ekranu pomagają naprawić bez ponownego uruchamiania całego przepływu.
Typowe pułapki (i jak ich unikać)
- Ukryte elementy: Jeśli Atlas próbuje kliknąć to, czego nie widzi, przewiń najpierw do widoku lub przełącz się na widoczny duplikat.
- Zbyt sprytny CSS: Unikaj kruchych selektorów, takich jak „div:nth-child(42)”. Preferuj identyfikatory, role i tekst.
- Blokady wyskakujących okienek: Jeśli witryna tworzy pobieranie w nowej karcie, pozwól Atlasowi otwierać wyskakujące okienka dla tej witryny.
- Limity czasu sesji: Planuj logowania w pobliżu kroków akcji; skracaj przebiegi; obsługuj „zostałeś wylogowany”.
- Zapory antybotowe: Niektóre witryny nie chcą automatyzacji. Utrzymuj tempo zbliżone do ludzkiego i etyczne. Przestrzegaj robots.txt i warunków świadczenia usług.
Obsługa danych: Bądź dorosłym w pokoju
- Dane uwierzytelniające: Używaj kont o najniższych uprawnieniach. Regularnie zmieniaj tokeny. Nie wpisuj haseł na stałe w monitach.
- Dane wrażliwe: Maskuj je w dziennikach. Włącz redakcję dla pól PII.
- Przechowywanie: Przechowuj eksporty w bezpiecznym, zarchiwizowanym miejscu. Szyfruj tam, gdzie to ma znaczenie.
- Zgodność: Jeśli pracujesz w służbie zdrowia, finansach lub edukacji, skonsultuj się z osobami od akronimów (HIPAA, SOC 2, FERPA) przed automatyzacją.
Tak, bezpieczeństwo dodaje kroki. Ale kradzież tożsamości też.
Skalowanie: Od jednego agenta do małego zespołu
Gdy masz już jeden przepływ pracy w Trybie Agenta, będziesz chciał więcej. Unikaj spaghetti, przyjmując lekką strukturę:
- Konwencje nazewnictwa: „Dział-Zadanie-Częstotliwość”, np. „Mktg-TygodniowyRuch-Pon0900”.
- Moduły wielokrotnego użytku: Utwórz mini-przepływ pracy „Zaloguj się do Acme”, który możesz importować gdzie indziej.
- Centralne zmienne: Przechowuj udostępnione bity – kanał Slack, katalog główny Dysku – w jednym miejscu.
- Wersjonowanie: „v1.4 dodaje pauzę dwuskładnikową”. Przechowuj dzienniki zmian w notatkach przepływu pracy.
- Pulpit nawigacyjny stanu: Jednostronicowy dokument, który pokazuje stan ostatniego uruchomienia, czas trwania i następny harmonogram. Nawet arkusz kalkulacyjny działa.
Twoja przyszła kompleksowa platforma automatyzacji może być fantazyjna. Twoja pierwsza może być uporządkowana i nudna. Nudne jest dobre.
Rozwiązywanie problemów – paski boczne
- „Klikam zły przycisk”.
Dodaj rozróżnienie za pomocą tekstu, aria-label lub sąsiedniego elementu. Lub dodaj poprzedni krok: „Otwórz menu kebab obok 'Tygodniowego ruchu', a następnie wybierz 'Eksportuj CSV'”.
- „Strona ciągle się przeładowuje”.
Przełącz oczekiwania na wyzwalacze oparte na zdarzeniach: „Poczekaj, aż element z role=progressbar zniknie” lub „poczekaj, aż XHR '/api/report' się zakończy”.
- „Pobrane pliki są puste”.
Sprawdź poprawność liczby wierszy tabeli przed eksportem; ponów próbę, jeśli zero. Niektóre witryny potrzebują „Odśwież” lub wypełnienia zakresu dat, zanim się zapełnią.
- „2FA wszystko psuje”.
W przypadku witryn o wysokim poziomie bezpieczeństwa rozważ nadzorowany krok, tokeny specyficzne dla aplikacji lub sesje ograniczone czasowo. Lub zaakceptuj, że niektóre zadania nadal lepiej wykonują formy życia oparte na węglu.
Oto niespodzianka: Sider.AI dobrze radzi sobie w tej piaskownicy. Jeśli Twój dzień spędzasz w przeglądarce – badając dostawców, wyodrębniając konkurencyjne informacje, podsumowując długie strony – pasek boczny Sidera może tworzyć wersje robocze podpowiedzi, podsumowywać strony i strukturyzować skrobaną zawartość, zanim przekażesz ją do Trybu Agenta w ChatGPT Atlas. Moja ulubiona sztuczka: użyj Sidera do generowania czystych reguł wyodrębniania („Poszukaj H2 'Cennik', a następnie przechwyć pierwszą tabelę”) i wklej je bezpośrednio jako wskazówki krok po kroku. Nie jest idealny, ale kiedy skierujesz go na to, do czego został stworzony – porządkowanie niechlujnych informacji internetowych – czujesz się, jakbyś zatrudnił redaktora dla swojego robota. Zaawansowane ruchy: Rozgałęzienia, pętle i łączenie danych
Gdy poczujesz się komfortowo, możesz zaszaleć – bez stawania się pełnym programistą.
- Rozgałęzienia: „Jeśli typ raportu to 'Miesięczny', zastosuj inny zakres dat”.
- Pętle: „Dla każdego wiersza w tej tabeli otwórz szczegóły, skopiuj identyfikator i dołącz do arkusza kalkulacyjnego”.
- Łączenia: „Sprawdź krzyżowo skrobane kody SKU z arkuszem Google; pomiń już widziane elementy”.
- Ograniczanie: „Ogranicz do 30 akcji na minutę”. Utrzymuje przyjazne relacje z limitami szybkości – i z administratorami witryn.
Brzmi to technicznie. W rzeczywistości są to tylko przepisy: „Jeśli to, zrób tamto, powtarzaj aż do skutku”.
Kiedy Tryb Agenta jest złym narzędziem
- Jednorazowe badania, w których każda strona jest inna? Ręczne plus podsumowanie Sidera może być szybsze.
- Witryny, które zabraniają automatyzacji w swoich warunkach? Uszanuj to.
- Wszystko, co wymaga oceny, np. „czy to wygląda na spamowy komentarz?” – możesz zautomatyzować triage, ale trzymaj człowieka w pętli, żeby podejmował ostateczne decyzje.
Wybieraj swoje bitwy. Używaj automatyzacji tam, gdzie wzorce są nudne i powtarzalne. Zachowaj zabawne, elastyczne, ludzkie rzeczy dla siebie.
Siatki bezpieczeństwa: Spraw, by porażka też była nudna
- Wyłączniki obwodów: Jeśli w ciągu 15 minut wystąpi więcej niż 3 awarie, wstrzymaj harmonogram i powiadom Cię.
- Wycofania: Jeśli przesyłanie nie powiedzie się, usuń częściowe pliki; jeśli wpis nie powiedzie się, unikaj podwójnych wpisów.
- Sygnały kontrolne: Codzienne pingi „Żyję”, abyś wiedział, że Twoje roboty są obudzone – nawet jeśli nie ma nic do roboty.
Nie potrzebujesz sterowni. Potrzebujesz kilku dobrych nawyków.
Szablon szybkiego startu, który możesz ukraść
Skopiuj ten szkielet monitu do Trybu Agenta ChatGPT Atlas i wypełnij puste pola:
„Cel: W każdy [dzień tygodnia] o [strefa czasowa/godzina] zaloguj się do [adres URL witryny], przejdź do [ścieżka], ustaw zakres dat na [zakres], wyeksportuj [format], sprawdź, czy istnieją [kolumny] i liczba wierszy > [N], a następnie prześlij do [miejsce przechowywania] w [folder], o nazwie [wzorzec nazwy pliku]. Jeśli eksport nie powiedzie się, ponów próbę [liczba]; jeśli nadal się nie powiedzie, powiadom przez [kanał]. Używaj selektorów, które preferują aria-label, rolę i widoczny tekst. Poczekaj, aż [spinner/element] zniknie przed kontynuowaniem. Zredaguj wszelkie [PII] w dziennikach”.
Uruchom go raz z kółkami treningowymi. Napraw chwiejność. Zapisz to. Zaplanuj to. Uśmiechnij się.
Podsumowanie: Twoja przeglądarka, teraz z przeciwstawnymi kciukami
Tryb Agenta w ChatGPT Atlas nie rozliczy Twoich podatków ani nie wyprowadzi Twojego psa na spacer. Ale absolutnie usunie ból z nudnych obowiązków internetowych: eksportów, przesyłania, kopiowania-wklejania, nonsensu „kliknij Dalej 17 razy”, który kradnie Twoje poranki. Zacznij od małego, opisz wynik, nadzoruj pierwsze uruchomienie i dodaj tylko tyle zabezpieczeń, aby zachować odporność.
Wkrótce będziesz miał uporządkowaną małą załogę robotów przeglądarkowych. Nie będą prosić o podwyżki. Nie będą dzwonić, że są chorzy. I, na szczęście, dadzą Ci więcej czasu na pracę, która naprawdę potrzebuje Twojego mózgu.
Jeszcze jedno: zachowaj budżet na pączki na dzień, w którym pokażesz swojemu zespołowi, jak cotygodniowe raporty robią się teraz same. Będziesz bohaterem. A roboty nie będą miały nic przeciwko.
FAQ
P1:Jak uruchomić Tryb Agenta w ChatGPT Atlas do automatyzacji internetowej?
Otwórz ChatGPT Atlas, włącz Tryb Agenta i przyznaj uprawnienia przeglądarce. Opisz swój cel prostym językiem (nie każde kliknięcie), a następnie wykonaj nadzorowane uruchomienie testowe, aby poprawić kroki przed zapisaniem przepływu pracy.
P2:Czy Tryb Agenta w ChatGPT Atlas może obsługiwać logowania i 2FA?
Tak, Tryb Agenta może wykonywać logowania i czekać na strony, ale 2FA często potrzebuje dotknięcia człowieka lub tokenu aplikacji. Dodaj krok warunkowy: wstrzymaj się na 2FA i powiadom Cię, a następnie kontynuuj po zatwierdzeniu.
P3:Jakie rodzaje zadań internetowych są najlepsze dla Trybu Agenta w ChatGPT Atlas?
Powtarzalne, przewidywalne przepływy pracy: eksportowanie raportów, wypełnianie formularzy, skrobanie tabel i publikowanie podsumowań. Jeśli układ witryny jest stabilny, a Twoje kroki powtarzają się co tydzień, Tryb Agenta świeci.
P4:Jak sprawić, by moje przepływy pracy w Trybie Agenta były bardziej niezawodne?
Używaj solidnych selektorów (aria-label, rola, widoczny tekst), oczekiwania oparte na zdarzeniach, ponawiania i jasnej walidacji, takiej jak sprawdzanie nazw kolumn lub liczby wierszy. Przechowuj dzienniki i notatki o wersji, aby poprawki zajmowały minuty, a nie godziny.
Pytanie 5: Czy Sider.AI jest przydatny w trybie Agenta w ChatGPT Atlas?
Tak — pasek boczny Sider.AI świetnie nadaje się do tworzenia wersji roboczych poleceń, podsumowywania długich stron i generowania przejrzystych reguł ekstrakcji, zanim przekażesz zadania do trybu Agenta. To nie magia, ale pomocny pilot wspomagający pracę z nieuporządkowanymi informacjami w sieci.