Вступ: Коли ваш браузер стає надто зайнятим
Чи бувало у вас таке, що ви щоранку робите ті самі п’ять кліків — відкриваєте інформаційну панель продажів, експортуєте CSV-файл, вставляєте його в електронну таблицю, надсилаєте електронною поштою босу — і думаєте: «Невже комп’ютери з мене сміються»? Зі мною теж. Нам так довго обіцяли автоматизацію, що фраза «налаштував і забув» звучить як технологічний еквівалент реклами дієти.
Зустрічайте Agent Mode в ChatGPT Atlas — функцію, яка стверджує, що може виконувати ваші веб-рутини за вас, як ввічливий робот-помічник, що живе у вашому браузері. Це не науково-фантастична фантазія; це реальний, трохи чарівний, іноді примхливий помічник, який може заповнювати форми, збирати дані зі сторінок, перехресно перевіряти дані та навіть циклічно виконувати завдання, поки ви попиваєте каву та вдаєте, що наполегливо працюєте над «стратегією».
У цьому посібнику я розповім вам, як використовувати Agent Mode в ChatGPT Atlas для автоматизації ваших веб-завдань — разом із тим, у чому він чудовий, де він зазнає невдачі, і крихітними ритуалами, які вам варто перейняти, щоб механізми працювали безперебійно. Думайте про це як про курси водіння для дуже розумного шофера.
Що насправді являє собою Agent Mode в ChatGPT Atlas?
Agent Mode — це підключена до браузера функція в ChatGPT Atlas, яка може приймати інструкції високого рівня — «увійди на мій сайт аналітики, отримай щотижневий трафік і опублікуй основні моменти в Slack» — і перетворювати їх на ланцюжок дій: навігація, клік, введення, збір даних, збереження та повторення. Замість того, щоб ви клацали по веб-сайтах, як лабораторний щур, який штовхає важіль заради гранул, Agent Mode стає тим, хто штовхає важіль.
- Він може читати сторінки, натискати кнопки, заповнювати форми, стежити за розбивкою на сторінки та експортувати файли.
- Він може запам'ятовувати кроки (в межах сеансу або збереженого робочого процесу) і запускати їх за розкладом.
- Він може передавати дані від одного кроку до іншого — як копіювання/вставлення, але без напруження зап'ястя.
Якщо ви коли-небудь намагалися записати макрос або написати сценарій Selenium і подумали: «Я не підписувався на такий рівень задротства», Agent Mode — це двоюрідний брат без коду, який насправді з’являється в день переїзду.
Кому варто використовувати Agent Mode (а кому ні)
- Вам: Повторювані веб-завдання, чіткі шаблони, прості гілки рішень.
- Також вам: Легкий збір даних для звітів; надсилання форм; багатоетапні послідовності.
- Можливо, вам: Робочі процеси з входом в систему, які торкаються легкої автентифікації.
- Ймовірно, не вам (поки що): Високодинамічні програми, які повторно відображаються кожну мілісекунду; сайти, які агресивно блокують автоматизацію; все, що пов’язано з конфіденційними обліковими даними за межами вашої зони комфорту.
Так, це потужно. Ні, це не чарівник. Це більше схоже на дуже здібного стажиста — швидкого, захопленого та іноді збентеженого ідентичними кнопками під назвою «Надіслати».
Шпаргалка ()
- Увімкніть Agent Mode в ChatGPT Atlas.
- Опишіть свою мету простою англійською мовою.
- Виконайте контрольований запуск: спостерігайте, виправляйте та позначайте кроки.
- Збережіть робочий процес із змінними, які можна використовувати повторно.
- Заплануйте його або натисніть «Виконати», коли потрібно.
- Додайте захисні огородження: тайм-аути, правила повторних спроб і резервні варіанти.
- Записуйте все, як ніби це ваші податки.
Якщо ви нічого іншого не запам'ятаєте, запам'ятайте: контролюйте перший запуск. Це весняні тренування перед сезоном.
Крок за кроком: як використовувати Agent Mode в ChatGPT Atlas для автоматизації веб-завдань
1) Увімкніть Agent Mode та підключіть свій браузер
- Відкрийте ChatGPT Atlas і знайдіть Agent Mode (зазвичай на лівій бічній панелі або в розділі Інструменти/Автоматизація).
- Надайте необхідні дозволи, щоб він міг бачити та взаємодіяти з вкладками вашого браузера.
- Якщо ваші завдання передбачають вхід в систему, вирішіть, як ви будете обробляти облікові дані: введення менеджера паролів, тимчасові токени або спеціальний обліковий запис із низькими привілеями, про який ви не будете плакати, якщо щось піде не так.
Професійна порада: почніть із неконфіденційного сайту, щоб зміцнити свою впевненість. Ніхто не хоче, щоб їхнє перше родео автоматизації було пов’язане з нарахуванням заробітної плати.
2) Опишіть результат, а не кліки
Agent Mode розуміє такі цілі: «Щопонеділка о 9 ранку увійдіть в Acme Analytics, завантажте CSV-файл «Щотижневі відвідувачі», завантажте його на Google Drive у папку «Звіти/2025», а потім опублікуйте підсумок у каналі #marketing Slack».
Справа в тому, щоб описати, що ви хочете зробити — ніби ви пояснюєте це другу, який розумний, але не бачив вашого екрана. Atlas запропонує план: перейдіть сюди, клацніть туди, витягніть це і так далі.
Перевірте план на адекватність. Якщо в ньому написано «відкрити Twitter», а ви попросили «рахунки-фактури у форматі PDF», оголосіть тайм-аут.
3) Виконайте контрольований пробний запуск
Тут відбувається магія. Atlas починає виконувати кроки, поки ви спостерігаєте в області попереднього перегляду (або у вашому браузері). Він виділяє елементи, на які збирається натиснути, показує знайдені селектори DOM і реєструє кожен крок.
- Якщо він неправильно ідентифікує кнопку, виправте це: «Використовуйте кнопку з написом «Експортувати як CSV», а не «Експортувати як PDF».
- Якщо він пропускає крок, вставте його: «Після входу в систему перейдіть до «Звіти > Щотижневі» перед експортом».
- Якщо сайт використовує нескінченну прокрутку або розбивку на сторінки, навчіть його: «Прокрутіть, щоб завантажити 50 елементів, потім натисніть «Далі», поки не буде наступної сторінки».
Думайте про це як про навчання підлітка водінню. Ви тримаєте руки біля керма, вказуєте, де знаходяться знаки зупинки, і сподіваєтеся, що немає білок.
4) Позначте, назвіть і параметризуйте свої кроки
Коли пробний запуск працює, не стримуйте бажання вигукнути «Відправляйте!». Натомість додайте захисні огородження:
- Назвіть кроки чітко: «Увійти», «Перейти до Щотижневих», «Експортувати CSV», «Завантажити на Drive», «Опублікувати в Slack». Майбутнє «Я» подякує минулому «Я».
- Введіть змінні: {week_start}, {folder_path}, {channel_name}. Тепер ваш робочий процес — це не одноразова акція; це шаблон.
- Збережіть копію з примітками до версії: «v1.2 – обробляє розбивку на сторінки та затримку двофакторної автентифікації». Ви будете шоковані тим, як часто нотатки перевершують пам’ять.
5) Навчіть його справлятися з реальними неприємностями
Інтернет — це хаотичний суп. Кнопки переміщуються. Сайти виводять вас із системи. Спливаюче вікно запитує, чи хочете ви печиво (не те, що приносить задоволення). Додайте стійкості:
- Тайм-аути та повторні спроби: «Зачекайте до 10 секунд на кнопку «Експорт»; повторіть двічі, перш ніж ескалювати».
- Умовні гілки: «Якщо з’являється 2FA, призупиніть і повідомте мене; інакше продовжуйте».
- CSS/XPath резервні варіанти: «Спочатку спробуйте aria-label; якщо це не вдасться, використовуйте комбінацію тексту ролі/кнопки».
- Структуроване вилучення: «Візьміть таблицю, перетворіть на CSV і перевірте заголовки стовпців перед збереженням».
Atlas — це добре, але «добре з бамперами» — краще.
6) Збережіть, протестуйте та заплануйте свою автоматизацію
- Збережіть робочий процес із дружньою назвою: «Щотижневий експорт веб-аналітики».
- Виконайте другий запуск без нагляду, але щоб ви були напоготові. Перевірте вихідну папку, розмір файлу, публікацію в Slack.
- Заплануйте його: понеділки, 9 ранку. Встановіть часові пояси навмисно — «9 ранку в Нью-Йорку» означає щось зовсім інше, якщо Atlas думає, що ви живете в Рейк’явіку.
- Додайте сповіщення про успіх і невдачу: електронною поштою про успіх, SMS про помилки. І так, ви можете зробити так, щоб повідомлення про невдачу звучали як «Womp womp».
7) Слідкуйте за журналами (ваше майбутнє «Я» вас обійме)
Atlas реєструє кожну дію з позначками часу, селекторами та знімками екрана (якщо ви їх увімкнете). Коли щось зламається — а це станеться, тому що це веб-сайти — ці журнали стануть вашим чорним ящиком.
- Перегляньте дельти: «Цього тижня кнопку перемістили в нове діалогове вікно».
- Оновіть селектори або порядок кроків.
- Повторно запустіть із тими самими вхідними даними. Переконайтеся, що це виправлено.
Ці десять хвилин дослідження журналів можуть заощадити вам години згодом.
Практичний приклад: від інформаційної панелі до Drive до Slack
Давайте запустимо конкретний сценарій, який ви можете адаптувати.
Ціль: Отримувати щотижневий трафік з Acme Analytics, завантажувати на Google Drive та публікувати підсумок в Slack.
- Запит: «Щопонеділка увійдіть в Acme Analytics, відкрийте «Звіти > Щотижневий трафік», експортуйте як CSV, збережіть як «traffic-{week_start}.csv» на Google Drive у «/Reports/2025», а потім опублікуйте «Щотижневі відвідувачі: X; Найкращий реферер: Y» у #marketing».
- План Atlas: він пропонує кроки. Ви переглядаєте.
- Пробний запуск: він успішно входить в систему, але вибирає «Експортувати як PDF». Ви виправляєте це та позначаєте кнопку CSV. Ви додаєте умову: «Якщо відкривається модальне вікно з вибором формату, виберіть CSV».
- Вилучення даних: Ви переглядаєте таблицю. Заголовки надходять як [Дата, Відвідувачі, Джерело]. Ви кажете йому обчислити sum(Visitors) і найкраще джерело.
- Завантаження: Ви підключаєте свій Drive, схвалюєте доступ і вказуєте змінну шляху до папки.
- Slack: Ви вставляєте веб-хук або токен програми. Ви форматуєте повідомлення за допомогою змінних.
- Тест: CSV-файл потрапляє у потрібну папку. Повідомлення Slack: «Щотижневі відвідувачі: 32 481; Найкращий реферер: органічний». Ви робите коло перемоги.
Тепер у вас є щотижневий робот. Ви можете додати другого робота для щомісячних звітів і третього, щоб підштовхнути Гері з відділу продажів, коли він знову забуде позначити кампанії. (Вибачте, Гері.)
Розумні хитрощі, які заощаджують години згодом
- Записуйте альтернативні селектори: якщо на сайті є як «Експорт», так і «Завантажити», захопіть обидва з пріоритетним порядком.
- Прив’язуйтеся за текстом і положенням: «Натисніть кнопку праворуч від «Щотижневий трафік». Це напрочуд надійно, коли класи змінюються.
- Використовуйте очікування, які щось значать: «Зачекайте, поки кількість рядків у таблиці > 0» краще, ніж «зачекайте 4 секунди».
- Перевіряйте вихідні дані: Файл не порожній? Назви стовпців збігаються? Кількість рядків у межах очікуваного діапазону? Швидка помилка краща, ніж пізня.
- Створіть крихітний словник даних: Що означає кожен стовпець, прийнятні діапазони, формати дат. Ви подякуєте собі під час збоїв.
- Зробіть знімки ключових сторінок: Коли селектори ламаються, знімки екрана допомагають виправити, не запускаючи весь потік заново.
Поширені помилки (і як їх уникнути)
- Приховані елементи: якщо Atlas намагається натиснути те, чого не бачить, спочатку прокрутіть до видимої області або перейдіть до видимого дубліката.
- Занадто розумний CSS: уникайте крихких селекторів, таких як «div:nth-child(42)». Віддавайте перевагу ідентифікаторам, ролям і тексту.
- Блокувальники спливаючих вікон: якщо сайт створює завантаження в новій вкладці, дозвольте Atlas відкривати спливаючі вікна для цього сайту.
- Тайм-аути сеансу: Плануйте вхід в систему біля кроків дій; тримайте запуски короткими; обробляйте «вас було виведено з системи».
- Стіни захисту від ботів: Деякі сайти не хочуть автоматизацію. Дотримуйтеся людського темпу та етичних норм. Поважайте robots.txt і умови надання послуг.
Обробка даних: Будьте дорослими в кімнаті
- Облікові дані: Використовуйте облікові записи з найменшими привілеями. Регулярно змінюйте токени. Не кодуйте паролі в підказках.
- Конфіденційні дані: Маскуйте їх у журналах. Увімкніть редагування для полів PII.
- Зберігання: Зберігайте експортовані дані в безпечному місці з резервним копіюванням. Шифруйте там, де це важливо.
- Відповідність вимогам: Якщо ви працюєте в сфері охорони здоров’я, фінансів або освіти, проконсультуйтеся з людьми з абревіатурами (HIPAA, SOC 2, FERPA), перш ніж автоматизувати.
Так, безпека додає кроки. Але так само і крадіжка особистих даних.
Масштабування: від одного агента до невеликої команди
Як тільки у вас з’явиться один робочий процес Agent Mode, вам захочеться більше. Уникайте «спагетті-боулу», прийнявши деяку легку структуру:
- Правила іменування: «Відділ-Завдання-Частота», наприклад «Mktg-ЩотижневийТрафік-Пн0900».
- Модулі для повторного використання: Створіть міні-робочий процес «Увійти в Acme», який можна імпортувати в інше місце.
- Центральні змінні: Зберігайте спільні біти — канал Slack, корінь Drive — в одному місці.
- Контроль версій: «v1.4 додає двофакторну паузу». Зберігайте журнали змін у нотатках робочого процесу.
- Інформаційна панель стану: Односторінковий документ, який показує останній статус запуску, тривалість і наступний розклад. Навіть електронна таблиця працює.
Ваша майбутня комплексна платформа автоматизації може бути вишуканою. Ваша перша може бути охайною та нудною. Нудно — це добре.
Бічні панелі з усунення несправностей
- «Він натискає не ту кнопку».
Додайте розрізнення за текстом, aria-label або сусіднім елементом. Або додайте попередній крок: «Відкрийте меню кебабів поруч із «Щотижневий трафік», потім виберіть «Експортувати CSV».
- «Сторінка постійно оновлюється».
Перейдіть з очікування на тригери на основі подій: «Зачекайте, поки елемент із role=progressbar зникне» або «зачекайте, поки XHR «/api/report» завершить роботу».
- «Завантаження порожні».
Перевірте кількість рядків у таблиці перед експортом; повторіть спробу, якщо нуль. Деяким сайтам потрібне «Оновити» або заповнення діапазону дат, перш ніж вони заповняться.
- «2FA все псує».
Для сайтів із високим рівнем безпеки розгляньте контрольований крок, токени для конкретних програм або сеанси з обмеженим часом. Або прийміть те, що деякі завдання все ще краще виконуються вуглецевими формами життя.
Ось сюрприз: Sider.AI добре грає в цій пісочниці. Якщо ваш день проходить у браузері — дослідження постачальників, вилучення конкурентної інформації, підсумовування довгих сторінок — бічна панель Sider може створювати чернетки підказок, підсумовувати сторінки та структурувати зібраний вміст, перш ніж передати його в Agent Mode в ChatGPT Atlas. Мій улюблений трюк: використовуйте Sider для створення чітких правил вилучення («Знайдіть H2 «Ціни», потім захопіть першу таблицю») і вставте їх безпосередньо як покрокову інструкцію. Це не ідеально, але коли ви спрямовуєте його на те, для чого він створений — упорядкування безладної веб-інформації — це відчувається як найняти редактора для свого робота. Розширені прийоми: розгалуження, цикли та об’єднання даних
Як тільки ви освоїтесь, ви можете розігратися — не стаючи повноцінним програмістом.
- Гілки: «Якщо тип звіту «Щомісячний», застосуйте інший діапазон дат».
- Цикли: «Для кожного рядка в цій таблиці відкрийте деталі, скопіюйте ідентифікатор і додайте до електронної таблиці».
- Об’єднання: «Перехресна перевірка зібраних SKU з Google Sheet; пропустіть уже переглянуті елементи».
- Регулювання: «Обмежте до 30 дій за хвилину». Це допоможе вам бути дружніми з обмеженнями швидкості — і з адміністраторами сайтів.
Це звучить технічно. Насправді це просто рецепти: «Якщо це, зробіть те, повторюйте, поки не буде зроблено».
Коли Agent Mode — невідповідний інструмент
- Одноразове дослідження, де кожна сторінка різна? Ручний режим плюс підсумовувач Sider може бути швидшим.
- Сайти, які забороняють автоматизацію у своїх умовах? Поважайте це.
- Усе, що вимагає винесення суджень, наприклад «чи виглядає це як спам-коментар?» — ви можете автоматизувати сортування, але залиште людину в циклі для остаточних рішень.
Вибирайте свої битви. Використовуйте автоматизацію там, де шаблони нудні та повторювані. Залиште веселі, м’які, людські речі для себе.
Мережі безпеки: Зробіть невдачу також нудною
- Автоматичні вимикачі: Якщо протягом 15 хвилин відбувається більше 3 збоїв, призупиніть розклад і попередьте вас.
- Відкоти: Якщо завантаження не вдається, видаліть часткові файли; якщо публікація не вдається, уникайте повторних публікацій.
- Пульс: Щоденні пінги «Я живий», щоб ви знали, що ваші роботи не сплять — навіть коли немає чого робити.
Вам не потрібна кімната управління. Вам потрібно кілька хороших звичок.
Шаблон швидкого старту, який ви можете вкрасти
Скопіюйте цей скелет підказки в Agent Mode ChatGPT Atlas і заповніть пробіли:
«Мета: Кожен [день тижня] о [часовий пояс/час] увійдіть на [URL-адресу сайту], перейдіть до [шлях], встановіть діапазон дат на [діапазон], експортуйте [формат], перевірте наявність [стовпців] і кількість рядків > [N], потім завантажте до [сховища] у [папку] під назвою [шаблон імені файлу]. Якщо експорт не вдається, повторіть [кількість]; якщо все одно не вдається, повідомте через [канал]. Використовуйте селектори, які віддають перевагу aria-label, ролі та видимому тексту. Зачекайте, поки [індикатор/елемент] зникне, перш ніж продовжити. Відредагуйте будь-який [PII] у журналах».
Запустіть його один раз із навчальними колесами. Виправте хитання. Збережіть його. Заплануйте його. Посміхніться.
Підсумок: Ваш браузер, тепер із протиставними великими пальцями
Agent Mode в ChatGPT Atlas не сплачуватиме ваші податки та не вигулюватиме вашу собаку. Але він абсолютно позбавить від нудних веб-рутин: експорту, завантажень, копіювання-вставки, нісенітниці «натисніть «Далі» 17 разів», яка краде ваші ранки. Почніть з малого, опишіть результат, контролюйте перший запуск і додайте достатньо захисних огороджень, щоб він залишався стійким.
Незабаром у вас буде охайна невелика команда браузерних роботів. Вони не проситимуть підвищення. Вони не будуть дзвонити, щоб повідомити про хворобу. І вони, на щастя, залишать вам більше часу для роботи, яка насправді потребує вашого мозку.
І останнє: залиште бюджет на пончики на той день, коли ви покажете своїй команді, як щотижневі звіти тепер робляться самі собою. Ви будете героєм. І роботи зовсім не будуть проти.
FAQ
Q1:Як запустити Agent Mode в ChatGPT Atlas для автоматизації веб-сторінок?
Відкрийте ChatGPT Atlas, увімкніть Agent Mode та надайте дозволи браузеру. Опишіть свою мету простою англійською мовою (а не кожен клік), а потім виконайте контрольований пробний запуск, щоб виправити кроки перед збереженням робочого процесу.
Q2:Чи може Agent Mode в ChatGPT Atlas обробляти входи в систему та 2FA?
Так, Agent Mode може виконувати входи в систему та чекати на сторінки, але 2FA часто потребує натискання людини або токен програми. Додайте умовний крок: призупиніть на 2FA та повідомте вас, а потім продовжуйте після того, як ви схвалите.
Q3:Які типи веб-завдань найкраще підходять для Agent Mode в ChatGPT Atlas?
Повторювані, передбачувані робочі процеси: експорт звітів, заповнення форм, збирання таблиць та публікація підсумків. Якщо макет сайту стабільний, а ваші кроки повторюються щотижня, Agent Mode сяє.
Q4:Як зробити мої робочі процеси Agent Mode більш надійними?
Використовуйте надійні селектори (aria-label, роль, видимий текст), очікування на основі подій, повторні спроби та чітку перевірку, наприклад перевірку назв стовпців або кількості рядків. Ведіть журнали та нотатки про версії, щоб виправлення займали хвилини, а не години.
Q5: Чи корисний Sider.AI з Agent Mode в ChatGPT Atlas?
Так — бічна панель Sider.AI чудово підходить для створення чернеток запитів, підсумовування довгих сторінок і генерації чітких правил вилучення, перш ніж передавати завдання в Agent Mode. Це не магія, але це корисний помічник для роботи з великою кількістю інформації в інтернеті.