परिचय: जेव्हा तुमचे ब्राउझर कामात व्यस्त होते
तुम्ही कधी स्वतःला दररोज सकाळी तेच पाच क्लिक करताना पाहता का—सेल्स डॅशबोर्ड उघडा, CSV एक्सपोर्ट करा, ती स्प्रेडशीटमध्ये पेस्ट करा, बॉसला ईमेल करा—आणि विचार करा, “नक्कीच कॉम्प्युटर माझ्यावर हसत असतील”? मलाही असाच अनुभव येतो. ऑटोमेशनचे इतके दिवस आश्वासन देण्यात आले आहे की "सेट इट अँड फॉरगेट इट" हे डाएट जाहिरातीसारखे वाटते.
ChatGPT Atlas मधील Agent Mode वापरा—हे फीचर तुमच्यासाठी तुमच्या वेबची कामे करू शकते, असा दावा करते, जसे तुमच्या ब्राउझरमध्ये राहणारा एक विनम्र रोबोट सहाय्यक. हे सायन्स फिक्शन नाही; एक वास्तविक, थोडे जादूई, कधीकधी विचित्र मदतनीस आहे जो फॉर्म भरू शकतो, पृष्ठे स्क्रॅप करू शकतो, डेटा क्रॉस-रेफरन्स करू शकतो आणि तुम्ही कॉफी पिताना आणि “स्ट्रॅटेजी” वर कठोर परिश्रम करत असल्याचा बहाणा करत असताना कामांमध्ये सतत व्यस्त राहू शकतो.
या मार्गदर्शकामध्ये, मी तुम्हाला ChatGPT Atlas मधील Agent Mode चा वापर तुमच्या वेबची कामे ऑटोमेट करण्यासाठी कसा करायचा हे सांगेन—त्यासोबतच ते कशासाठी उत्तम आहे, ते कुठे अयशस्वी होते आणि गीअर्स सुरळीत ठेवण्यासाठी तुम्ही कोणत्या लहान सवयी स्वीकारायला हव्यात. याला एका अतिशय हुशार ड्रायव्हरसाठीचे तुमचे ड्रायव्हिंग शिक्षण समजा.
ChatGPT Atlas मधील Agent Mode म्हणजे काय?
Agent Mode हे ChatGPT Atlas मधील ब्राउझर-कनेक्टेड फीचर आहे जे उच्च-स्तरीय सूचना घेऊ शकते—"माझ्या ॲनालिटिक्स साइटवर लॉग इन करा, साप्ताहिक ট্র্যাफिक (traffic) घ्या आणि Slack मध्ये हायलाइट पोस्ट करा"—आणि त्याचे कृतींच्या मालिकेत रूपांतर करू शकते: नेव्हिगेट करा, क्लिक करा, टाइप करा, स्क्रॅप करा, सेव्ह करा आणि पुन्हा करा. तुम्ही उंदीरासारखे लीव्हर दाबून वेबसाइटवर क्लिक करण्याऐवजी, Agent Mode लीव्हर-पुशर बनते.
- हे पृष्ठे वाचू शकते, बटणे क्लिक करू शकते, फॉर्म भरू शकते, पृष्ठांकन फॉलो करू शकते आणि फाईल्स एक्सपोर्ट करू शकते.
- हे स्टेप्स लक्षात ठेवू शकते (सेशनमध्ये किंवा सेव्ह केलेल्या वर्कफ्लोमध्ये) आणि त्या शेड्यूलनुसार चालवू शकते.
- हे एका स्टेपमधील डेटा दुसऱ्या स्टेपमध्ये पाठवू शकते—जसे कॉपी/पेस्ट करणे, परंतु मनगटावर ताण न येता.
जर तुम्ही कधी मॅक्रो रेकॉर्ड करण्याचा किंवा Selenium स्क्रिप्ट लिहिण्याचा प्रयत्न केला असेल आणि तुम्हाला वाटले असेल की, “मी या ‘नर्डरी’ स्तरासाठी साइन अप केले नाही,” तर Agent Mode हा तुमचा नो-कोड c_cousin आहे जो खऱ्या अर्थाने मदतीला धावतो.
Agent Mode कोणी वापरावे (आणि कोणी वापरू नये)
- तुम्ही: वारंवार वेबची कामे, स्पष्ट पॅटर्न, साधे निर्णय.
- तुम्ही देखील: रिपोर्टसाठी हलका डेटा स्क्रॅपिंग; फॉर्म सबमिशन; मल्टी-स्टेप সিক्वেন্স (sequence).
- कदाचित तुम्ही: हलके ऑथेंटिकेशन (authentication) स्पर्श करणारे लॉग केलेले वर्कफ्लो.
- शक्यतो तुम्ही नाही (अजून): अत्यंत डायनॅमिक ॲप्स जी दर मिलीसेकंदाला री-रेंडर होतात; ज्या साइट्स ऑटोमेशनला आक्रमकपणे ब्लॉक करतात; तुमच्या कम्फर्ट झोनच्या पलीकडील संवेदनशील क्रेडेन्शियल्स (credentials) समाविष्ट असलेले काहीही.
होय, हे शक्तिशाली आहे. नाही, हे जादूगार नाही. हे एका अतिशय सक्षम इंटर्नसारखे आहे—जलद, उत्साही आणि कधीकधी “सबमिट” नावाच्या समान बटणांमुळे गोंधळलेले.
चीट-शीट अवलोकन ()
- ChatGPT Atlas मध्ये Agent Mode सुरू करा.
- तुमचे ध्येय साध्या इंग्रजीमध्ये सांगा.
- सुपरवाईज्ड रन करा: पाहा, दुरुस्त करा आणि स्टेप्स लेबल करा.
- पुन्हा वापरता येण्याऱ्या व्हेरिएबल्ससह (variables) वर्कफ्लो सेव्ह करा.
- शेड्यूल करा किंवा आवश्यकतेनुसार रन करा.
- गार्डरेल्स जोडा: टाइमआउट, रीट्राय नियम आणि फॉलबॅक.
- प्रत्येक गोष्टीचे टॅक्सप्रमाणे लॉगिंग करा.
जर तुम्हाला काहीच आठवत नसेल, तर लक्षात ठेवा: पहिली रन सुपरवाईज करा. ही हंगामापूर्वीची स्प्रिंग ट्रेनिंग आहे.
स्टेप-बाय-स्टेप: वेबची कामे ऑटोमेट करण्यासाठी ChatGPT Atlas मध्ये Agent Mode चा वापर कसा करायचा
1) Agent Mode सुरू करा आणि तुमचे ब्राउझर कनेक्ट करा
- ChatGPT Atlas उघडा आणि Agent Mode शोधा (सामान्यतः डाव्या साइडबारमध्ये किंवा टूल्स/ऑटोमेशन अंतर्गत).
- आवश्यक परवानग्या द्या जेणेकरून ते तुमच्या ब्राउझर टॅब पाहू शकेल आणि त्यांच्याशी संवाद साधू शकेल.
- जर तुमच्या कामांमध्ये लॉगिन समाविष्ट असेल, तर क्रेडेन्शियल्स कसे हाताळायचे ते ठरवा: पासवर्ड मॅनेजर इंजेक्शन, तात्पुरते टोकन किंवा समर्पित कमी- विशेषाधिकार खाते, काहीतरी गडबड झाल्यास तुम्हाला ज्याबद्दल वाईट वाटणार नाही.
प्रो টিপ (tip): तुमचा आत्मविश्वास वाढवण्यासाठी असंवेदनशील साइटने सुरुवात करा. कोणालाही त्यांची पहिली ऑटोमेशन ‘रोडिओ’ पगारामध्ये नको असते.
2) क्लिक्स नव्हे, तर निकालाचे वर्णन करा
Agent Mode ला ध्येये समजतात जसे की: “प्रत्येक सोमवारी सकाळी 9 वाजता, Acme ॲनालिटिक्समध्ये लॉग इन करा, ‘साप्ताहिक व्हिजिटर्स’ CSV डाउनलोड करा, ‘रिपोर्ट्स/2025’ फोल्डरमध्ये Google Drive वर अपलोड करा, त्यानंतर #मार्केटिंग Slack चॅनेलवर सारांश पोस्ट करा.”
मुद्दा हा आहे की तुम्हाला काय करायचे आहे त्याचे वर्णन करा—जसे तुम्ही ते तुमच्या मित्राला समजावत आहात जो हुशार आहे पण त्याने तुमचा स्क्रीन पाहिला नाही. Atlas एक योजना प्रस्तावित करेल: येथे नेव्हिगेट करा, ते क्लिक करा, हे एक्सट्रॅक्ट करा आणि असेच.
प्लान तपासा. जर ते “Twitter उघडा” असे म्हणत असेल आणि तुम्ही “इन्व्हॉइस PDF” मागितले असतील, तर টাইমআউট (timeout) कॉल करा.
3) सुपरवाईज्ड ड्राय रन करा
येथे जादू घडते. Atlas पूर्वावलोकन फलकात (किंवा तुमच्या लाइव्ह ब्राउझरमध्ये) तुम्ही पाहत असताना स्टेप्स कार्यान्वित करण्यास सुरुवात करते. हे क्लिक करण्याचा हेतू असलेले घटक हायलाइट करते, DOM सिलेक्टर्स दर्शवते आणि प्रत्येक स्टेप लॉग करते.
- जर ते बटण चुकीचे ओळखत असेल, तर ते दुरुस्त करा: “‘CSV म्हणून एक्सपोर्ट करा’ लेबल असलेले बटण वापरा—‘PDF म्हणून एक्सपोर्ट करा’ नाही.”
- जर ती एखादी स्टेप चुकवत असेल, तर एक टाका: “लॉगिन केल्यानंतर, एक्सपोर्ट करण्यापूर्वी ‘रिपोर्ट्स > সাপ্তাহিক’ वर नेव्हिगेट करा.”
- जर साइट इनफिनिट স্ক্রোলিং (scrolling) किंवा পেজিনেশন (pagination) वापरत असेल, तर तिला शिकवा: “50 आयटम लोड करण्यासाठी স্ক্রোল (scroll) करा, नंतर ‘Next’ वर क्लिक करा जोपर्यंत पुढील पृष्ठ नाही.”
एखाद्या किशोरवयीन मुलाला गाडी चालवायला शिकवण्यासारखे याचा विचार करा. तुम्ही तुमचे हात स्टेअरिंग व्हीलजवळ ठेवता, तुम्ही স্টপ (stop) সাইন (sign) कुठे आहेत ते दाखवता आणि आशा करता की तिथे गिलहरी नसावी.
4) तुमच्या स्टेप्स लेबल करा, नाव द्या आणि पॅरामीटराईज करा
जेव्हा ड्राय रन यशस्वी होते, तेव्हा “शिप इट!” ओरडण्याचा मोह टाळा. त्याऐवजी, गार्डरेल्स जोडा:
- स्टेप्सला स्पष्टपणे नाव द्या: “लॉगिन,” “साप्ताहिक वर नेव्हिगेट करा,” “CSV एक्सपोर्ट करा,” “Drive वर अपलोड करा,” “Slack वर पोस्ट करा.” भविष्यकाळात तुम्ही भूतकाळातील तुमचे आभार मानाल.
- व्हेरिएबल्स सादर करा: {week_start}, {folder_path}, {channel_name}. आता तुमचा वर्कफ्लो फक्त एकदाच वापरण्यासारखा नाही; तो एक टेम्पलेट आहे.
- व्हर्जन नोट्ससह एक कॉपी সেভ (save) करा: “v1.2 – পেজিনেশন (pagination) आणि टू-ফ্যাক্টর (factor) ডিলে (delay) हाताळते.” तुम्हाला धक्का बसेल की नोट्स मेमरीपेक्षा किती वेळा सरस ठरतात.
5) वास्तविक जगातील त्रास हाताळायला शिकवा
वेब हे एक अराजक सूप आहे. बटणे हलतात. साइट्स तुम्हाला लॉग आउट करतात. पॉप-अप तुम्हाला কুকিজ (cookies) हव्या आहेत का विचारतो (मजेदार नाही). लवचिकता जोडा:
- टाइमआउट आणि रीट्राय: “‘एक्सपोर्ट’ बटणासाठी 10 सेकंद थांबा; वाढवण्यापूर्वी दोनदा रीट्राय करा.”
- कন্ডিশনাল (conditional) শাখা (branch): “जर 2FA दिसला, तर थांबवा आणि मला सूचित करा; अन्यथा सुरू ठेवा.”
- CSS/XPath फॉलबॅक: “प्रथम aria-label वापरून पहा; ते अयशस्वी झाल्यास, रोल/बटण टेक्स्ट कॉम्बो वापरा.”
- স্ট্রাকচার্ড (structured) এক্সট্রাকশন (extraction): “टेबल घ्या, CSV मध्ये रूपांतरित करा आणि सेव्ह करण्यापूर्वी कॉलम हेडर ভ্যালিডেট (validate) करा.”
Atlas चांगले आहे, पण “बंपर्ससह चांगले” असणे अधिक चांगले आहे.
6) तुमचे অটোমেশন (automation) सेव्ह करा, टेस्ट करा आणि शेड्यूल करा
- वर्कफ्लोला मैत्रीपूर्ण नाव द्या: “साप्ताहिक वेब ॲनालिटिक्स एक्सपोर्ट.”
- दुसरी रन करा, अनसुपरवाईज्ड, पण तुम्ही तयार रहा. आउटपुट फोल्डर, फाईल साईज, Slack পোস্ট (post) तपासा.
- शेड्यूल करा: सोमवार, सकाळी 9 वाजता. टाइम झोन (time zone) जाणीवपूर्वक सेट करा—“न्यूयॉर्कमध्ये सकाळी 9” याचा अर्थ खूप वेगळा असतो जर Atlas ला वाटत असेल की तुम्ही रेकजाविकमध्ये राहता.
- यशस्वी आणि अयशस्वी सूचना जोडा: यशासाठी ईमेल, त्रुटींसाठी SMS. आणि होय, तुम्ही अयशस्वी संदेश “Womp womp” असे बनवू शकता.
7) लॉगवर लक्ष ठेवा (तुमचे भविष्य स्वतःच तुमचे अभिनंदन करेल)
Atlas टाइमस्टॅम्प, सिलेक्टर्स आणि স্ক্রিনশট (screenshot) (जर तुम्ही ते सक्षम केले असतील तर) सह प्रत्येक ॲक्शन (action) लॉग करते. जेव्हा काहीतरी तुटते—आणि ते तुटेल, कारण वेबसाइट्स—ते लॉग तुमचे ब्लॅक বক্স (box) रेकॉर्डर (recorder) आहेत.
- ডেল্টাস (deltas) रिव्ह्यू (review) करा: “या आठवड्यात बटण नवीन डायलॉगमध्ये हलवले आहे.”
- सिलेक्टर्स किंवा स्टेप ऑर्डर अपडेट करा.
- समान ইনপুট (input) सह पुन्हा रन करा. ते निश्चित झाले आहे याची पुष्टी करा.
लॉग स्पेलंकिंगचे (spelunking) ते दहा मिनिटे नंतर तुमचे तास वाचवू शकतात.
रिअल-লাইফ (life) ওয়াকথ্রু (walkthrough): ড্যাশবোর্ড (dashboard) থেকে ড্রাইভ (drive) থেকে স্ল্যাক (slack)
चला एक विशिष्ट দৃশ্য चालवूया जे तुम्ही स्वीकारू शकता.
ध्येय: Acme ॲनालिटिक्समधून साप्ताहिक ট্র্যাफिक (traffic) काढा, Google Drive वर अपलोड करा आणि Slack वर सारांश पोस्ट करा.
- प्रॉम्प्ट (prompt): “प्रत्येक सोमवारी, Acme ॲनालिटिक्समध्ये लॉग इन करा, ‘रिपोर्ट्स > সাপ্তাহিক ট্র্যাফিক (traffic)’ उघडा, CSV म्हणून এক্সপোর্ট (export) करा, ‘traffic-{week_start}.csv’ म्हणून Google Drive मधील ‘/Reports/2025’ मध्ये সেভ (save) करा, त्यानंतर #मार्केटिंगवर ‘साप्ताहिक व्हिजिटर्स: X; टॉप রেফেলার (referral): Y’ পোস্ট (post) करा.”
- Atlas প্ল্যান (plan): हे স্টেপ্স (steps) प्रस्तावित करते. तुम्ही रिव्ह्यू (review) करा.
- ড্রাই রান (dry run): हे यशस्वीरित्या লগইন (login) करते पण ‘PDF হিসাবে এক্সপোর্ট (export)’ निवडते. तुम्ही ते दुरुस्त करता आणि CSV বাটণ লেবেল (label) करता. तुम्ही একটি কন্ডিশনাল (conditional) যোগ (add) करता: “ফরম্যাট (format) পছন্দের সাথে মডাল (modal) খুললে, CSV নির্বাচন করুন.”
- ডেটা (data) এক্সট্রাকশন (extraction): তোমরা টেবিলের (table) প্রিভিউ (preview) করো। হেডার্স (headers) [Date, Visitors, Source] হিসাবে আসে। এটা sum(Visitors) এবং টপ (top) Source (সোর্স) হিসাব করতে বলুন।
- আপলোড (upload): তোমার ড্রাইভ (drive) সংযুক্ত করো, একসেস (access) এপ্রুভ (approve) করো, আর ফোল্ডার (folder) পথের ভেরিয়েবল (variable) নির্দিষ্ট করো।
- স্ল্যাক (slack): তুমি একটি ওয়েবহুক (webhook) অথবা এ্যাপ (app) টোকেন (token) পেস্ট (paste) করো। ভেরিয়েবল (variable) দিয়ে মেসেজ (message) ফরম্যাট (format) করো।
- টেস্ট (test): CSV সঠিক ফোল্ডারে যায়। স্ল্যাক (slack) মেসেজ (message): সাপ্তাহিক দর্শক: 32,481; টপ রেফারার (referrer): অর্গানিক (organic)। তুমি তোমার ভিক্টরি (victory) ল্যাপ (lap) করো।
এখন তোমার কাছে একটি সাপ্তাহিক রোবট (robot) আছে। তুমি একটি মাসিক সারসংক্ষেপের জন্য একটি দ্বিতীয় রোবট (robot) যোগ (add) করতে পারো এবং যখন সে ক্যাম্পেইন (campaign) ট্যাগ (tag) করতে ভুলে যায় তখন গ্যারিকে তৃতীয়টি ধাক্কা মারতে পারে (সরি গ্যারি)।
স্মার্ট (smart) ট্রিকস (tricks) যা পরে ঘন্টা বাঁচায়
- বিকল্প নির্বাচক রেকর্ড করুন: যদি কোনো সাইটে (site) ‘এক্সপোর্ট (export)’ এবং ‘ডাউনলোড (download)’ উভয়ই থাকে, তাহলে অগ্রাধিকারের ক্রমের সাথে উভয় ক্যাপচার (capture) করুন।
- টেক্সট (text) আর পজিশন (position) দ্বারা এংকর করুন: “সাপ্তাহিক ট্রাফিকের (traffic) ডানদিকে বাটনে (button) ক্লিক (click) করুন।” ক্লাস (class) পরিবর্তন হলে এটি আশ্চর্যজনকভাবে শক্তিশালী হয়।
- ওয়েটস (waits) ব্যবহার করুন যার একটি অর্থ আছে: টেবিল (table) সারির সংখ্যা > 0 না হওয়া পর্যন্ত অপেক্ষা করুন মানে “4 সেকেন্ড অপেক্ষা করুন”-এর থেকে ভালো।
- আউটপুট (output) ভ্যালিডেট করুন: ফাইল (file) নন-এম্পটি (non-empty)? কলাম (column) নাম মেলে? প্রত্যাশিত সীমার মধ্যে সারির সংখ্যা? পরে ব্যর্থ হওয়ার চেয়ে দ্রুত ব্যর্থ হওয়া ভালো।
- একটি ছোট ডেটা ডিকশনারি তৈরি করুন: প্রতিটি কলামের অর্থ কী, গ্রহণযোগ্য রেঞ্জ (range), তারিখের ফরম্যাট (format)। আপনি বিভ্রাটের সময় নিজেকে ধন্যবাদ জানাবেন।
- কী (key) পৃষ্ঠাগুলোর স্ন্যাপশট (snapshot) তুলুন: যখন সিলেকটর (selector) ভাঙে, তখন স্ক্রিনশট (screenshot) পুরো ফ্লো (flow) পুনরায় না চালিয়ে ঠিক করতে সহায়তা করে।
সাধারণ ভুলগুলো (এবং সেগুলো কিভাবে এড়ানো যায়)
- লুকানো এলিমেন্টস (elements): যদি অ্যাটলাস (atlas) যা দেখতে পাচ্ছে না তাতে ক্লিক (click) করার চেষ্টা করে, তাহলে প্রথমে ভিউতে স্ক্রল (scroll) করুন বা দৃশ্যমান ডুপ্লিকেটে সুইচ (switch) করুন।
- খুব চালাক CSS: ভঙ্গুর সিলেকটরগুলি এড়িয়ে চলুন যেমন “div:nth-child(42)। আইডি (ID), রোল (role) আর টেক্সটের (text) পক্ষ নিন।
- পপ-আপ (pop-up) ব্লকার (blocker): যদি কোনো সাইট (site) নতুন ট্যাবে ডাউনলোড (download) স্পন (spawn) করে, তাহলে অ্যাটলাসকে (atlas) সেই সাইটের জন্য পপ-আপ (pop-up) খুলতে দিন।
- সেশন (session) টাইমআউট (timeout): অ্যাকশন (action) স্টেপসের (steps) কাছে লগইন (login) শিডিউল (schedule) করুন; রান (run) ছোট রাখুন; “তোমাকে লগআউট (logout) করা হয়েছে” সেটা হ্যান্ডেল করুন।
- অ্যান্টি-বট (anti-bot) ওয়ালস (walls): কিছু সাইট (site) অটোমেশন (automation) চায় না। এটিকে হিউম্যান-পেসড (human-paced) আর নৈতিক রাখুন। robots.txt আর সার্ভিসের (service) শর্তাবলী সম্মান করুন।
ডেটা (data) হ্যান্ডেলিং (handling): রুমের (room) প্রাপ্তবয়স্ক হন
- ক্রিডেনশিয়ালস (credentials): কমপক্ষে-সুবিধা সম্পন্ন অ্যাকাউন্ট (account) ব্যবহার করুন। নিয়মিত টোকেন (token) ঘোরান। প্রম্পটের (prompt) মধ্যে হার্ড-কোড (hard-code) পাসওয়ার্ড (password) করবেন না।
- সংবেদনশীল ডেটা (data): লগে (log) এটিকে মাস্ক (mask) করুন। পিআইআই (PII) ফিল্ডের (field) জন্য রেড্যাকশন (redaction) চালু করুন।
- স্টোরেজ (storage): সুরক্ষিত, ব্যাক-আপ (back-up) করা লোকেশনে (location) এক্সপোর্ট (export) রাখুন। যেখানে গুরুত্বপূর্ণ সেখানে এনক্রিপ্ট (encrypt) করুন।
- কমপ্লায়েন্স (compliance): যদি তুমি হেলথকেয়ার (healthcare), ফাইনান্স (finance) অথবা শিক্ষায় থাকো, তাহলে অটোমেট (automate) করার আগে সংক্ষিপ্ত নামের লোকেদের (এইচআইপিএএ (HIPAA), এসওসি (SOC) 2, এফইআরপিএ (FERPA)) সাথে চেক (check) করুন।
হ্যাঁ, নিরাপত্তা স্টেপ (step) যোগ (add) করে। তবে পরিচয় চুরিও করে।
স্কেলিং আপ (scaling up): একটি এজেন্ট (agent) থেকে একটি ছোট দল
একবার তোমার কাছে একটি এজেন্ট (agent) মোড (mode) ওয়ার্কফ্লো (workflow) থাকলে, তুমি আরো চাইবে। কিছু হালকা কাঠামো গ্রহণ করে স্প্যাগেটি বাটি এড়িয়ে চলুন:
- নামকরণ কনভেনশনস (conventions): ডিপার্টমেন্ট (department)-টাস্ক (task)-ফ্রিকোয়েন্সি (frequency), যেমন “Mktg-সাপ্তাহিক ট্র্যাফিক (traffic)-Mon0900।
- পুনরায় ব্যবহারযোগ্য মডিউল (module): একটি মিনি-ওয়ার্কফ্লো তৈরি করুন “Acme-তে লগইন (login) করুন” যা তুমি অন্য কোথাও ইম্পোর্ট (import) করতে পারো।
- সেন্ট্রাল (central) ভেরিয়েবলস (variables): শেয়ার্ড (shared) বিটস (bits) - স্ল্যাক (slack) চ্যানেল (channel), ড্রাইভ (drive) রুট (root) - এক জায়গায় স্টোর (store) করুন।
- ভার্সনিং (versioning): “v1.4 দুটি ফ্যাক্টর (factor) পজ (pause) যোগ (add) করে।” ওয়ার্কফ্লো (workflow) নোটে চ্যাঞ্জেলগ (changelog) রাখুন।
- হেলথ (health) ড্যাশবোর্ড (dashboard): একটি এক-পেজের (page) যা শেষ রান (run) স্ট্যাটাস (status), সময়কাল এবং পরবর্তী শিডিউল (schedule) দেখায়। এমনকি একটি স্প্রেডশিটও কাজ করে।
তোমার ভবিষ্যত ব্যাপক অটোমেশন (automation) প্ল্যাটফর্ম (platform) অভিনব হতে পারে। তোমার প্রথমটি পরিপাটি আর বিরক্তিকর হতে পারে। বিরক্তিকর ভালো।
সমস্যা সমাধান সাইডবার (sidebar)
- “এটি ভুল বাটনে (button) ক্লিক (click) করে।”
টেক্সট (text), এরিয়া-লেবেল (aria-label) অথবা প্রতিবেশী এলিমেন্ট (element) দ্বারা দ্ব্যর্থতা যোগ (add) করুন। অথবা একটি পূর্ববর্তী স্টেপ (step) যোগ (add) করুন: “সাপ্তাহিক ট্রাফিকের (traffic) পাশের কাবাব মেনু খুলুন, তারপর ‘CSV এক্সপোর্ট (export) করুন’ নির্বাচন করুন।”
- “পৃষ্ঠা পুনরায় রেন্ডার (render) হতেই থাকে।”
ইভেন্ট-ভিত্তিক ট্রিগারগুলিতে ওয়েট (wait) সুইচ (switch) করুন: “এলিমেন্টের (element) জন্য অপেক্ষা করুন যার রোল (role)=প্রগ্রেসবার (progressbar) অদৃশ্য হয়ে গেছে” অথবা “এক্সএইচআর (XHR) ‘/api/report’ শেষ হওয়ার জন্য অপেক্ষা করুন।”
- “ডাউনলোড (download) খালি।”
এক্সপোর্ট (export) করার আগে টেবিল (table) সারির সংখ্যা ভ্যালিডেট (validate) করুন; জিরো (zero) হলে পুনরায় চেষ্টা করুন। কিছু সাইটের (site) পপুলেট (populate) করার আগে একটি “রিফ্রেশ (refresh)” বা তারিখ-রেঞ্জ (range) ফিলের (fill) প্রয়োজন।
- “2FA সবকিছু নষ্ট করে দেয়।”
উচ্চ-নিরাপত্তা সাইটের (site) জন্য, একটি সুপারভাইজড (supervised) স্টেপ (step), এ্যাপ (app)-নির্দিষ্ট টোকেন (token) অথবা টাইম-বক্সড (time-boxed) সেশন (session) বিবেচনা করুন। অথবা মেনে নিন যে কিছু কাজ এখনও কার্বন-ভিত্তিক জীবন দ্বারা আরও ভালভাবে করা হয়।
<a0>Sider.AI -এ একটি দ্রুত শব্দ
</a0>এখানে একটি সারপ্রাইজ (surprise): Sider.AI এই স্যান্ডবক্সে (sandbox) ভালোভাবে কাজ করে। যদি তোমার দিন ব্রাউজারের (browser) ভিতরে কাটে — ভেন্ডর (vendor) গবেষণা, প্রতিযোগিতামূলক বুদ্ধিমত্তা নিষ্কাশন, লম্বা পৃষ্ঠা সংক্ষিপ্ত করা — Sider এর সাইডবার (sidebar) প্রম্পট (prompt) ড্রাফট (draft) করতে, পৃষ্ঠা সংক্ষিপ্ত করতে এবং এজেন্ট (agent) মোডে (mode) হস্তান্তর করার আগে স্ক্র্যাপ (scrap) করা কন্টেন্ট (content) স্ট্রাকচার (structure) করতে পারে ChatGPT Atlas। আমার প্রিয় ট্রিক (trick): Sider ব্যবহার করে পরিষ্কার এক্সট্রাকশন (extraction) নিয়ম তৈরি করুন (“H2 ‘মূল্য’ সন্ধান করুন, তারপর প্রথম টেবিল ক্যাপচার (capture) করুন”) এবং সরাসরি স্টেপ (step) নির্দেশিকা হিসাবে পেস্ট (paste) করুন। এটি নিখুঁত নয়, তবে যখন আপনি এটিকে যা তৈরির জন্য তৈরি করা হয়েছে সেদিকে নির্দেশ করেন - অগোছালো ওয়েব (web) তথ্য পরিপাটি করা - তখন এটি আপনার রোবটের (robot) জন্য একজন সম্পাদক নিয়োগ করার মতো মনে হয়। অ্যাডভান্সড (advanced) মুভস (moves): ব্রাঞ্চিং (branching), লুপস (loops) এবং ডেটা (data) জয়েনস (joins)
একবার তুমি স্বচ্ছন্দ হয়ে গেলে, তুমি সম্পূর্ণ প্রোগ্রামার (programmer) না হয়েও অভিনব কিছু করতে পারো।
- শাখা: “যদি রিপোর্টের (report) ধরণ ‘মাসিক’ হয়, তবে একটি ভিন্ন তারিখের রেঞ্জ (range) প্রয়োগ করুন।”
- লুপস (loops): “এই টেবিলের (table) প্রতিটি সারির জন্য, বিবরণ খুলুন, আইডি (ID) কপি করুন এবং একটি স্প্রেডশিটে যুক্ত করুন।”
- জয়েনস (joins): “স্ক্র্যাপ (scrap) করা এসকেইউ (SKU) কে একটি গুগল (google) শিটের (sheet) বিপরীতে ক্রস-চেক (cross-check) করুন; ইতিমধ্যে দেখা আইটেম (item) এড়িয়ে যান।”
- থ্রটলিং (throttling): “প্রতি মিনিটে ৩০টি অ্যাকশনে (action) সীমাবদ্ধ করুন।” তোমাকে রেট (rate) লিমিটের (limit) সাথে - আর সাইট অ্যাডমিনের (admin) সাথে বন্ধুত্বপূর্ণ রাখে।
এগুলো শুনতে টেকনিক্যাল (technical) লাগে। এগুলো আসলে শুধু রেসিপি (recipe): “যদি এটা হয়, তাহলে ওটা করো, শেষ না হওয়া পর্যন্ত পুনরাবৃত্তি করো।”
যখন এজেন্ট (agent) মোড (mode) ভুল টুল (tool)
- ওয়ান-অফ (one-off) গবেষণা যেখানে প্রতিটি পৃষ্ঠা আলাদা? ম্যানুয়াল (manual) প্লাস (plus) Sider এর সারসংক্ষেপকারী দ্রুত হতে পারে।
- যে সাইটগুলি তাদের শর্তাবলীতে অটোমেশন (automation) নিষিদ্ধ করে? তার প্রতি সম্মান দিন।
- এমন কিছু যার জন্য রায় ঘোষণার প্রয়োজন হয় যেমন “এটাকে স্প্যাম (spam) মন্তব্য মনে হচ্ছে?”— আপনি ট্রায়াজ (triage) অটোমেট (automate) করতে পারেন, তবে চূড়ান্ত কলের (call) জন্য লুপে (loop) একজন মানুষ রাখুন।
নিজের যুদ্ধ বেছে নাও। অটোমেশন (automation) সেখানে ব্যবহার করো যেখানে প্যাটার্ন (pattern) বিরক্তিকর এবং পুনরাবৃত্তিযোগ্য। মজার, নরম, মানুষের জিনিস নিজের জন্য রাখো।
নিরাপত্তা জাল: ব্যর্থতাও যেন বিরক্তিকর হয়
- সার্কিট (circuit) ব্রেকার (breaker): যদি ১৫ মিনিটের মধ্যে ৩টির বেশি ব্যর্থতা ঘটে, তাহলে শিডিউল (schedule) থামিয়ে দাও এবং তোমাকে সতর্ক করো।
- রোলব্যাক (rollback): যদি একটি আপলোড (upload) ব্যর্থ হয়, তাহলে আংশিক ফাইল (file) মুছে দাও; যদি একটি পোস্ট (post) ব্যর্থ হয়, তাহলে ডাবল (double)-পোস্ট (post) এড়িয়ে যাও।
- হার্টবিট (heartbeat): প্রতিদিন “আমি জীবিত আছি” পিং (ping) করো যাতে তুমি জানতে পারো যে তোমার রোবট (robot) জেগে আছে - এমনকি যখন করার মতো কিছুই নেই।
তোমার একটি কন্ট্রোল (control) রুমের (room) প্রয়োজন নেই। তোমার কয়েকটি ভাল অভ্যাসের প্রয়োজন।
কুইক-স্টার্ট (quick-start) টেমপ্লেট (template) যা তুমি চুরি করতে পারো
এই প্রম্পট (prompt) কঙ্কালটি ChatGPT Atlas এজেন্ট (agent) মোডে (mode) কপি (copy) করো এবং ফাঁকা স্থান পূরণ করো:
লক্ষ্য: প্রতি [সপ্তাহের দিন] এ [সময় অঞ্চল/সময়], [সাইট URL] এ লগইন (login) করুন, [পথ] এ নেভিগেট (navigate) করুন, তারিখের রেঞ্জ (range) [রেঞ্জ (range)] এ সেট (set) করুন, [ফরম্যাট (format)] এক্সপোর্ট (export) করুন, ভ্যালিডেট (validate) করুন যে [কলাম] বিদ্যমান এবং সারির সংখ্যা > [N], তারপর [ফোল্ডার] এ [স্টোরেজ (storage)] এ আপলোড (upload) করুন, যার নাম [ফাইলের (file) নামের প্যাটার্ন (pattern)]। যদি এক্সপোর্ট (export) ব্যর্থ হয়, তাহলে [গণনা] পুনরায় চেষ্টা করুন; এখনও ব্যর্থ হলে, [চ্যানেল (channel)] এর মাধ্যমে সতর্ক করুন। এমন নির্বাচক ব্যবহার করুন যা এরিয়া-লেবেল (aria-label), রোল (role) এবং দৃশ্যমান পাঠকে অগ্রাধিকার দেয়। এগিয়ে যাওয়ার আগে [স্পিনার (spinner)/এলিমেন্ট (element)] অদৃশ্য হওয়ার জন্য অপেক্ষা করুন। লগে (log) থাকা যেকোনো [পিআইআই (PII)] রিডাক্ট (redact) করুন।
প্রশিক্ষণ চাকা দিয়ে একবার চালান। টলমলানি ঠিক করুন। সেভ (save) করুন। শিডিউল (schedule) করুন। হাসুন।
মোড়ানো: তোমার ব্রাউজার (browser), এখন বিপরীত থাম্বস (thumbs) সহ
ChatGPT Atlas-এর এজেন্ট (agent) মোড (mode) তোমার ট্যাক্স (tax) করবে না বা তোমার কুকুরকে হাঁটাবে না। তবে এটি অবশ্যই বিরক্তিকর ওয়েব (web) কাজ থেকে ঝাঁকুনি নেবে: এক্সপোর্ট (export), আপলোড (upload), কপি (copy)-পেস্ট (paste), “১৭ বার নেক্সট (next) ক্লিক (click) করার” বাজে কথা যা তোমার সকাল চুরি করে। ছোট করে শুরু করো, ফলাফলের বর্ণনা দাও, প্রথম রান (run) সুপারভাইস (supervise) করো এবং এটিকে স্থিতিস্থাপক রাখতে যথেষ্ট গার্ডরেল যোগ (add) করো।
কিছুক্ষণের মধ্যেই তোমার কাছে ব্রাউজার (browser) রোবটের (robot) একটি পরিপাটি ছোট দল থাকবে। তারা বেতনের জন্য জিজ্ঞাসা করবে না। তারা অসুস্থ কল (call) করবে না। এবং তারা, ধন্য, তোমাকে সেই কাজের জন্য আরও বেশি সময় দেবে যা আসলে তোমার মস্তিষ্কের প্রয়োজন।
শেষ কথা: সেই দিনের জন্য একটি ডোনাট (donut) বাজেট (budget) রাখুন যেদিন তুমি তোমার দলকে দেখাবে যে সাপ্তাহিক রিপোর্টগুলি এখন কীভাবে নিজেদের করে। তুমি হিরো (hero) হবে। আর রোবটরা (robot) তাতে কিছু মনে করবে না।
FAQ
প্রশ্ন ১: ওয়েব (web) অটোমেশনের (automation) জন্য আমি ChatGPT Atlas-এ এজেন্ট (agent) মোড (mode) কিভাবে শুরু করব?
ChatGPT Atlas খুলুন, এজেন্ট (agent) মোড (mode) সক্ষম করুন এবং ব্রাউজারের (browser) অনুমতি দিন। তোমার লক্ষ্য সাধারণ ইংরেজিতে বর্ণনা করুন (প্রতিটি ক্লিক (click) নয়), তারপর ওয়ার্কফ্লো (workflow) সেভ (save) করার আগে স্টেপ (step) সংশোধন করতে একটি সুপারভাইজড (supervised) ড্রাই রান (dry run) করুন।
প্রশ্ন ২: ChatGPT Atlas-এর এজেন্ট (agent) মোড (mode) লগইন (login) এবং 2FA হ্যান্ডেল (handle) করতে পারে?
হ্যাঁ, এজেন্ট (agent) মোড (mode) লগইন (login) করতে পারে এবং পৃষ্ঠার জন্য অপেক্ষা করতে পারে, তবে 2FA-এর প্রায়শই একটি হিউম্যান (human) ট্যাপ (tap) অথবা একটি এ্যাপ (app) টোকেনের (token) প্রয়োজন হয়। একটি কন্ডিশনাল (conditional) স্টেপ (step) যোগ (add) করুন: 2FA-তে থামুন এবং তোমাকে অবহিত করুন, তারপর তুমি অনুমোদন করার পরে চালিয়ে যান।
প্রশ্ন ৩: কি ধরনের ওয়েব (web) টাস্ক (task) ChatGPT Atlas-এর এজেন্ট (agent) মোডের (mode) জন্য সেরা?
পুনরাবৃত্তিমূলক, অনুমানযোগ্য ওয়ার্কফ্লো (workflow): রিপোর্ট (report) এক্সপোর্ট (export) করা, ফর্ম পূরণ করা, টেবিল (table) স্ক্র্যাপ (scrap) করা এবং সারসংক্ষেপ পোস্ট (post) করা। যদি সাইটের (site) লেআউট (layout) স্থিতিশীল থাকে এবং তোমার স্টেপ (step) সাপ্তাহিকভাবে পুনরাবৃত্তি হয়, তাহলে এজেন্ট (agent) মোড (mode) উজ্জ্বল হয়।
প্রশ্ন ৪: আমি কিভাবে আমার এজেন্ট (agent) মোডের (mode) ওয়ার্কফ্লোকে (workflow) আরও নির্ভরযোগ্য করব?
শক্তিশালী নির্বাচক (এরিয়া-লেবেল (aria-label), রোল (role), দৃশ্যমান টেক্সট (text)), ইভেন্ট-ভিত্তিক ওয়েট (wait), রিট্রাইস (retries) এবং কলামের (column) নাম বা সারির সংখ্যা পরীক্ষা করার মতো স্পষ্ট বৈধতা ব্যবহার করুন। লগ (log) এবং ভার্সন (version) নোট (note) রাখুন যাতে ফিক্সগুলি কয়েক মিনিটে হয়, কয়েক ঘন্টায় নয়।
Q5: ChatGPT Atlas मध्ये Agent Mode सह Sider.AI उपयुक्त आहे का?
होय—Agent Mode कडे कामे सोपवण्यापूर्वी प्रॉम्प्ट्सचा मसुदा तयार करण्यासाठी, लांब पानांचा सारांश देण्यासाठी आणि स्वच्छ एक्सट्रॅक्शन नियम तयार करण्यासाठी Sider.AI चा साइडबार खूप चांगला आहे. हे जादू नाही, परंतु गोंधळलेल्या वेब माहितीसाठी हे एक उपयुक्त सह-पायलट आहे.