ভূমিকা: যখন আপনার ব্রাউজার একজন অতিরিক্ত কৌতূহলী ব্যক্তি হয়ে ওঠে
কখনও কি নিজেকে প্রতিদিন সকালে একই পাঁচটি ক্লিক করতে দেখেছেন—সেলস ড্যাশবোর্ড খোলা, CSV এক্সপোর্ট করা, স্প্রেডশীটে পেস্ট করা, বসকে ইমেল করা—এবং ভেবেছেন, “নিশ্চয়ই কম্পিউটারগুলো আমাকে দেখে হাসছে”? আমিও। আমাদেরকে এত দিন ধরে অটোমেশনের প্রতিশ্রুতি দেওয়া হয়েছে যে “সেট ইট অ্যান্ড ফরগেট ইট” শব্দটা ডায়েট বিজ্ঞাপনের মতো শোনায়।
এখানেই ChatGPT Atlas-এ প্রবেশ করে Agent Mode—এই ফিচারটি দাবি করে যে এটি আপনার ওয়েবের কাজগুলো করে দিতে পারে, অনেকটা আপনার ব্রাউজারে বসবাস করা একটি ভদ্র রোবট সহকারীর মতো। এটা কোনো সায়েন্স ফিকশন ফ্যান্টাসি নয়; একটি বাস্তব, সামান্য জাদুকরী, মাঝে মাঝে খিটখিটে সাহায্যকারী যা ফর্ম পূরণ করতে, পেজ স্ক্র্যাপ করতে, ডেটা ক্রস-রেফারেন্স করতে, এমনকি আপনি কফি খেতে খেতে এবং “কৌশল”-এর উপর কঠোর পরিশ্রম করার ভান করতে করতে কাজগুলো লুপ করতে পারে।
এই গাইডে, আমি আপনাদের দেখাবো কিভাবে আপনার ওয়েবের কাজগুলো স্বয়ংক্রিয় করতে ChatGPT Atlas-এ Agent Mode ব্যবহার করতে হয়—এর পাশাপাশি এটি কিসে দারুণ, কোথায় মুখ থুবড়ে পড়ে এবং গিয়ারগুলো সচল রাখতে আপনি কোন ছোটখাটো আচার-অনুষ্ঠানগুলো গ্রহণ করতে চাইবেন। এটিকে একটি খুব স্মার্ট শফারের জন্য আপনার ড্রাইভার্স এড হিসেবে মনে করুন।
ChatGPT Atlas-এ Agent Mode আসলে কী?
Agent Mode হল ChatGPT Atlas-এর একটি ব্রাউজার-সংযুক্ত বৈশিষ্ট্য যা উচ্চ-স্তরের নির্দেশাবলী নিতে পারে—“আমার অ্যানালিটিক্স সাইটে লগইন করুন, সাপ্তাহিক ট্র্যাফিক নিন এবং Slack-এ হাইলাইটগুলি পোস্ট করুন”—এবং সেগুলোকে ক্রিয়াকলাপের একটি শৃঙ্খলে পরিণত করতে পারে: নেভিগেট করা, ক্লিক করা, টাইপ করা, স্ক্র্যাপ করা, সেভ করা এবং পুনরাবৃত্তি করা। আপনি যখন কোনো ল্যাব ইঁদুরের মতো ওয়েবসাইটগুলোতে ক্নিক করে পুরস্কার পাওয়ার জন্য লিভার চাপেন, তার পরিবর্তে Agent Mode লিভার-চাপানোতে পরিণত হয়।
- এটি পেজ পড়তে, বোতামে ক্লিক করতে, ফর্ম পূরণ করতে, পেজিনেশন অনুসরণ করতে এবং ফাইল এক্সপোর্ট করতে পারে।
- এটি ধাপগুলো মনে রাখতে পারে (একটি সেশন বা একটি সংরক্ষিত ওয়ার্কফ্লোর মধ্যে) এবং সেগুলোকে একটি সময়সূচী অনুযায়ী চালাতে পারে।
- এটি এক ধাপ থেকে অন্য ধাপে ডেটা পাস করতে পারে—যেমন কপি/পেস্ট করা, কিন্তু কব্জির স্ট্রেন ছাড়াই।
আপনি যদি কখনও কোনো ম্যাক্রো রেকর্ড করার বা Selenium স্ক্রিপ্ট লেখার চেষ্টা করে থাকেন এবং ভেবে থাকেন, “আমি এই পর্যায়ের nerdery-এর জন্য সাইন আপ করিনি,” তাহলে Agent Mode হল নো-কোড কাজিন যে আসলে স্থানান্তরের দিন উপস্থিত হয়।
Agent Mode কে ব্যবহার করা উচিত (এবং কার করা উচিত নয়)
- আপনি: পুনরাবৃত্তিমূলক ওয়েব কাজ, সুস্পষ্ট প্যাটার্ন, সরল সিদ্ধান্ত শাখা।
- আপনিও: রিপোর্টের জন্য হালকা ডেটা স্ক্র্যাপিং; ফর্ম জমা দেওয়া; বহু-ধাপের ক্রম।
- হয়তো আপনি: লগ করা ওয়ার্কফ্লো যা হালকা প্রমাণীকরণ স্পর্শ করে।
- সম্ভবত আপনি নন (এখনও): অত্যন্ত গতিশীল অ্যাপ যা প্রতি মিলিসেকেন্ডে পুনরায় রেন্ডার হয়; যে সাইটগুলো আগ্রাসীভাবে অটোমেশন ব্লক করে; সংবেদনশীল প্রমাণপত্র জড়িত এমন কিছু যা আপনার স্বস্তির অঞ্চলের বাইরে।
হ্যাঁ, এটি শক্তিশালী। না, এটি কোনো জাদুকর নয়। এটি বরং একজন খুব সক্ষম ইন্টার্নের মতো—দ্রুত, উত্সাহী এবং মাঝে মাঝে “Submit” নামের অভিন্ন বোতাম দেখে বিভ্রান্ত।
চিট-শীট ওভারভিউ ()
- ChatGPT Atlas-এ Agent Mode চালু করুন।
- আপনার লক্ষ্য সহজ ইংরেজিতে বর্ণনা করুন।
- একটি তত্ত্বাবধানে চালান করুন: দেখুন, সংশোধন করুন এবং ধাপগুলো লেবেল করুন।
- পুনরায় ব্যবহারযোগ্য ভেরিয়েবল সহ ওয়ার্কফ্লো সংরক্ষণ করুন।
- এটি শিডিউল করুন, অথবা প্রয়োজনে Run-এ ক্লিক করুন।
- গার্ডরেইল যোগ করুন: টাইমআউট, পুনরায় চেষ্টা করার নিয়ম এবং ফলব্যাক।
- আপনার ট্যাক্সের মতো সবকিছু লগ করুন।
যদি অন্য কিছু মনে নাও থাকে, তবে মনে রাখবেন: প্রথম রানটি তত্ত্বাবধান করুন। এটি মৌসুমের আগে স্প্রিং ট্রেনিং।
ধাপে ধাপে: ওয়েব টাস্ক স্বয়ংক্রিয় করতে ChatGPT Atlas-এ Agent Mode কীভাবে ব্যবহার করবেন
১) Agent Mode চালু করুন এবং আপনার ব্রাউজার কানেক্ট করুন
- ChatGPT Atlas খুলুন এবং Agent Mode সনাক্ত করুন (সাধারণত বাম সাইডবারে বা Tools/Automation-এর অধীনে)।
- প্রয়োজনীয় অনুমতি দিন যাতে এটি আপনার ব্রাউজার ট্যাবগুলো দেখতে এবং সেগুলোর সাথে ইন্টারঅ্যাক্ট করতে পারে।
- যদি আপনার কাজগুলোতে লগইন জড়িত থাকে, তাহলে আপনি কীভাবে প্রমাণপত্র পরিচালনা করবেন তা স্থির করুন: পাসওয়ার্ড ম্যানেজার ইনজেকশন, অস্থায়ী টোকেন বা একটি ডেডিকেটেড নিম্ন-সুবিধা অ্যাকাউন্ট যা খারাপ কিছু ঘটলে আপনি আপসোস করবেন না।
প্রো টিপ: আপনার আত্মবিশ্বাস তৈরি করতে একটি অ-সংবেদনশীল সাইট দিয়ে শুরু করুন। কেউ চায় না যে তাদের প্রথম অটোমেশন রোডিওতে পে-রোল জড়িত থাকুক।
২) ফলাফলের বর্ণনা দিন, ক্লিকে নয়
Agent Mode এই ধরনের লক্ষ্যগুলো বুঝতে পারে: “প্রতি সোমবার সকাল ৯টায়, Acme Analytics-এ লগইন করুন, ‘Weekly Visitors’ CSV ডাউনলোড করুন, ‘Reports/2025’ ফোল্ডারে Google Drive-এ আপলোড করুন, তারপর #marketing Slack চ্যানেলে একটি সারসংক্ষেপ পোস্ট করুন।”
বিষয়টি হল আপনি কী করতে চান তা বর্ণনা করা—যেন আপনি এটি এমন একজন বন্ধুকে বলছেন যে স্মার্ট কিন্তু আপনার স্ক্রিন দেখেনি। Atlas একটি পরিকল্পনা প্রস্তাব করবে: এখানে নেভিগেট করুন, ওটাতে ক্লিক করুন, এটা বের করুন, ইত্যাদি।
পরিকল্পনাটি যাচাই করুন। যদি এটি বলে “Twitter খুলুন” এবং আপনি “ইনভয়েস PDF” চেয়ে থাকেন, তাহলে একটি টাইমআউট কল করুন।
৩) একটি তত্ত্বাবধানে ড্রাই রান করুন
এখানেই জাদু ঘটে। Atlas একটি প্রিভিউ প্যানে (বা আপনার লাইভ ব্রাউজারে) দেখার সময় ধাপগুলো কার্যকর করা শুরু করে। এটি ক্লিক করার উদ্দেশ্যে করা উপাদানগুলোকে হাইলাইট করে, DOM নির্বাচক দেখায় যা এটি খুঁজে পেয়েছে এবং প্রতিটি ধাপ লগ করে।
- যদি এটি কোনো বোতামকে ভুলভাবে শনাক্ত করে, তাহলে এটি সংশোধন করুন: “‘Export as CSV’ লেবেলযুক্ত বোতামটি ব্যবহার করুন—‘Export as PDF’ নয়।”
- যদি এটি কোনো ধাপ মিস করে, তাহলে একটি ঢোকান: “লগইনের পরে, এক্সপোর্ট করার আগে ‘Reports > Weekly’-তে নেভিগেট করুন।”
- যদি সাইটটি অসীম স্ক্রলিং বা পেজিনেশন ব্যবহার করে, তাহলে এটিকে শেখান: “৫০টি আইটেম লোড করতে স্ক্রোল করুন, তারপর ‘Next’-এ ক্লিক করুন যতক্ষণ না কোনো পরবর্তী পেজ না থাকে।”
এটিকে একজন কিশোরকে গাড়ি চালানো শেখানোর মতো মনে করুন। আপনি চাকার কাছে হাত রাখেন, আপনি স্টপ সাইনগুলো কোথায় আছে তা দেখিয়ে দেন এবং আপনি আশা করেন যে সেখানে কোনো কাঠবিড়ালি নেই।
৪) লেবেল, নামকরণ এবং আপনার ধাপগুলো প্যারামিটারাইজ করুন
যখন ড্রাই রান কাজ করে, তখন “Ship it!” বলে চিৎকার করার লোভ সামলান। পরিবর্তে, গার্ডরেইল যোগ করুন:
- ধাপগুলোর স্পষ্টভাবে নামকরণ করুন: “Login,” “Navigate to Weekly,” “Export CSV,” “Upload to Drive,” “Post to Slack.” ভবিষ্যতের আপনি অতীতের আপনাকে ধন্যবাদ জানাবেন।
- ভেরিয়েবল প্রবর্তন করুন: {week_start}, {folder_path}, {channel_name}। এখন আপনার ওয়ার্কফ্লো কোনো ওয়ান-অফ নয়; এটি একটি টেমপ্লেট।
- সংস্করণ নোট সহ একটি কপি সংরক্ষণ করুন: “v1.2 – পেজিনেশন এবং দুই-ফ্যাক্টর বিলম্ব পরিচালনা করে।” আপনি অবাক হবেন যে নোটগুলো কত ঘন ঘন স্মৃতিকে হার মানায়।
৫) বাস্তব-বিশ্বের বিরক্তিগুলো পরিচালনা করতে এটিকে শেখান
ওয়েব একটি বিশৃঙ্খল স্যুপ। বোতাম সরে যায়। সাইট আপনাকে লগ আউট করে দেয়। একটি পপ-আপ জিজ্ঞাসা করে যে আপনি কুকি চান কিনা (মজার ধরনের নয়)। স্থিতিস্থাপকতা যোগ করুন:
- টাইমআউট এবং পুনরায় চেষ্টা: “‘Export’ বোতামের জন্য ১০ সেকেন্ড পর্যন্ত অপেক্ষা করুন; বাড়ানোর আগে দুবার পুনরায় চেষ্টা করুন।”
- শর্তসাপেক্ষ শাখা: “যদি 2FA প্রদর্শিত হয়, তাহলে থামুন এবং আমাকে জানান; অন্যথায় চালিয়ে যান।”
- CSS/XPath ফলব্যাক: “প্রথমে aria-label চেষ্টা করুন; যদি তা ব্যর্থ হয়, তাহলে role/button text কম্বো ব্যবহার করুন।”
- গঠনমূলক নিষ্কাশন: “টেবিলটি ধরুন, CSV-তে রূপান্তর করুন এবং সংরক্ষণ করার আগে কলাম হেডারগুলো যাচাই করুন।”
Atlas ভালো, তবে “bumpers সহ ভালো” আরও ভালো।
৬) আপনার অটোমেশন সংরক্ষণ, পরীক্ষা এবং শিডিউল করুন
- একটি বন্ধুত্বপূর্ণ নাম দিয়ে ওয়ার্কফ্লো সংরক্ষণ করুন: “Weekly Web Analytics Export.”
- দ্বিতীয় রানটি তত্ত্বাবধানহীনভাবে করুন, তবে আপনি পাশে থাকুন। আউটপুট ফোল্ডার, ফাইলের আকার, Slack পোস্ট পরীক্ষা করুন।
- এটি শিডিউল করুন: সোমবার, সকাল ৯টা। ইচ্ছাকৃতভাবে সময় অঞ্চল সেট করুন—“নিউ ইয়র্কের সকাল ৯টা” মানে অনেক আলাদা কিছু যদি Atlas মনে করে যে আপনি রিকজাভিকে বাস করেন।
- সাফল্য এবং ব্যর্থতার বিজ্ঞপ্তি যোগ করুন: সাফল্যের জন্য ইমেল, ত্রুটির জন্য SMS। এবং হ্যাঁ, আপনি ব্যর্থতার বার্তাগুলোকে “Womp womp” বলতে পারেন।
৭) লগগুলোর দিকে নজর রাখুন (আপনার ভবিষ্যতের আপনি আপনাকে আলিঙ্গন করবে)
Atlas টাইমস্ট্যাম্প, নির্বাচক এবং স্ক্রিনশট (যদি আপনি সেগুলো সক্রিয় করেন) সহ প্রতিটি অ্যাকশন লগ করে। যখন কিছু ভেঙে যায়—এবং তা হবে, কারণ ওয়েবসাইটগুলো—তখন সেই লগগুলো আপনার ব্ল্যাক বক্স রেকর্ডার।
- ডেল্টা পর্যালোচনা করুন: “এই সপ্তাহে বোতামটি একটি নতুন ডায়ালগে সরানো হয়েছে।”
- নির্বাচক বা ধাপের ক্রম আপডেট করুন।
- একই ইনপুট দিয়ে পুনরায় চালান করুন। নিশ্চিত করুন যে এটি ঠিক করা হয়েছে।
লগ স্পেলঙ্কিংয়ের সেই দশ মিনিট পরে আপনার কয়েক ঘন্টা বাঁচাতে পারে।
বাস্তব জীবনের ওয়াকথ্রু: ড্যাশবোর্ড থেকে ড্রাইভ থেকে Slack
আসুন একটি কংক্রিট দৃশ্য চালাই যা আপনি মানিয়ে নিতে পারেন।
লক্ষ্য: Acme Analytics থেকে সাপ্তাহিক ট্র্যাফিক পুল করুন, Google Drive-এ আপলোড করুন এবং Slack-এ একটি সারসংক্ষেপ পোস্ট করুন।
- প্রম্পট: “প্রতি সোমবার, Acme Analytics-এ লগইন করুন, ‘Reports > Weekly Traffic’ খুলুন, CSV হিসেবে এক্সপোর্ট করুন, ‘traffic-{week_start}.csv’ হিসেবে Google Drive-এ ‘/Reports/2025’-এ সেভ করুন, তারপর ‘সাপ্তাহিক ভিজিটর: X; শীর্ষ রেফেলার: Y’ #marketing-এ পোস্ট করুন।”
- Atlas পরিকল্পনা: এটি ধাপ প্রস্তাব করে। আপনি পর্যালোচনা করেন।
- ড্রাই রান: এটি সফলভাবে লগইন করে কিন্তু ‘Export as PDF’ নির্বাচন করে। আপনি এটি সংশোধন করেন এবং CSV বোতাম লেবেল করেন। আপনি একটি শর্ত যোগ করেন: “যদি ফরম্যাট পছন্দ সহ মোডাল খোলে, তাহলে CSV নির্বাচন করুন।”
- ডেটা নিষ্কাশন: আপনি টেবিলের প্রিভিউ করেন। হেডারগুলো [Date, Visitors, Source] হিসেবে আসে। আপনি এটিকে sum(Visitors) এবং শীর্ষ Source গণনা করতে বলেন।
- আপলোড: আপনি আপনার ড্রাইভ কানেক্ট করেন, অ্যাক্সেস অনুমোদন করেন এবং ফোল্ডারের পাথ ভেরিয়েবল নির্দিষ্ট করেন।
- Slack: আপনি একটি ওয়েবহুক বা অ্যাপ টোকেন পেস্ট করেন। আপনি ভেরিয়েবল দিয়ে বার্তাটি ফরম্যাট করেন।
- পরীক্ষা: CSV সঠিক ফোল্ডারে ল্যান্ড করে। Slack বার্তা: “সাপ্তাহিক ভিজিটর: 32,481; শীর্ষ রেফেলার: অর্গানিক।” আপনি আপনার বিজয় উদযাপন করেন।
এখন আপনার কাছে একটি সাপ্তাহিক রোবট আছে। আপনি মাসিক সারসংক্ষেপের জন্য একটি দ্বিতীয় রোবট এবং গ্যারিকে তার ক্যাম্পেইন ট্যাগ করতে ভুলে গেলে তাকে ঠেলা দেওয়ার জন্য একটি তৃতীয় রোবট যোগ করতে পারেন। (দুঃখিত, গ্যারি।)
স্মার্ট কৌশল যা পরে কয়েক ঘন্টা বাঁচায়
- বিকল্প নির্বাচক রেকর্ড করুন: যদি কোনো সাইটে ‘Export’ এবং ‘Download’ উভয়ই থাকে, তাহলে অগ্রাধিকার ক্রম সহ উভয়ই ক্যাপচার করুন।
- টেক্সট এবং অবস্থান দ্বারা অ্যাঙ্কর করুন: “‘Weekly Traffic’-এর ডানদিকের বোতামে ক্লিক করুন।” ক্লাস পরিবর্তন হলে এটি আশ্চর্যজনকভাবে শক্তিশালী।
- এমন অপেক্ষা ব্যবহার করুন যার অর্থ আছে: “টেবিল রো গণনা > 0 না হওয়া পর্যন্ত অপেক্ষা করুন” “৪ সেকেন্ড অপেক্ষা করুন” এর চেয়ে ভালো।
- আউটপুট যাচাই করুন: ফাইলটি অ-খালি? কলামের নাম মেলে? প্রত্যাশিত সীমার মধ্যে সারির সংখ্যা? পরে ব্যর্থ হওয়ার চেয়ে দ্রুত ব্যর্থ হওয়া ভালো।
- একটি ছোট ডেটা ডিকশনারি তৈরি করুন: প্রতিটি কলামের অর্থ কী, গ্রহণযোগ্য পরিসীমা, তারিখের বিন্যাস। আপনি বিভ্রাটের সময় নিজেকে ধন্যবাদ জানাবেন।
- কী পেজের স্ন্যাপশট: যখন নির্বাচক ভেঙে যায়, তখন স্ক্রিনশটগুলো পুরো ফ্লো পুনরায় না চালিয়ে আপনাকে ঠিক করতে সাহায্য করে।
সাধারণ ভুলগুলো (এবং সেগুলো কীভাবে এড়ানো যায়)
- লুকানো উপাদান: Atlas যদি যা দেখতে পাচ্ছে না তাতে ক্লিক করার চেষ্টা করে, তাহলে প্রথমে দৃশ্যে স্ক্রোল করুন বা দৃশ্যমান ডুপ্লিকেটে স্যুইচ করুন।
- খুব বেশি চতুর CSS: “div:nth-child(42)”-এর মতো ভঙ্গুর নির্বাচক এড়িয়ে চলুন। আইডি, ভূমিকা এবং টেক্সটকে অগ্রাধিকার দিন।
- পপ-আপ ব্লকার: যদি কোনো সাইট একটি নতুন ট্যাবে একটি ডাউনলোড স্পন করে, তাহলে Atlas-কে সেই সাইটের জন্য পপ-আপ খুলতে দিন।
- সেশন টাইমআউট: অ্যাকশন ধাপের কাছাকাছি লগইন শিডিউল করুন; রান ছোট রাখুন; “আপনাকে লগ আউট করা হয়েছে” পরিচালনা করুন।
- অ্যান্টি-বট দেওয়াল: কিছু সাইট অটোমেশন চায় না। এটিকে মানুষের গতির এবং নৈতিক রাখুন। robots.txt এবং পরিষেবার শর্তাবলীকে সম্মান করুন।
ডেটা হ্যান্ডলিং: রুমের প্রাপ্তবয়স্ক হোন
- শংসাপত্র: সর্বনিম্ন-সুবিধা অ্যাকাউন্ট ব্যবহার করুন। নিয়মিত টোকেন ঘোরান। প্রম্পটের ভিতরে হার্ড-কোড পাসওয়ার্ড দেবেন না।
- সংবেদনশীল ডেটা: লগে এটি মাস্ক করুন। PII ফিল্ডের জন্য রিডাকশন চালু করুন।
- সংরক্ষণ: একটি সুরক্ষিত, ব্যাকআপ করা স্থানে এক্সপোর্ট রাখুন। যেখানে গুরুত্বপূর্ণ সেখানে এনক্রিপ্ট করুন।
- সম্মতি: আপনি যদি স্বাস্থ্যসেবা, ফিনান্স বা শিক্ষায় থাকেন, তাহলে অটোমেট করার আগে সংক্ষিপ্ত শব্দ ব্যবহারকারীদের (HIPAA, SOC 2, FERPA) সাথে যোগাযোগ করুন।
হ্যাঁ, নিরাপত্তা ধাপ যোগ করে। তবে পরিচয় চুরিও তাই করে।
স্কেলিং আপ: একজন এজেন্ট থেকে একটি ছোট দল
একবার আপনার কাছে একটি Agent Mode ওয়ার্কফ্লো থাকলে, আপনি আরও চাইবেন। কিছু হালকা কাঠামো গ্রহণ করে স্প্যাগেটি বাটি এড়িয়ে চলুন:
- নামকরণ কনভেনশন: “Dept-Task-Frequency,” যেমন “Mktg-WeeklyTraffic-Mon0900.”
- পুনরায় ব্যবহারযোগ্য মডিউল: একটি “Acme-এ লগইন করুন” মিনি-ওয়ার্কফ্লো তৈরি করুন যা আপনি অন্য কোথাও আমদানি করতে পারেন।
- কেন্দ্রীয় ভেরিয়েবল: শেয়ার করা বিট—Slack চ্যানেল, ড্রাইভ রুট—এক জায়গায় সংরক্ষণ করুন।
- ভার্সনিং: “v1.4 দুই-ফ্যাক্টর বিরতি যোগ করে।” ওয়ার্কফ্লো নোটে চেঞ্জলগ রাখুন।
- স্বাস্থ্য ড্যাশবোর্ড: একটি এক-পেজের যা শেষ রান স্ট্যাটাস, সময়কাল এবং পরবর্তী শিডিউল দেখায়। এমনকি একটি স্প্রেডশীটও কাজ করে।
আপনার ভবিষ্যতের ব্যাপক অটোমেশন প্ল্যাটফর্ম অভিনব হতে পারে। আপনার প্রথমটি পরিপাটি এবং বিরক্তিকর হতে পারে। বিরক্তিকর ভালো।
সমস্যা সমাধানের সাইডবার
- “এটি ভুল বোতামে ক্লিক করে।” টেক্সট, aria-label বা প্রতিবেশী উপাদান দ্বারা দ্ব্যর্থতা যোগ করুন। অথবা একটি পূর্ববর্তী ধাপ যোগ করুন: “‘Weekly Traffic’-এর পাশের কেবাব মেনু খুলুন, তারপর ‘Export CSV’ নির্বাচন করুন।”
- “পেজটি বারবার রেন্ডার হতে থাকে।” ইভেন্ট-ভিত্তিক ট্রিগারে অপেক্ষা স্যুইচ করুন: “role=progressbar সহ উপাদানের অদৃশ্য হওয়ার জন্য অপেক্ষা করুন” অথবা “XHR ‘/api/report’ শেষ হওয়ার জন্য অপেক্ষা করুন।”
- “ডাউনলোড খালি।” এক্সপোর্ট করার আগে টেবিল সারির সংখ্যা যাচাই করুন; শূন্য হলে পুনরায় চেষ্টা করুন। কিছু সাইটের পপুলেট করার আগে একটি “Refresh” বা তারিখ-পরিসীমা পূরণ করা প্রয়োজন।
- “2FA সবকিছু নষ্ট করে দেয়।” উচ্চ-সুরক্ষা সাইটের জন্য, একটি তত্ত্বাবধানে ধাপ, অ্যাপ-নির্দিষ্ট টোকেন বা সময়-সীমাবদ্ধ সেশন বিবেচনা করুন। অথবা স্বীকার করুন যে কিছু কাজ এখনও কার্বন-ভিত্তিক জীবন দ্বারা আরও ভালভাবে করা হয়।
Sider.AI সম্পর্কে একটি দ্রুত কথা
এখানে একটি আশ্চর্য: Sider.AI এই স্যান্ডবক্সে সুন্দরভাবে কাজ করে। যদি আপনার দিন ব্রাউজারের ভিতরে কাটে—ভেন্ডরদের গবেষণা করা, প্রতিযোগিতামূলক বুদ্ধিমত্তা নিষ্কাশন করা, দীর্ঘ পেজগুলো সংক্ষিপ্ত করা—Sider-এর সাইডবার প্রম্পট তৈরি করতে, পেজ সংক্ষিপ্ত করতে এবং Agent Mode-এ ChatGPT Atlas-এ হস্তান্তর করার আগে স্ক্র্যাপ করা বিষয়বস্তু গঠন করতে পারে। আমার প্রিয় কৌশল: পরিষ্কার নিষ্কাশন নিয়ম তৈরি করতে Sider ব্যবহার করুন (“H2 ‘Pricing’ খুঁজুন, তারপর প্রথম টেবিলটি ক্যাপচার করুন”) এবং সরাসরি ধাপের নির্দেশনা হিসাবে সেগুলো পেস্ট করুন। এটি নিখুঁত নয়, তবে আপনি যখন এটিকে এটির জন্য তৈরি করা জিনিসের দিকে নির্দেশ করেন—বিশৃঙ্খলাপূর্ণ ওয়েব তথ্য পরিপাটি করা—তখন মনে হয় আপনি আপনার রোবটের জন্য একজন সম্পাদক নিয়োগ করছেন। উন্নত চাল: ব্রাঞ্চিং, লুপ এবং ডেটা যোগদান
একবার আপনি স্বচ্ছন্দ হলে, আপনি পুরো প্রোগ্রামার না হয়েও অভিনব কিছু করতে পারেন।
- শাখা: “যদি রিপোর্টের প্রকার ‘মাসিক’ হয়, তাহলে একটি ভিন্ন তারিখ পরিসীমা প্রয়োগ করুন।”
- লুপ: “এই টেবিলের প্রতিটি সারির জন্য, বিশদ খুলুন, আইডি কপি করুন এবং একটি স্প্রেডশীটে যুক্ত করুন।”
- যোগদান: “স্ক্র্যাপ করা SKU একটি Google শীটের সাথে ক্রস-চেক করুন; ইতিমধ্যে দেখা আইটেমগুলো এড়িয়ে যান।”
- থ্রটলিং: “প্রতি মিনিটে ৩০টি অ্যাকশনে সীমাবদ্ধ করুন।” আপনাকে হারের সীমা এবং সাইট অ্যাডমিনদের সাথে বন্ধুত্বপূর্ণ রাখে।
এগুলো প্রযুক্তিগত শোনায়। এগুলো আসলে শুধু রেসিপি: “যদি এটা হয়, তাহলে সেটা করুন, শেষ না হওয়া পর্যন্ত পুনরাবৃত্তি করুন।”
কখন Agent Mode ভুল টুল
- ওয়ান-অফ গবেষণা যেখানে প্রতিটি পেজ আলাদা? ম্যানুয়াল প্লাস Sider-এর সংক্ষিপ্তকারী দ্রুত হতে পারে।
- যে সাইটগুলো তাদের শর্তাবলীতে অটোমেশন নিষিদ্ধ করে? সেটাকে সম্মান করুন।
- “এটা কি স্প্যাম মন্তব্যের মতো দেখাচ্ছে?” এর মতো রায় কলগুলির জন্য কিছু প্রয়োজন? আপনি ট্রায়াজ স্বয়ংক্রিয় করতে পারেন, তবে চূড়ান্ত কলের জন্য একটি মানুষ রাখুন।
আপনার যুদ্ধগুলো বেছে নিন। যেখানে প্যাটার্নগুলো বিরক্তিকর এবং পুনরাবৃত্তিযোগ্য সেখানে অটোমেশন ব্যবহার করুন। মজার, নরম, মানুষের জিনিসগুলো নিজের জন্য রাখুন।
নিরাপত্তা জাল: ব্যর্থতাও বিরক্তিকর করুন
- সার্কিট ব্রেকার: যদি ১৫ মিনিটের মধ্যে ৩টির বেশি ব্যর্থতা ঘটে, তাহলে শিডিউল থামান এবং আপনাকে সতর্ক করুন।
- রোলব্যাক: যদি একটি আপলোড ব্যর্থ হয়, তাহলে আংশিক ফাইলগুলো মুছে দিন; যদি একটি পোস্ট ব্যর্থ হয়, তাহলে ডাবল-পোস্ট এড়িয়ে চলুন।
- হার্টবিট: দৈনিক “আমি জীবিত আছি” পিং যাতে আপনি জানতে পারেন আপনার রোবট জেগে আছে—এমনকি যখন করার মতো কিছুই নেই।
আপনার একটি নিয়ন্ত্রণ কক্ষের প্রয়োজন নেই। আপনার কয়েকটি ভাল অভ্যাসের প্রয়োজন।
কুইক-স্টার্ট টেমপ্লেট যা আপনি চুরি করতে পারেন
এই প্রম্পট কঙ্কালটি ChatGPT Atlas Agent Mode-এ কপি করুন এবং ফাঁকা স্থানগুলো পূরণ করুন:
“লক্ষ্য: প্রতি [সপ্তাহের দিন] [সময় অঞ্চল/সময়]-এ, [সাইটের URL]-এ লগইন করুন, [পথ]-এ নেভিগেট করুন, তারিখের পরিসীমা [পরিসীমা]-এ সেট করুন, [ফরম্যাট] এক্সপোর্ট করুন, যাচাই করুন যে [কলাম] বিদ্যমান এবং সারির সংখ্যা > [N], তারপর [ফোল্ডার]-এ [সংরক্ষণ]-এ আপলোড করুন, নাম [ফাইলের নামের প্যাটার্ন]। যদি এক্সপোর্ট ব্যর্থ হয়, তাহলে [গণনা] পুনরায় চেষ্টা করুন; যদি এখনও ব্যর্থ হয়, তাহলে [চ্যানেল]-এর মাধ্যমে সতর্ক করুন। নির্বাচক ব্যবহার করুন যা aria-label, role এবং দৃশ্যমান টেক্সট পছন্দ করে। এগিয়ে যাওয়ার আগে [স্পিনার/উপাদান]-এর অদৃশ্য হওয়ার জন্য অপেক্ষা করুন। লগে যেকোনো [PII] রিডাক্ট করুন।”
প্রশিক্ষণ চাকা দিয়ে একবার চালান করুন। টলমলানি ঠিক করুন। সংরক্ষণ করুন। শিডিউল করুন। হাসুন।
মোড়ানো: আপনার ব্রাউজার, এখন অপোজেবল থাম্বস সহ
ChatGPT Atlas-এ Agent Mode আপনার ট্যাক্স করবে না বা আপনার কুকুরকে হাঁটাবে না। তবে এটি অবশ্যই বিরক্তিকর ওয়েব কাজগুলো থেকে মুক্তি দেবে: এক্সপোর্ট, আপলোড, কপি-পেস্ট, “১৭ বার Next ক্লিক করুন” বাজে কথা যা আপনার সকাল চুরি করে। ছোট করে শুরু করুন, ফলাফলের বর্ণনা দিন, প্রথম রানটি তত্ত্বাবধান করুন এবং এটিকে স্থিতিস্থাপক রাখতে যথেষ্ট গার্ডরেইল যোগ করুন।
শীঘ্রই, আপনার কাছে ব্রাউজার রোবটের একটি পরিপাটি ছোট দল থাকবে। তারা বেতনের জন্য জিজ্ঞাসা করবে না। তারা অসুস্থ হবে না। এবং তারা, ধন্যবাদের সাথে, আপনাকে সেই কাজের জন্য আরও বেশি সময় দেবে যা আসলে আপনার মস্তিষ্কের প্রয়োজন।
শেষ কথা: যেদিন আপনি আপনার দলকে দেখাবেন যে কীভাবে সাপ্তাহিক রিপোর্ট এখন নিজেরাই করে, সেদিন ডোনাটের বাজেট রাখুন। আপনি হিরো হবেন। এবং রোবটগুলো মোটেও আপত্তি করবে না।
FAQ
Q1:ওয়েব অটোমেশনের জন্য আমি কীভাবে ChatGPT Atlas-এ Agent Mode শুরু করব?
ChatGPT Atlas খুলুন, Agent Mode সক্ষম করুন এবং ব্রাউজারের অনুমতি দিন। আপনার লক্ষ্য সহজ ইংরেজিতে বর্ণনা করুন (প্রতিটি ক্লিক নয়), তারপর ওয়ার্কফ্লো সংরক্ষণ করার আগে ধাপগুলো সংশোধন করতে একটি তত্ত্বাবধানে ড্রাই রান করুন।
Q2:ChatGPT Atlas-এ Agent Mode লগইন এবং 2FA পরিচালনা করতে পারে?
হ্যাঁ, Agent Mode লগইন করতে এবং পেজের জন্য অপেক্ষা করতে পারে, তবে 2FA-এর জন্য প্রায়শই একটি মানুষের ট্যাপ বা একটি অ্যাপ টোকেন প্রয়োজন হয়। একটি শর্তাধীন ধাপ যোগ করুন: 2FA-তে থামুন এবং আপনাকে জানান, তারপর আপনি অনুমোদন করলে চালিয়ে যান।
Q3:ChatGPT Atlas-এ Agent Mode-এর জন্য কোন ধরনের ওয়েব কাজগুলো সবচেয়ে ভালো?
পুনরাবৃত্তিমূলক, অনুমানযোগ্য ওয়ার্কফ্লো: রিপোর্ট এক্সপোর্ট করা, ফর্ম পূরণ করা, টেবিল স্ক্র্যাপ করা এবং সারসংক্ষেপ পোস্ট করা। যদি সাইটের লেআউট স্থিতিশীল থাকে এবং আপনার ধাপগুলো সাপ্তাহিক পুনরাবৃত্তি হয়, তাহলে Agent Mode উজ্জ্বল।
Q4:আমি কীভাবে আমার Agent Mode ওয়ার্কফ্লোকে আরও নির্ভরযোগ্য করতে পারি?
শক্তিশালী নির্বাচক (aria-label, role, দৃশ্যমান টেক্সট), ইভেন্ট-ভিত্তিক অপেক্ষা, পুনরায় চেষ্টা এবং কলামের নাম বা সারির সংখ্যা পরীক্ষা করার মতো স্পষ্ট বৈধতা ব্যবহার করুন। লগ এবং সংস্করণ নোট রাখুন যাতে ফিক্সগুলো ঘন্টা নয়, মিনিটে নেওয়া যায়।
Q5: ChatGPT Atlas-এ Agent Mode-এর সাথে কি Sider.AI উপযোগী?
হ্যাঁ—Agent Mode-এ টাস্ক দেওয়ার আগে প্রম্পট তৈরি করা, বড় পেজগুলোর সারসংক্ষেপ করা এবং পরিচ্ছন্নভাবে এক্সট্রাকশন রুল তৈরি করার জন্য Sider.AI-এর সাইডবারটি চমৎকার। এটা কোনো জাদু নয়, তবে জটিল ওয়েব তথ্যের জন্য এটি একটি সহায়ক সহ-পাইলট।