آیا تا به حال آرزو کردهاید که کامپیوترتان کارهای خستهکننده را انجام دهد در حالی که شما قهوه میخورید؟ منظور کارهای خستهکننده جالب نیست—مثل گشتن در میان خانههای تعطیلاتی که از پس هزینهاش برنمیآیید—بلکه کارهای واقعاً خستهکننده. پر کردن فرمها. دانلود کردن فایلهای درست از سه پورتال مختلف. کپی کردن مجموع از ستون C به ستون G بدون اینکه تصادفاً میانگین گربه را بگیرید. اگر این شما هستید، به "استفاده کامپیوتری" 2.5 خوش آمدید، قابلیتی که به یک عامل هوش مصنوعی اجازه میدهد تا مانند یک کارآموز کوچک و خستگیناپذیر مرورگر شما را هدایت کند—کسی که نمیپرسد "همافزایی" یعنی چه.
در این راهنمای دوستانه، ما بررسی خواهیم کرد که "استفاده کامپیوتری" 2.5 واقعاً چیست، چگونه کار میکند، کجا میدرخشد و کجا هنوز دکمه اشتباه را مانند عمویتان روی یک تبلیغ بازشو کلیک میکند. من نمونههای عملی، نکات انحرافی و انواع نکات دنیای واقعی را که قبل از تحویل کلیدهای صفحهنمایش خود به آن نیاز دارید، به اشتراک خواهم گذاشت.
"استفاده کامپیوتری" 2.5 چیست، به زبان ساده؟
- آن را به عنوان "هوش مصنوعی با ماوس و کیبورد" در نظر بگیرید. به جای اینکه فقط به سؤالات با متن پاسخ دهد، "استفاده کامپیوتری" 2.5 میتواند یک مرورگر وب را مانند شما اداره کند: روی لینکها کلیک کند، در فیلدها تایپ کند، اسکرول کند، کپی کند، پیست کند، فایلها را دانلود کند و کارهای چند مرحلهای را در سایتهای مختلف انجام دهد—همه اینها از یک دستورالعمل زبان طبیعی. این تفاوت بین "به من بگو چگونه این کار را انجام دهم" و "برو انجامش بده" است.
- این ویژگی در اتوماسیون مرورگر تخصص دارد. شما به آن یک هدف میدهید ("آخرین صورتحساب را پیدا کن، PDF را دانلود کن و مجموع را برای من ایمیل کن")، و این فرآیند را در یک جلسه مرورگر کنترلشده، یک عمل در یک زمان، با یک نقشه از صفحه و یک حافظه از آنچه تاکنون انجام داده است، هدایت میکند.
چرا این مهم است؟ زیرا بیشتر کار ما اکنون در مرورگر اتفاق میافتد: پورتالهای HR، داشبوردهای فروشنده، فرمهای دولتی، پایگاههای دانش، ، هر چه که اسمش را بگذارید. اگر یک ربات بتواند با خیال راحت مانند ما کلیک کند—و را در این فرآیند حذف نکند—شما یک صرفهجویی عملی در زمان خواهید داشت.
"استفاده کامپیوتری" 2.5 در واقع چگونه کار میکند (بدون زیادهگویی)
یک راننده محتاط را در یک شهر جدید تصور کنید که از مسیریابی گامبهگام استفاده میکند:
- صفحه را درک میکند: عامل ساختار صفحه را میخواند، نه فقط پیکسلها را. عناصر قابل کلیک، فیلدهای متنی، برچسبها و طرحبندی را میبیند، بنابراین میتواند هدف مناسب را انتخاب کند—حتی زمانی که دو دکمه هر دو میگویند "ادامه". این مانند داشتن دید اشعه ایکس برای DOM است.
- مرحله بعدی را برنامهریزی میکند: از دستورالعمل سطح بالای شما، کار را به اقدامات کوچک تقسیم میکند: روی این لینک کلیک کن، این ایمیل را تایپ کن، منتظر بازشو بمان، به جدول اسکرول کن، دادهها را استخراج کن. اگر تا به حال یک ماکرو ضبط کردهاید، این حس آشنایی دارد—با این تفاوت که اگر طرحبندی صفحه تغییر کند، در حین پرواز سازگار میشود.
- عمل میکند—و بررسی میکند: پس از هر عمل، عقلانیت را بررسی میکند: آیا عنصر مورد انتظار ظاهر شد؟ آیا دکمه اکنون غیرفعال است؟ اگر نه، مسیر دیگری را امتحان میکند. این حلقه بازخورد به این عامل کمک میکند تا هنگام بارگیری آهسته یک صفحه یا نیاز یک فیلد به قالب متفاوت، از سقوط جلوگیری کند.
- خودش را مستند میکند: بیشتر اجراها یک مسیر قابل مشاهده تولید میکنند—چه چیزی را کلیک کرده، چه چیزی را تایپ کرده، چه چیزی را دانلود کرده—که میتوانید بررسی کنید. این تاریخچه برای رفع اشکال و انطباق ارزشمند است، به خصوص اگر در حال خودکارسازی چیزی حساس مانند امور مالی یا دادههای HR هستید.
و بله، میتواند به طور همزمان در چندین سایت پیمایش کند—مثلاً وارد یک داشبورد فروشنده شود، قیمتها را جمعآوری کند، نتایج را در یک جایگذاری کند و لینک را برای تیم شما ایمیل کند. در اینجا است که احساس میشود کمتر شبیه یک "چتبات" است و بیشتر شبیه یک دستیار است که—برخلاف یک دستیار واقعی—یادداشتهای چسبناک منفعل-تهاجمی روی مانیتور شما نمیگذارد.
یک بررسی واقعیت سریع: کجا عالی است، کجا احمقانه است
بخش جالب اول: "استفاده کامپیوتری" 2.5 موارد زیر را انجام میدهد:
- کارهای تکراری وب: پر کردن فرمها، بارگذاری فایلها، دانلود صورتحسابها و پیشروی در پورتالهای اداری که به نظر میرسد هدفمند برای تلف کردن سهشنبهها ساخته شدهاند.
- دستکاری دادهها در مرورگر: کپی-پیست در سراسر تبها، پاکسازی جداول، انتقال مطالب به یک سند یا صفحه گسترده و قالببندی آن به شکلی که رئیس شما دوست دارد (یعنی روش یکتا و درست).
- گردشهای کاری چند مرحلهای: بدون اینکه شما مراقب کلیکها باشید، از "پیدا کردن" به "قالببندی" به "اشتراکگذاری" بروید.
اما بیایید کلاههایمان را نگه داریم. مانند همه عوامل هوش مصنوعی اولیه، هنگام موارد زیر دچار سکسکه میشود:
- صفحات به شدت پویا هستند: اسکرول بی نهایت و پنجرههای بازشویی که با هاور کردن پنهان میشوند میتوانند آن را گیج کنند. اگر تا به حال سعی کردهاید روی دکمهای کلیک کنید که مانند موش کور حرکت میکند، تصور کنید به یک ربات یاد میدهید که این کار را انجام دهد.
- ها و دروازههای 2FA ظاهر میشوند: ویژگیهای امنیتی که جلوی رباتها را میگیرند، خب، برای متوقف کردن رباتها طراحی شدهاند. شما همچنان باید گهگاهی ورود به سیستم را تأیید کنید یا پازل را حل کنید.
- برچسبهای مبهم وجود دارند: اگر یک سایت سه دکمه "ارسال" داشته باشد و دکمه وسطی یک لیفتراک سفارش دهد، میخواهید برای اولین بار مسیر کلیک را تأیید کنید.
یک روز در زندگی: سه مورد استفاده واقعی
- مدیر هزینه: شما میگویید، "وارد شوید، سه رسید سفر آخر من را بردارید، ها را دانلود کنید و آنها را در پوشه من در بیندازید. سپس یک ایمیل خلاصه برای امور مالی تهیه کنید." عامل وارد سیستم میشود، به رسیدها میرود، فایلها را دانلود میکند، نام آنها را با تاریخ-سفر-شهر تغییر میدهد، در بارگذاری میکند، یک لیست گلولهای سریع با مجموعها ایجاد میکند و ایمیل شما را پیشنویس میکند. تادا. این 20 دقیقه از کارهای اداری ذخیره شد.
- بررسیکننده قیمت فروشنده: "قیمت لیست فعلی مدل Z را از فروشندگان A، B و C مقایسه کنید. ها و قیمتها را در صفحه گسترده « » من جایگذاری کنید و هرگونه کاهش قیمت بیش از 8٪ را علامتگذاری کنید." عامل از سه سایت بازدید میکند، جستجو میکند، ماژولهای قیمت را خراش میدهد، دادهها را عادی میکند، صفحه گسترده را بهروز میکند و معاملات را برجسته میکند.
- جن HR portal: "آدرس من را در پورتال HR به روز کنید، واجد شرایط بودن مزایا را تأیید کنید، آخرین فیش حقوقی را دانلود کنید و مانده PTO را در طول سه ماهه گذشته بررسی کنید." عامل با وظیفهشناسی در پیچ و خمها حرکت میکند. شما اولین اجرا را نظارت میکنید. پس از آن، این مراسم ماهانه شما بدون تشریفات است.
در مورد ایمنی، حریم خصوصی و "آیا مطمئن هستید که به دوست دختر سابق من ایمیل نمیزند؟" چه؟
"استفاده کامپیوتری" در یک محیط محدود طراحی شده برای نظارت اجرا میشود. به زبان انسانی: میتوانید کارکرد آن را تماشا کنید، محدودیتهایی را برای آنچه میتواند به آن دسترسی داشته باشد تعیین کنید و برای مراحل حساس مانند ارسال ایمیل یا انتقال پول نیاز به تأیید داشته باشید. تاریخچههای جلسه به شما کمک میکنند تا آنچه اتفاق افتاده و چرا را ممیزی کنید. این آرزو "بدون دخالت دست" است، اما واقعیت—به خصوص در ابتدا—"چشمها برای اولین عبور روشن است، سپس شل کردن افسار" است. این یک باگ نیست؛ این عقل سلیم است.
نکات تنظیمات حرفهای (از طرف کسی که چند کلیک را گم کرده است)
- از کوچک شروع کنید: ابتدا کارهای خستهکننده اما ایمن را به آن بدهید: دانلود گزارشها، تغییر نام فایلها، مرتب کردن صفحات گسترده. شما اعتماد ایجاد میکنید؛ این یک اسکریپت قوی میسازد.
- عناصر را برای موفقیت نامگذاری کنید: در جایی که وبسایتها یا داشبوردهای داخلی را کنترل میکنید، از برچسبها و شناسههای واضح استفاده کنید. این عامل به متن و ساختار قابل پیشبینی مانند یک سگ گلدن رتریور به یک توپ تنیس میچسبد.
- ابتدا یک "مسیر خوشحال" بسازید: کلیکها و فیلدهای ایدهآلی را که باید انتظار داشته باشد، ضبط کنید. سپس یک توپ منحنی به سمت آن پرتاب کنید (بارگذاری آهسته، گفتگوی اضافی) و ببینید چگونه بهبود مییابد. از آنجا بهبود دهید.
- 2FA را دم دست نگه دارید: انتظار داشته باشید که یک ورود به سیستم را تأیید کنید یا یک کد را برای حسابهای محافظت شده جایگذاری کنید. این یک نقص نیست؛ این یک ویژگی ایمنی است.
- همه چیز را ثبت کنید: تاریخچه عمل و اسکرینشاتها را برای گردشهای کاری حساس ذخیره کنید. اگر چیزی از مسیر خارج شد، میدانید کجا، چه زمانی و کدام دکمه.
چگونه با سایر "عوامل هوش مصنوعی" که در مورد آنها شنیدهاید مقایسه میشود؟
اگر دموهای دستیارهای هوش مصنوعی را دیدهاید که صفحه نمایش شما را کنترل میکنند، این ژانر را دیدهاید: عاملی که به جای "پاسخ دادن" فقط کلیک میکند و تایپ میکند. "استفاده کامپیوتری" 2.5 از طریق درک ساختاریافته از صفحات، بررسی وضعیت پس از هر عمل و ورود به سیستم خوب به طور پیشفرض، به اتوماسیون وب تکیه میکند. در آزمایش من، به ویژه در کارهای "مرورگر به سند" خوب است—چیزی را از یک سایت بیرون بکشید، آن را تغییر شکل دهید و در یک سند یا صفحهای که میتوانید به اشتراک بگذارید قرار دهید.
جایی که عقب افتاد: هر گردش کاری که به رابط کاربری پر از انیمیشن و ها متکی است. این مختص نیست؛ این وضعیت فعلی این دسته است. جنبه مثبت: وقتی یک سایت معقول است، عامل به طرز تکاندهندهای توانا به نظر میرسد. وقتی اینطور نیست، سریعتر از اینکه بتوانید بگویید "بنر کوکی" خواهید فهمید که کدام سایتها به اتوماسیون حساسیت دارند.
یک راهنمای سریع: از درخواست تا پرداخت
بیایید یک کار واقعی را خودکار کنیم: استخراج معیارهای فصلی از سه داشبورد و بهروزرسانی یک سند تیمی.
- درخواست: " ، و را باز کنید. ترافیک را بر اساس منبع به عنوان صادر کنید. در یک جدول واحد در ادغام کنید، سپس یک خلاصه یک پاراگرافی در ایجاد کنید."
- آنچه خواهید دید: عامل وارد سیستم میشود (شما هر گونه 2FA را تأیید میکنید)، به هر صفحه "گزارشها" میرود، محدوده تاریخ مناسب را انتخاب میکند، روی Export کلیک میکند، ها را دانلود میکند، یک صفحه گسترده باز میکند، هر فایل را در یک تب جدید وارد میکند، هدرهای ستون را عادی میکند، یک تب اضافه میکند و فرمولهای SUMIF را برای جمعآوری ترافیک بر اساس منبع مینویسد. سپس یک سند باز میکند، یک پاراگراف خلاصه با نکات برجسته و لینکی به صفحه گسترده در آن قرار میدهد.
- مرتبسازی: سند را سریع میخوانید، یک جمله را تغییر میدهید و ارسال را میزنید. ده دقیقه نظارت در مقابل یک ساعت کار سخت.
گوشه عیبیابی: وقتی ربات با هرج و مرج روبرو میشود
- دکمه اشتباه را کلیک کرد: زمینه بیشتری به دستورالعمل خود اضافه کنید: "روی دکمه آبی «دانلود » زیر > کلیک کنید، نه دکمه سفید «دانلود » در بالا." عامل از عبارت شما برای رفع ابهام اهداف استفاده میکند.
- یک پنجره بازشو مانع پیشرفت شد: به آن بگویید در پنجرههای بازشو چه کار کند: "هر مودال «به تجربه خود امتیاز دهید» را ببندید، سپس ادامه دهید." دومین اجرا اغلب با موفقیت انجام میشود.
- طرحبندی جدول تغییر کرد: آن را به برچسبها هدایت کنید، نه موقعیتها: "منوی کشویی با برچسب «محدوده تاریخ» را انتخاب کنید و «فصل گذشته» را انتخاب کنید." از "بالا-راست" و "دکمه سوم" خودداری کنید، که وقتی یک طراح احساس الهام میکند، از بین میروند.
در مورد —آیا اینجا کمک میکند؟ این یک شگفتی است: (اینها افرادی هستند که شما در حال خواندن مطالب آنها هستید) مرورگر شما را به یک دستیار هوش مصنوعی روی صفحه مجهز میکند که میتواند وظایف چند مرحلهای را درست در جایی که کار میکنید، پیشنویس، خلاصه و سازماندهی کند. به تجربه من، ترکیب "استفاده کامپیوتری" 2.5 برای رانندگی سنگین مرورگر با کمک در صفحه، یک مشت یک-دو خوب ایجاد میکند. شما به اجازه میدهید ماراتن کلیک را انجام دهد، و از برای صیقل دادن خروجیها، تولید ایمیلها یا بررسی عقلانی اعداد بدون خروج از تب استفاده میکنید. این جادو نیست، اما مانند استخدام یک ویراستار است که در مرورگر شما زندگی میکند و نیازی به کارت کلید ندارد. چه زمانی از "استفاده کامپیوتری" استفاده نکنیم
- هر چیزی که شرایط سایت یا انتظارات حریم خصوصی را نقض کند. "چون میتواند کلیک کند" به معنای "شما باید کلیک کنید" نیست.
- اقدامات غیرقابل جایگزینی و یکباره—درخواست مجوز مرگ و زندگی یا انتقال مبالغ هنگفت—که در آن یک انسان باید هر مرحله را بررسی کند.
- کار خلاقانه که در آن گلوگاه کلیک نیست، بلکه قضاوت است: ویرایش یک ویدیو، طراحی یک لوگو، مذاکره بر سر قیمت. عامل میتواند دریافت، قالببندی و بایگانی کند؛ اما نمیتواند فروشنده را مجذوب کند.
لیست چک شروع به کار
- یک کار را انتخاب کنید که به صورت هفتگی تکرار میکنید که در مرورگر زندگی میکند و قطعی به نظر میرسد. "گزارش دیروز را دانلود کنید و اینجا قرار دهید."
- اسکریپت ایدهآل را به زبان ساده بنویسید. شامل برچسبها، نه موقعیتها؛ پیامدها، نه احساسات.
- با نظارت اجرا کنید. هر گونه ورود به سیستم را تأیید کنید. تاریخچه عمل را تماشا کنید.
- نرده محافظ اضافه کنید: "فرمها را ارسال نکنید؛ فقط پیشنمایش دانلودها را انجام دهید."
- تکرار کنید: اگر دچار لغزش شد، در مورد اصلاح خاص باشید و دوباره امتحان کنید.
متن دقیقی که بعداً به آن اهمیت خواهید داد
- عملکرد به سایت بستگی دارد: صفحات ثابت و دارای برچسب مناسب = بوسه سرآشپز. صفحات پویا، پر از تبلیغات و دارای پنجرههای بازشو = میان وعده بیاورید.
- تأخیر یک چیز است: این کلیک به کلیک است، با بررسی بین مراحل. این چیزی است که آن را قابل اعتماد نگه میدارد—مانند یک راننده محتاط، نه یک مسابقهدهنده سرعت.
- شما مسئول هستید: میتوانید اجراها را متوقف کنید، گزارشها را بررسی کنید و مجوزها را تنظیم کنید. آن را به عنوان یک تردمیل با یک دکمه قرمز بزرگ STOP در نظر بگیرید. از آن استفاده کنید.
نتیجه نهایی: بنابراین، آیا "استفاده کامپیوتری" 2.5 ارزشش را دارد؟
اگر روز شما شامل "باز کردن پنج سایت، کلیک کردن روی هشت دکمه یکسان، دریافت دادههای یکسان و قرار دادن آن در جایی" است… پس بله، این دقیقاً همان نوع هوش مصنوعی عملی است که در زمان واقعی شما صرفهجویی میکند. این یک باتلر علمی تخیلی نیست. بیشتر شبیه یک کارآموز بسیار مطیع است که هرگز پلک نمیزند و همیشه کار خود را مستند میکند. با همان نظارت عقل سلیمی که به یک استخدام جدید میدهید، با آن رفتار کنید، و مزایا را بدون درام دریافت خواهید کرد.
توصیه من: با یک کار خستهکننده شروع کنید، آن را خودکار کنید و 20 دقیقه را هر هفته پسانداز کنید. در عرض یک ماه، تعجب خواهید کرد که چرا تا به حال چیزی را به صورت دستی دانلود کردهاید. در عرض یک سال، فراموش خواهید کرد که چند رمز عبور دارید—زیرا شما کسی نخواهید بود که آنها را تایپ میکند.
یک نکته آخر: انجام کارهای رایانهای توسط رایانهها آینده است—اما قضاوت شما راز موفقیت است. دستان خود را روی دکمه قرمز بزرگ و چشمان خود را به جایزه بدوزید. هوش مصنوعی میتواند کلیک کند. شما تصمیم میگیرید کجا.
مطالعه بیشتر و راهنماهای عملی
- توضیحی دوستانه از اینکه "استفاده کامپیوتری" 2.5 واقعاً چه کاری میتواند انجام دهد، با نمونههای مشخصی از وظایف و حفاظتها.
- یک بررسی عملگرایانه با جاهایی که برتری دارد و جاهایی که دچار سکسکه میشود، از جمله مقایسهها با ابزارهای مشابه.
- یک راهنما برای ایجاد گردشهای کاری اتوماسیون مرورگر که دادهها را بدون ترک صندلی شما جمعآوری، پاکسازی و به اشتراک میگذارند.
سوالات متداول
س1: استفاده کامپیوتری 2.5 به زبان ساده چیست؟
این یک هوش مصنوعی است که می تواند یک مرورگر را برای شما کنترل کند—کلیک کردن، تایپ کردن، دانلود کردن و پیمایش برای انجام کارهایی که شما به زبان ساده توضیح می دهید. آن را به عنوان یک دستیار دقیق در نظر بگیرید که دستورالعمل های شما را گام به گام دنبال می کند، نه یک ارباب روبات آزاد.
س2: استفاده کامپیوتری 2.5 چه نوع کارهایی را به بهترین نحو انجام می دهد؟
در کارهای تکراری و مبتنی بر قانون مرورگر می درخشد: ورود به پورتال ها، صادر کردن گزارش ها، کپی کردن داده ها و به روز رسانی اسناد یا برگه ها. اگر می توانید آن را با کلیک کردن روی دکمه های یکسان هر هفته انجام دهید، استفاده کامپیوتری گزینه مناسبی است.
س3: آیا استفاده کامپیوتری 2.5 برای گردش های کاری حساس ایمن است؟
اگر به درستی استفاده شود، بله—در یک محیط کنترل شده اجرا می شود که در آن می توانید تماشا کنید، مجوزها را تنظیم کنید و یک گزارش عملکرد را بررسی کنید. تأییدها را برای مراحل حساس مانند ورود به سیستم، پرداخت ها یا ایمیل ها روشن نگه دارید و اولین اجرا را قبل از رها کردن آن آزمایش کنید.
س4: چگونه می توانم استفاده کامپیوتری را قابل اعتمادتر کنم؟
با برچسب ها (نه موقعیت ها) مشخص باشید، مسیر خوشحال را تعریف کنید و دستورالعمل هایی را برای پنجره های بازشو و دانلودها اضافه کنید. از کوچک شروع کنید، بعد از اولین اجرا تکرار کنید و 2FA را برای حساب های محافظت شده دم دست نگه دارید.
س5: استفاده کامپیوتری 2.5 در کجا مشکل دارد؟
صفحات پویا با عناصر متحرک، پنجرههای بازشوی تهاجمی، ها یا دکمههای یکسان متعدد میتوانند آن را به هم بزنند. در این موارد، دستورالعملهای واضحتری اضافه کنید، کار را به مراحل کوچکتر تقسیم کنید یا بخشهای دشوار را به صورت دستی انجام دهید.