നിങ്ങളുടെ കമ്പ്യൂട്ടർ നിങ്ങൾ കൊഫി ഉണ്ടാക്കുമ്പോൾ ബോറടിക്കുന്ന കാര്യങ്ങൾ ചെയ്തു തീർക്കാൻ ആഗ്രഹിച്ചതുണ്ടോ? അവിടെ ഫൺ ബോറിംഗ് കാര്യങ്ങൾ അല്ല — നിങ്ങൾക്ക് സാധിക്കാത്ത അവധിക്കാല വാടകകൾ സ്ക്രോൾ ചെയ്യുന്ന പോലുള്ളത് അല്ല — യഥാർത്ഥ ബോറടിച്ചിടുന്ന കാര്യങ്ങൾ. ഫോം ഫിൽ ചെയ്യൽ. മൂന്ന് വ്യത്യസ്ത പോർട്ടലുകളിൽ നിന്നുള്ള ശരിയായ ഫയലുകൾ ഡൗൺലോഡ് ചെയ്യൽ. Column Cയിൽ നിന്നും Column Gയിൽ ടോട്ടലുകൾ കോപ്പി ചെയ്യൽ, പക്ഷേ പിശുക്കാതെ. നിങ്ങൾ ആണെങ്കിൽ, സ്വാഗതം Google-ന്റെ Gemini 2.5 “Computer Use” സവിശേഷതയിലേക്ക്, ഇത് ഒരു AI ഏജന്റിന് നിങ്ങളുടെ ബ്രൗസർ ഒരു ചെറിയ, ക്ഷീണരഹിത ഇന്റേണായി സഞ്ചരിക്കാൻ അനുവദിക്കുന്നു — “synergy”എന്നതിന് അതര്ത്ഥമെന്നു ചോദിക്കാത്തവനെന്നപോലെ.
ഈ സൗഹൃദപരമായ യാത്രയിൽ, നാം Gemini 2.5 Computer Use എങ്ങനെ പ്രവർത്തിക്കുന്നു, എവിടെ മികച്ചതാണ്, എവിടെ തെറ്റായ ക്ലിക് ചെയ്യുന്നു എന്ന് വിശകലനം ചെയ്യും. ഞാൻ കൈയിലെ ഉദാഹരണങ്ങളും, പിഴവുകളും,істіל്പുക്കളും പങ്കുവെക്കും, ഇത് നിങ്ങൾക്ക് സ്ക്രീന്റെ കീകൾ കൈമാറുന്നതിനുമുമ്പ് അറിയേണ്ടതും.
Google Gemini 2.5 “Computer Use” സാധാരണ ഭാഷയിൽ എന്താണ്?
- ഇതിനുള്ള വിവരണം “AI വിശേഷങ്ങളോടുകൂടിയ മൗസ്-കീബോർഡ്” എന്ന് കരുതുക. മറുപടി നൽകുന്നതിന് പകരം, Gemini 2.5 Computer Use നിങ്ങളുടെ പോലെ വെബ് ബ്രൗസർ സംചാരിക്കും: ലിങ്കുകൾ ക്ലിക്ക് ചെയ്യൽ, ഫോം ഫീൽഡുകളിൽ ടൈപ്പ് ചെയ്യൽ, സ്ക്രോൾ ചെയ്യൽ, കോപ്പി പേസ്റ്റ്, ഫയലുകൾ ഡൗൺലോഡ് ചെയ്യൽ, വിവിധ സൈറ്റുകൾക്ക് ഇടകിൽ ബഹുസ്ഥിതി ജോലികൾ പൂർത്തിയാക്കൽ — എല്ലാം സ്വാഭാവിക ഭാഷാ നിർദേശങ്ങളിൽ നിന്ന്. അത്
- ഇത് പ്രധാനമായും ബ്രൗസർ ഓട്ടോമേഷൻയിൽ വിദഗ്ദ്ധമാണ്. നിങ്ങൾക്ക് ഒരു ലക്ഷ്യം നൽകാം (“അടുത്ത ഇന്നൊവാവിലുള്ള ബില്ലിങ് സ്റ്റേറ്റ്മെന്റ് കണ്ടെത്തുക, PDF ഡൗൺലോഡ് ചെയ്ത് മൊത്തം ഇമെയിൽ ചെയ്യുക”), അങ്ങനെ അത് ഒരു നിയന്ത്രിത ബ്രൗസർ സെഷനിൽ ഒരു പ്രവർത്തനം പിന്വലിച്ച് സഞ്ചരിക്കും, ഓരോ ഘട്ടവും പോലും, പേജ് സ്ഥിതി മനസ്സിലാക്കി ഇന്ന് മുതൽ ചെയ്ത എന്തന്നറിഞ്ഞ്.
എന്തുകൊണ്ട് ഇത് പ്രധാനമാണ്? കാരണം ഇന്നത്തെ പണിയുടെ ഭൂരിഭാഗവും ബ്രൗസറിലാണ് നടക്കുന്നത്: HR പോർട്ടലുകൾ, വിൻഡർ ഡാഷ്ബോർഡുകൾ, ഗവൺമെന്റ് ഫോമുകൾ, നോളജ് ബേസുകൾ, Google Drive, നിങ്ങൾ പറയുന്നേപോലെ. ഒരു ബോട്ട് നമ്മുടെ പോലെ സുരക്ഷിതമായി ക്ലിക്ക് ചെയ്യാവുന്നതാണെങ്കിൽ — ക്ലിവ്ലൻഡ് ഇല്ലാതാക്കാതെ — നിങ്ങൾക്ക് യാഥാർഥിക സമയസംരക്ഷണം ലഭിക്കും.
Gemini 2.5 Computer Use എങ്ങനെ പ്രവർത്തിക്കുന്നു (തെളിവുകൾ കൂടാതെ):
പുതിയ നഗരത്തിൽ സൂക്ഷ്മതയുള്ള ഡ്രൈവർ ആകിയെ വിചാരിക്കുക, ടേൺ ബൈ ടേൺ മാർഗ്ഗനിർദ്ദേശം ഉപയോഗിക്കുന്ന പോലെ:
- അത് പേജ് മനസ്സിലാക്കുന്നു: ഏജന്റ് പേജ് ഘടന വായിക്കുന്നു, പിക്സലുകൾ മാത്രം അല്ല. ക്ലിക്കുചെയ്യേണ്ട ഘടകങ്ങൾ, ടെക്സ്റ്റ് ഫീൽഡുകൾ, ലേബലുകൾ, ലെയൗട്ട് എന്നിവ കാണുന്നു, അതുകൊള്ളാൻ ശരിയായ ലക്ഷ്യം തിരഞ്ഞെടുക്കുക — ഒരുപാട് ബട്ടണുകൾ ഒരുപോലെ 'Continue' എന്നു പറഞ്ഞാലും. ഇത് DOMനുവേണ്ടി എക്സ്റേ ദൃശ്യം പോലെയാണ്.
- അടുത്തടിക്ക് പദ്ധതിവയും: നിങ്ങളുടെ ഉന്നതനില നിർദ്ദേശത്തിൽ നിന്ന്, അത് പ്രവർത്തനങ്ങളെ മൈക്രോ-ആക്ഷൻുകളായി വിഭജിക്കുന്നു: ഈ ലിങ്ക് ക്ലിക് ചെയ്യുക, ആ ഇമെയിൽ ടൈപ്പ് ചെയ്യുക, പോപ്പ്-അപ്പ് കാത്തിരിക്കുക, പട്ടികയിലേക്ക് സ്ക്രോൾ ചെയ്യുക, ഡാറ്റ പുറത്ത് എടുക്കുക. നിങ്ങൾ ഒരു മക്രോ റെക്കോർഡ് ചെയ്തിട്ടുണ്ടെങ്കിൽ ഇത് പരിചിതമാണ് — പേജിന്റെ ലേഔട്ട് മാറ്റപ്പെട്ടാൽ ഇത് മദ്ധ്യത്തിലേക്ക് ക്രമീകരിക്കും.
- അത് പ്രവർത്തിക്കുന്നു — പരിശോധിക്കുന്നു: ഓരോ ഘട്ടത്തിനും ശേഷം, അത് ഡിസൈൻ ചെയ്യുന്നു: പ്രതീക്ഷിച്ച ഘടകം പ്രത്യക്ഷപ്പെട്ടു? ബട്ടൺ ഇപ്പോൾ സജീവമായില്ലേ? അല്ലെങ്കിൽ, ഒരു വേറിട്ട വഴി പരീക്ഷിക്കും. ഈ പ്രതികരണ ലൂപ്പാണ് പേജ് സാധാരണയായി ലോഡ് ആകുമ്പോഴോ ഫീൽഡ് വേറിട്ട ഫോർമാറ്റ് ആവശ്യമായപ്പോൾ അപകടം ഒഴിവാക്കുന്നത്.
- അത് തന്നെ രേഖപ്പെടുത്തുന്നു: കൂടുതൽ പ്രവർത്തനങ്ങളിൽ കണ്ടു ലഭിക്കുന്ന ട്രെയിൽ — എന്ത് ക്ലിക്ക് ചെയ്തു, എന്ത് ടൈപ്പ് ചെയ്തു, എന്ത് ഡൗൺലോഡ് ചെയ്തു — നിങ്ങൾ പരിശോധിക്കാവുന്നതാണ്. ഈ ചരിത്രം ഫിനാൻസ് അല്ലെങ്കിൽ HR ഡാറ്റ പോലുള്ള നൽകുന്ന ഡ്രൈവിംഗിനായി ഡീബഗിംഗിനും അനുകൂലമാണ്.
അതെ, ഇത് ഒരേസമയം നിരവധി സൈറ്റുകൾ പരിചരിക്കാം — ഉദാഹരണത്തിന്, ഒരു വിൻഡർ ഡാഷ്ബോർഡ് ലോഗിൻ ചെയ്യുക, വിലകൾ ശേഖരിക്കുക, Google ഷീറ്റ് പ്രതുകയില രൂപമാറ്റം ചെയ്ത് ടീംക്ക് ലിങ്ക് അയയ്ക്കുക. ഇത് 'ചാറ്റ്ബോട്ട്' പോലെ തോന്നാതെ, ഒരു സഹായക്കാരനെ പോലെയാണ് — ഒരു യഥാർത്ഥ സഹായക്കാരൻ പോലെ നിങ്ങളുടെ മോനിറ്ററിൽ നർച്ചിലൊരു കുറിപ്പു ഉപേക്ഷിക്കാതെ.
ഒരു വേഗത്തിലുള്ള യാഥാർത്ഥ്യ പരിശോധന: മികച്ച ഭാഗങ്ങൾ, കൂടുതൽ വിഡ്ഢിതൻപോലുള്ള ഭാഗങ്ങൾ
രസകരമായ ഭാഗം ആദ്യം: Gemini 2.5 Computer Use കൈകാര്യം ചെയ്യുന്നത്:
- പുനരാവർത്തന വെബ് ജോലികൾ: ഫോം പൂരിപ്പിക്കൽ, ഫയലുകൾ അപ്ലോഡ് ചെയ്യൽ, സ്റ്റേറ്റ്മെന്റുകൾ ഡൗൺലോഡ് ചെയ്യൽ, മംഗളവാറികൾ കളയാൻ രൂപകൽപ്പന ചെയ്ത അഡ്മിൻ പോർട്ടലുകൾ.
- ബ്രൗസറിൽ ഡാറ്റ മാനേജുമെന്റ്: ടാബുകൾക്കിടയിൽ കോപ്പി-പേസ്റ്റ്, പട്ടികകൾ ശുദ്ധീകരിക്കൽ, ഡോക്-ഷീറ്റിലേക്ക് കൊണ്ടുപോകൽ, ആധിപത്യ രീതി (മികച്ച രീതിയിൽ).
- ബഹുസ്ഥിതി പ്രവണതകൾ: “കണ്ടെത്തുക” മുതൽ “ഫോർമാറ്റ്” വരെ “പങ്കുവെക്കുക” വരെ, നിങ്ങൾ ക്ലിക്കുകളെ നോക്കാതെ.
പക്ഷേ നമ്മൾ ഹൃദയം നിലനിർത്താം. ആദിമ AI ഏജന്റുകൾ പോലെ, അത് അപ്രതീക്ഷിത ആകുമ്പോൾ:
- പേജുകൾ വളരെ ഡൈനാമിക് ആയപ്പോൾ: അനന്തം സ്ക്രോൾ, പൊപ്പോവറുകൾ ഹോവറിൽ മറയുന്നത്. നിങ്ങൾക്കിത് ഒന്നും ചെയ്യാനാകാത്ത ബട്ടൺ ക്ലിക് ചെയ്യാൻ ശ്രമിച്ചിട്ടുണ്ടെങ്കിൽ, റോബോട്ടിന് പഠിപ്പിക്കാനായി.
- ക്യാപ്ചകളും 2FA ഗേറ്റുകളും: ബോട്ടുകളെ തടയാനുള്ള സുരക്ഷാ സംവിധാനങ്ങൾ, ബോട്ടുകള് തടയാനായി രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. നിങ്ങൾ ഇപ്പോഴും ലോഗിൻ അംഗീകരിക്കാനും പാസ്വേഡ് പൂരിപ്പിക്കാനും ബുദ്ധിമുട്ട് അനിവാര്യമാണ്.
- അമ്പരപ്പിക്കുന്ന ലേബലുകൾ ഉള്ളപ്പോൾ: ഒരേ സൈറ്റിൽ മൂന്ന് 'Submit' ബട്ടണുകൾ ഉണ്ടെങ്കിൽ, നടുവിൽ ഫോർക്ക്ലിഫ്റ്റ് ഓർഡർ ചെയ്യുന്ന ബട്ടൺ അല്ലെങ്കിൽ, നിങ്ങളുടെ ക്ലിക്ക് പാത ആദ്യമായി ഉറപ്പു വരുത്തണം.
ഒരു ദിനം ജീവിതത്തിൽ: മൂന്ന് യാഥാർത്ഥ്യ ഉപയോഗ കേസുകൾ
- ചെലവ് നിയന്ത്രകൻ: “TravelPortal.com ലോഗിൻ ചെയ്ത്, കഴിഞ്ഞ മൂന്ന് ടിപ് റിസീറ്റുകൾ കണ്ടെത്തുക, PDF ഡൗൺലോഡ് ചെയ്ത് Expenses/2024 ഫോൾഡർയിൽ സേവ് ചെയ്യുക. പിന്നീട് ഫിനാൻസിന് സമാരംഭ ഇമെയിൽ തയ്യാറാക്കുക.” ഏജന്റ് ലോഗിൻ ചെയ്ത്, റിസീറ്റുകൾ കണ്ടെത്തി ഫയലുകൾ ഡൗൺലോഡ് ചെയ്യുന്നു, ഡേറ്റ്-ടിപ്പ്-സ്ഥലം ഉപയോഗിച്ച് പേരുമാറ്റി, ഡ്രൈവിലേക്ക് അപ്ലോഡ് ചെയ്യുന്നു, ടോട്ടലുകൾ ഉൾക്കൊള്ളുന്ന ബുല്ലറ്റ് ലിസ്റ്റ് ഉണ്ടാക്കി, ഇമെയിൽ ഡ്രാഫ്റ്റ് ചെയ്യുന്നു. 20 മിനിറ്റ് അഡ്മിൻ സമയം ലാഭം.
- വിൻഡർ വില പരിശോധകൻ: “വിൻഡർ A, B, C-ലെ മോഡൽ Z നിലവിലെ ലിസ്റ്റ് വില മനസ്സിലാക്കുക. SKUകളും വിലകളും Q4 Price Watch Google ഷീറ്റിൽ പേസ്റ്റ് ചെയ്ത് 8% മുകളിൽ വിലക്കുറവ് വന്നാൽ ഫ്ലാഗ് ചെയ്യുക.” ഏജന്റ് മൂന്ന് സൈറ്റുകൾ സന്ദർശിച്ച് വില പരിശോധന നടത്തി, ഡാറ്റ സാധാരണവൽക്കരിച്ചു, ഷീറ്റ് അപ്ഡേറ്റ് ചെയ്തു, ഓഫറുകൾ ഹൈലൈറ്റ് ചെയ്തു.
- HR പോർട്ടൽ ഗൊബ്ലിൻ: “HR പോർട്ടലിൽ വിലാസം അപ്ഡേറ്റ് ചെയ്യുക, ബേഡനറ്റുകൾ ഉറപ്പാക്കുക, അവസാന പേഇസ്റ്റബ് ഡൗൺലോഡ് ചെയ്യുക, കഴിഞ്ഞ ക്വാർട്ടറിലെ PTO ബാലൻസ് പരിശോധിക്കുക.” ഏജന്റ് ശ്രമത്തോടെ പടവെടുക്കുന്നു. നിങ്ങൾ ആദ്യ റൺ നിരീക്ഷിക്കൂ; പിന്നീട് അത് മാസവുമായ രീതി ആവുന്നു, രീതി കൂടാതെ.
സുരക്ഷ, സ്വകാര്യത, “എനിക്ക് മുൻ സുഹൃത്തിന് ഇമെയിൽ പോകാറുണ്ടോ?” എന്ത് സ്ഥിതി?
Computer Use ഒരു നിയന്ത്രിത പരിതസ്ഥിതിയിൽ പ്രവർത്തിക്കുന്നു, മനുഷ്യഭാഷയിൽ: അതിന്റെ പ്രവർത്തനം നിങ്ങൾ കാണാം, അതിന്റെ ആക്സസ് പരിധിയിടാം, സന്ദേശങ്ങൾ അയയ്ക്കൽ പോലുള്ള സങ്കീർണ്ണ ഘട്ടങ്ങൾക്ക് അംഗീകാരങ്ങൾ ആവശ്യമാണെന്ന് നിർദേശിക്കാം. സെഷൻ ചരിത്രം പരിശോധിച്ച് എന്ത് എപ്പോൾ സംഭവിച്ചു എന്നറിയാം. സ്വപ്നം 'ഹാന്റ്സ്-ഓഫ്' ആകാം, യഥാർഥം പ്രത്യേകിച്ച് തുടക്കത്തിൽ 'ഐസ്-ഓൺ ഫസ്റ്റ് പാസ്, പിന്നെ നിയന്ത്രണം ശിതളമാക്കൽ' ആണ്. ഇത് പിഴവ് അല്ല; അത് സാധാരണ ബുദ്ധിയാണ്.
പ്രൊ സെറ്റപ്പ് ടിപ്പുകൾ (ഒരു ആളുടേതായി, കുറച്ച് ക്ലിക്കുകൾ സ്ഥലം തെറ്റിച്ച)
- ചുരുങ്ങിയതിൽ തുടങ്ങുക: ആദ്യം ബോറായും സുരക്ഷിതമായ കാര്യങ്ങൾ നൽകുക: റിപ്പോർട്ടുകൾ ഡൗൺലോഡ് ചെയ്യൽ, ഫയലുകൾ പേരുമാറ്റൽ, സ്പ്രെഡ്ഷീറ്റ് തയാറാക്കൽ. നിങ്ങൾ വിശ്വാസം നിർമ്മിക്കൂ; അത് ശക്തമായ സ്ക്രിപ്റ്റ്.
- സന്തോഷകരമാക്കാൻ ഘടകങ്ങൾക്ക് പേരിടുക: നിങ്ങൾ വെബ്സൈറ്റുകൾ അല്ലെങ്കിൽ ഇന്റേണൽ ഡാഷ്ബോർഡുകൾ നിയന്ത്രിക്കുന്നിടത്ത്, വ്യക്തമായ ലേബലുകളും ID-കളും ഉപയോഗിക്കുക. ഏജന്റ് പ്രവചിക്കാവുന്ന ടെക്സ്റ്റും ഘടനയും പിടിച്ചെടുത്ത് സ്വർണ്ണ റെട്രീവർ പോലെ.
- ഒരു “ഹാപ്പി പാത” ആദ്യം തയ്യാറാക്കുക: ആവശ്യമുള്ള ക്ലിക്കുകളും ഫീൽഡുകളും റെക്കോർഡ് ചെയ്യുക. ശേഷം സ്ലോ ലോഡ്, അധിക ഡയലോഗ് പോലുള്ള കർവ്വ്ബോൾ നൽകുക, അത് എങ്ങനെ വീണ്ടെടുക്കുന്നതാകുന്നു കാണുക. അവിടെ നിന്നു മെച്ചപ്പെടുത്തുക.
- 2FA ചുറ്റുപാടുകൾക്ക് സജ്ജമാകൂ: സംരക്ഷിത അക്കൗണ്ടുകൾക്കായി ലോഗിൻ അംഗീകരിക്കുക അല്ലെങ്കിൽ കോഡ് പേസ്റ്റ് ചെയ്യുക വേണ്ടിവരും. അത് പിഴവല്ല; സുരക്ഷാ സവിശേഷതയാണ്.
- എല്ലാം രേഖപ്പെടുത്തുക: സേൻസിറ്റീവ് വർക്ക്ഫ്ളോകൾക്കുള്ള പ്രവർത്തന ചരിത്രവും സ്ക്രീൻഷോട്ടുകളും സേവ് ചെയ്യുക. പിഴവ് വന്നാൽ എപ്പോൾ, എവിടെ, ഏത് ബട്ടൺ എന്നറിയാം.
മറ്റ് “AI ഏജന്റുകളുമായി” താരതമ്യം എങ്ങനെ?
നിങ്ങൾ കണ്ടിട്ടുള്ള സ്ക്രീൻ നിയന്ത്രിക്കുന്ന AI അസിസ്റ്റന്റ് ഡെമോകൾ ഇതാണു: മറുപടി നൽകുന്നതിന് പകരം ക്ലിക്ക് ചെയ്യുകയും ടൈപ്പ് ചെയ്യുകയും ചെയ്യുന്ന ഏജന്റ്. Gemini 2.5 Computer Use സ്ട്രക്ചേച്ചർഡ് പേജ് മനസ്സിലാക്കതിൻറെ സഹായത്തോടെ വെബ് ഓട്ടോമേഷനിലേക്ക് തീവ്രത നൽകുന്നു, ഓരോ പ്രവർത്തനത്തിനും ശേഷമുള്ള സ്റ്റേറ്റ് പരിശോധിക്കുകയും, സ്വാഭാവികവും വിശദവുമായ രേഖപ്പെടുത്തലും. എന്റെ പരീക്ഷണങ്ങളിൽ, ഇത് പ്രത്യേകിച്ച് ശബ്ദം ഉണ്ടാക്കുന്ന വെബ്-ടു-ഡോക് ജോലிகளில் നല്ലതാണ് — സൈറ്റിൽ നിന്ന് ഒന്നെടുത്ത്, വിപരീതമായി രൂപപ്പെടുത്തുകയും നിങ്ങൾ പങ്കുവെക്കാവുന്ന ഡോക് അല്ലെങ്കിൽ ഷീറ്റിൽ താമസിപ്പിക്കുകയും ചെയ്യുന്നു.
ഇത് തകർന്നത്: തീവ്രം, അനിമേഷൻ കൂടിയ UI അല്ലെങ്കിൽ ക്യാപ്ചകളിൽ. ഇത് Geminiക്ക് മാത്രം പരിമിതമല്ല; ഇപ്പോഴത്തെ വിഭാഗത്തിന്റെ സ്ഥിതിയാണ്. നേട്ടം: സൈറ്റ് മനസ്സിലാക്കുമ്പോൾ, ഏജന്റ് ഫീൽ ചെയ്യുന്നത് അത്ഭുതകരമായി കഴിവുള്ളതാണ്. അല്ലാത്തപ്പോൾ, 'കുക്കി ബാനർ' എന്ന് പറയുന്നതിന് മുമ്പ് ഏത് സൈറ്റുകൾ ഓട്ടോമേഷനുമായി പ്രിയം കുറവെന്ന് നിങ്ങൾ അറിയും.
ഒരു ലഘു സഞ്ചാരം: പ്രോംപ്റ്റിൽ നിന്നാഗ്രഹഫലം വരെ
നിസ്സാര ജോലി ഓട്ടോമേറ്റ് ചെയ്യാം: മൂന്നു ഡാഷ്ബോർഡുകളിൽ നിന്നുള്ള ക്വാർട്ടറലി മെട്രിക്സ് എടുത്ത് ടീം ഡോക് അപ്ഡേറ്റ് ചെയ്യൽ.
- ആഗ്രഹം: “Acme Analytics, BetaReports, GammaBoard തുറക്കുക. Q3 ട്രാഫിക് സോഴ്സായി CSV ആയി എക്സ്പോർട്ട് ചെയ്യുക. Google Sheets-ൽ ഏക സംഘട്ടന പട്ടിക ഒരുക്കുക, തുടർന്ന് Docs-ൽ ഒറ്റ പാരഗ്രാഫ് സംഗ്രഹം സൃഷ്ടിക്കുക.”
- നിങ്ങൾ കാണുന്നത്: ഏജന്റ് ലോഗിൻ ചെയ്യും (2FA അംഗീകാരം നൽകാം), ഓരോ 'റിപ്പോർട്ടുകൾ' പേജിലേക്കും പോകുന്നു, ശരിയായ തീയതി പരിധി തിരഞ്ഞെടുക്കുന്നു, എക്സ്പോർട്ടാക്കി CSVs ഡൗൺലോഡും, ഷീറ്റ് തുറന്ന് ഓരോ ഫയലും പുതിയ ടാബിലേക്ക് ഇറക്കും, കോളം ഹെഡറുകൾ സാധാരണമാക്കുന്നു, സംയുക്ത ടാബ് ചേർക്കുന്നു, SUMIF ഫോർമുലകൾ ഇടുന്നു, പിന്നീട് ഒരു ഡോക് തുറന്ന് സംഗ്രഹ പാരഗ്രാഫ് ലിങ്കിനോടു ചേർക്കുന്നു.
- അവസാനീകരണം: നിങ്ങൾ ഡോക് കടന്ന് sentence ഒന്ന് സജ്ജീകരിച്ച് അയയ്ക്കുന്നു. 10 മിനിറ്റ് നിരീക്ഷണം vs 1 മണിക്കൂർ കരഞ്ഞ ജോലി.
പ്രശ്നപരിഹാര കോണർ: ബോട്ട് കോപത്തിലേർപ്പെടുന്നപ്പോൾ
- അവൻ തെറ്റായ ബട്ടൺ ക്ലിക്ക് ചെയ്തു: നിങ്ങളുടെ നിർദ്ദേശത്തിൽ കൂടുതലറിയിക്കുക: “Traffic > Sources-ൽ ബ്ലു ‘Download CSV’ ബട്ടൺ ക്ലിക്ക് ചെയ്യുക, മുകളിൽ വെള്ള ‘Download PDF’ അല്ല.” ഏജന്റ് നിങ്ങളുടെ വാക്കുകൾ ഉപയോഗിച്ച് ലക്ഷ്യം വ്യക്തമാക്കുന്നു.
- ഒരു പോപ്പ്-അപ്പ് പുരോഗതി തടഞ്ഞു: പോപ്പപുകളെ എങ്ങനെ കൈകാര്യം ചെയ്യണം എന്ന് പറയൂ: “എന്തെങ്കിലും ‘Rate your experience’ മോഡൽ അടയ്ക്കുക, പിന്നെ തുടരുക.” രണ്ടാം റൺ വളരെ എളുപ്പം പാസ്സാകും.
- പട്ടിക രൂപം മാറി: സ്ഥിതിക്ക് പകരം ലേബലുകൾ കാണിക്കുക: “‘Date Range’ എന്ന് സൂചിപ്പിക്കുന്ന ഡ്രോപ്ഡൗൺ തിരഞ്ഞെടുക്കുക, ‘Last quarter’.” ‘മുകളിൽ-വലത്’ അല്ലെങ്കിൽ ‘മൂന്നാം ബട്ടൺ’ ഡിസൈനർ പ്രചോദിതമായാൽ പിരിയാം.
Sider.AI (ഇതാണ് നിങ്ങൾ ഇപ്പോൾ വായിക്കുന്നത്) നിങ്ങളുടെ ബ്രൗസറിൽ ഒരു പേജ് സാന്നിദ്ധ്യ AI അസിസ്റ്റന്റുമായി ഒരുമിച്ചു നിങ്ങൾക്ക് തയാറാക്കാനും സംഗ്രഹിക്കാനും ബഹുസ്ഥിതി ജോലികൾ ഏകോപിപ്പിക്കാനുമുള്ള ഉപകരണം നൽകുന്നു. എന്റെ അനുഭവത്തിൽ, Gemini 2.5 Computer Use വഴി തിരക്കേറിയ ബ്രൗസർ പ്രവർത്തനം നടത്തുകയും Sider ഉപയോഗിച്ച് ഫലങ്ങൾ സംസ്ക്കരിക്കുകയും, ഇമെയിൽ തയാറാക്കുകയും, സംഖ്യകൾ പരിശോധിക്കുകയും ചെയ്യുന്നത് മികച്ച കോമ്പിനേഷനാണ്. മാജിക്ക് അല്ല, പക്ഷേ നിങ്ങളുടെ ബ്രൗസറിൽ താമസിക്കുന്ന പ്രൂഫ് റീഡറും കീ കാർഡ് വേണ്ടാത്ത പ്രൂഫ് റീഡറിന്റെ ശൈലി. എപ്പോഴെങ്കിലും Computer Use ഉപയോഗിക്കരുത്:
- സൈറ്റിന്റെ നിബന്ധനകൾ അല്ലെങ്കിൽ സ്വകാര്യത പ്രതീക്ഷകൾ ലംഘിക്കുന്ന പ്രവർത്തനങ്ങൾ. "അത് ക്ലിക്ക് ചെയ്യാൻ കഴിയും" എന്നാൽ "നിങ്ങൾ ക്ലിക്ക് ചെയ്യണം" എന്നല്ല.
- മറ്റൊന്നായി പകരംവെക്കാനാകാത്ത, ഓരോ ഘട്ടവും മനുഷ്യനു പരിശോധിക്കേണ്ട കാര്യങ്ങൾ - ജീവൻ ബന്ധമുള്ള അനുമതികൾക്ക് അപേക്ഷിക്കുക, വൻ തുക കൈമാറ്റം ചെയ്യുന്നവ.
- സൃഷ്ടി പ്രവൃത്തികൾ, അവിടെ തടസ്സം ക്ലിക്കുകളല്ല, വിധി: വീഡിയോ എഡിറ്റിംഗ്, ലോഗോ ഡിസൈൻ, വിലയിടപാട്. ഏജന്റ് ശേഖരിക്കും, ഫോർമാറ്റ് ചെയ്യും, പ്രമാണങ്ങൾ സൂക്ഷിക്കും; വില്പനക്കാരനെ ആകർഷിക്കാൻ ആയില്ല.
ആരംഭിക്കുന്നതിനുള്ള ചെക്ക്ലിസ്റ്റ്:
- ഓരോ ആഴ്ചയും ആവർത്തിക്കുന്ന ഒരു ഉപജോലിയും തിരഞ്ഞെടുക്കുക, ബ്രൗസറിൽ ജീവിക്കുന്നതും പ്രത്യക്ഷമായതുമായത്. “ഇന്നലെ റിപ്പോർട്ട് ഡൗൺലോഡ് ചെയ്ത് ഇവിടെ വെക്കുക.”
- ഇഷ്ടപ്പെട്ട സ്ക്രിപ്റ്റ് സാധാരണ ഇംഗ്ലീഷിൽ എഴുതുക. സ്ഥിതിക്ക് പകരം ലേബലുകൾ ഉൾപ്പെടെ; ഭാവനയ്ക്ക് പകരം ഫലം.
- പരിശോധനയിൽ പ്രവർത്തിപ്പിക്കുക. ഏതെങ്കിലും ലോഗിൻ അംഗീകാരം നൽകുക. പ്രവർത്തന ചരിത്രം നോക്കുക.
- ഗാർഡ് റെയിൽ ചേർക്കുക: “ഫോം സമർപ്പിക്കരുത്; ഡൗൺലോഡുകൾ മാത്രം പ്രിവ്യൂ ചെയ്യുക.”
- പ്രതിദിനനം: പിഴവ് വന്നാൽ ശരിയായ തിരുത്തലുകൾ വ്യക്തമാക്കുകയും പുനരാരംഭിക്കുകയും ചെയ്യുക.
നിങ്ങൾക്ക് പിന്നീട് ശ്രദ്ധിക്കേണ്ട വിതരണമുണ്ട്:
- പ്രകടനം സൈറ്റിനെ ആശ്രയിച്ചിരിക്കുന്നു: സ്ഥിരം, സുഗമമായ പേജ് = വളരെ നല്ലത്. ഡൈനാമിക്, bulky, മോപ്പുവീചുകൾ ഉള്ള പേജ് = ചെറിയ സാമഗ്രികൾ കൊണ്ടുവരിക.
- തീർച്ചയായത് കിടക്കുന്നു: ഓരോ ക്ലിക്കും ശേഷം പരിശോധനയും. അതാണ് വിശ്വസനീയമാക്കുന്നത് — സൂക്ഷ്മ ഡ്രൈവർ പോലെ, ഡ്രാഗ് റേസർ പോലെ അല്ല.
- നിങ്ങളാണ് നിയന്ത്രിക്കുന്നത്: നിങ്ങൾ പ്രവർത്തനം നിർത്താം, രേഖകൾ പരിശോധിക്കാം, അനുയോജ്യമായ അനുമതികൾ നിശ്ചയിക്കാം. വലിയ ചുവപ്പ് സ്റ്റോപ്പ് ബട്ടൺ ഉള്ള ട്രെഡ്മില്ലിനെപ്പോലെ ചിന്തിക്കുക. ഉപയോഗിക്കുക.
ശേഷം ലൈനിൽ: Gemini 2.5 Computer Use വേണ്ടത്ര മൂല്യമുണ്ടോ?
നിങ്ങളുടെ ദിവസം 'അഞ്ചു സൈറ്റുകൾ തുറക്കുക, എട്ട് ബട്ടണുകൾ വീതം ഒരേ പോലെ ക്ലിക്ക് ചെയ്യുക, ഒരേ ഡാറ്റ എടുക്കുക, എവിടേയും വെക്കുക' എന്നൽ, അതുപോലെ പ്രായോഗിക AI ആണ് ഇത്. ഇത് സയൻസ് ഫിക്ഷൻ ബട്ട്ലർ അല്ല. കണ്ണും ഉള്ള സമയത്ത് ഒരു അനുകൂല ഇന്റേൺ പോലെയാണ്, കണ്ണ് മടക്കാതെ എല്ലാവിധ രേഖകളും വെച്ചു. പുതുതായി ജോലി തുടങ്ങുന്നവർക്കായി ന്യായബുദ്ധിയോടെ സംയമനം പാലിച്ചാൽ ലാഭമുണ്ടാകും, പ്രശ്നമില്ല.
എന്റെ വാശി: ഒരു ബോറായ ജോലിയിൽ തുടക്കം കുറിച്ച് അതിനെ ഓട്ടോമേറ്റ് ചെയ്യുക, ഓരോ ആഴ്ചയും 20 മിനിറ്റ് ലാഭിക്കുക. ഒരു മാസം കഴിഞ്ഞാൽ ആഭ്യന്തരമായി എന്തും ഡൗൺലോഡ് ചെയ്തിരുന്ന കാരണം നിങ്ങൾക്ക് ആശ്ചര്യമായി. ഒരു വർഷം കഴിഞ്ഞാൽ എത്ര പാസ്വേഡുകൾ ഉണ്ടെന്നതും മറന്നു വീഴും — നിങ്ങളുടെ കൈ കൊണ്ട് ടൈപ്പ് ചെയ്യുകയില്ല.
കുറിപ്പ്: കമ്പ്യൂട്ടറുകൾ കമ്പ്യൂട്ടർ കാര്യങ്ങൾ ചെയ്യുന്ന ഭാവിയാണ്—but നിങ്ങളുടെ വിധി അതിന്റെ രഹസ്യവും. വലിയ ചുവപ്പ് ബട്ടണിലും നിങ്ങളുടെ കണങ്ങളും അവിടെയിരിക്കുക. AI ക്ലിക്ക് ചെയ്യാം, നിങ്ങൾ തീരുമാനിക്കുക എവിടെ.
കൂടുതൽ വായനയും കൈയിൽ ഉള്ള മാർഗ്ഗനിർദ്ദേശങ്ങളും
- Gemini 2.5 Computer Use യഥാർത്ഥത്തിൽ എന്ത് ചെയ്യാമെന്ന് സൗഹൃദപരമായി വിശദീകരിക്കുകയും വിവിധ ജോലികൾക്കും സുരക്ഷാ വ്യവസ്ഥകൾക്കും ഉദാഹരണങ്ങൾ നൽകുകയും ചെയ്യുന്നു.
- വിവരണം പരിഗണിച്ച് എവിടെ മികച്ചതാണ്, എവിടെ തെറ്റുകൾ ഉണ്ടാകുന്നു, സമാന ടൂൾസുമായി താരതമ്യങ്ങൾ ഉൾപ്പെടെയുള്ള പ്രായോഗിക അവലോകനം.
- ബ്രൗസർ ഓട്ടോമേഷൻ പ്രവണതകൾ നിർമ്മിക്കാൻ എങ്ങനെ എന്ന ഉദാഹരണങ്ങളോടെയും, ഡാറ്റ ശേഖരിച്ച് ശുചിത്വം വരുത്തി പങ്കുവെക്കുന്നതും ചവിട്ടിക്കൊണ്ടിരിക്കാതെ എളുപ്പം.
പ്രശ്നോത്തരികൾ
Q1: Google Gemini 2.5 Computer Use എളുപ്പത്തിൽ എന്താണ്?
പഴയ അനുഷ്ഠാനങ്ങൾ നിയന്ത്രിക്കുന്ന AI ആണ് — ക്ലിക്ക് ചെയ്യൽ, ടൈപ്പ് ചെയ്യൽ, ഡൗൺലോഡ്, നാവിഗേഷൻ എന്നിവ നിങ്ങളുടെ വാക്കുകൾ ഉൾപ്പെടുത്തി. ശ്രദ്ധയോടെ പ്രവർത്തിക്കുന്ന ഒരു സഹായിയാണ്, സ്വതന്ത്രനും ദുർബലരും അല്ല.
Q2: Gemini 2.5 Computer Use ഏതാണ് മികച്ച ജോലികൾ?
അതു പുനരാവർത്തനവും നിയമപരമായ ബ്രൗസർ ജോലികളിൽ ഉജ്വലമാണ്: പോർട്ടലുകളിൽ ലോഗിൻ ചെയ്യൽ, റിപ്പോർട്ടുകൾ എക്സ്പോർട്ട് ചെയ്യൽ, ഡാറ്റ കോപ്പി ചെയ്യൽ, ഡോക്സ് അല്ലെങ്കിൽ ഷീറ്റുകളിൽ അപ്ഡേറ്റ് ചെയ്യൽ. നിങ്ങൾ ആഴ്ച마다 ഒരേ ബട്ടണുകൾ ക്ലിക്ക് ചെയ്യുമ്പോൾ ഉപയോഗിക്കാൻ അദ്ഭുതകരമാണ്.
Q3: Gemini 2.5 Computer Use സങ്കീർണ്ണ പ്രവർത്തനങ്ങൾക്ക് സുരക്ഷിതമാണോ?
ശരിയായി ഉപയോഗിച്ചാൽ ആണൊപ്പം — നിയന്ത്രിത പരിതസ്ഥിതിയിൽ പ്രവൃത്തിപ്പിക്കുന്നു, നിങ്ങൾ കാണുകയും അനുമതികൾ നൽകുകയും പ്രവർത്തന രേഖ പരിശോധിക്കുകയും ചെയ്യാം. ലോഗിൻ, പണമിടപാട്, ഇമെയിൽ പോലുള്ള സങ്കീർണ്ണ ഘട്ടങ്ങളിൽ അംഗീകാരം എപ്പോഴും ലഭ്യമാക്കുക, ആദ്യ പ്രവർത്തനം പരീക്ഷിക്കുക.
Q4: Gemini Computer Use കൂടുതൽ വിശ്വസനീയമാക്കാൻ എങ്ങനെ?
ലേബലുകൾ ഉണ്ടാക്കുക (സ്ഥിതിക്ക് പകരം), ഹാപ്പി പാത നിർവചിക്കുക, പോപ്പപ്പ്, ഡൗൺലോഡ് നിർദേശങ്ങൾ ചേർക്കുക. ചെറിയതിൽ തുടങ്ങുക, ആദ്യ പ്രവർത്തനത്തിനു ശേഷം തിരുത്തൽ നടത്തുക, സംരക്ഷിത അക്കൗണ്ടിന് 2FA സജ്ജമാക്കുക.
Q5: Gemini 2.5 Computer Use ഏതിടങ്ങളിൽ ബുദ്ധിമുട്ടുന്നു?
ചലനശീലമുള്ള പേജുകൾ, അതിരുകടന്ന പൊപ്പോവറുകൾ, ക്യാപ്ചകൾ, ഒരേ പേരുള്ള അനേകം ബട്ടണുകൾ സങ്കീർണ്ണമാണ്. അത്തരത്തിൽ കൂടുതൽ വ്യക്തമായ നിർദേശങ്ങൾ നൽകുക, ജോലികൾ ചെറിയ ഘട്ടങ്ങളാക്കി വിഭജിക്കുക, ബുദ്ധിമുട്ടുള്ള ഭാഗങ്ങൾ മനുഷ്യനായി കൈകാര്യം ചെയ്യുക.