PPT AI-യെ ലളിതമാക്കാൻ ശ്രമിക്കുന്ന ഭാഗം
കൃത്രിമ ബുദ്ധിയിലെ (artificial intelligence) തീരുമാനമെടുക്കലിനെക്കുറിച്ച് പറയുകയാണെങ്കിൽ, എല്ലാവർക്കും അതിനെക്കുറിച്ച് അറിയാമെന്ന് ഭാവിക്കും. എപ്പോഴാണോ കൃത്യമായ ഒരു തീരുമാനമെടുക്കുന്നത് അല്ലെങ്കിൽ എളുപ്പത്തിൽ ചെയ്യാൻ പറ്റുന്ന ഒരു തെറ്റ് വരുത്തുന്നത് അപ്പോഴാണ് ഇതിന്റെ പ്രശ്നം മനസിലാവുക. പെട്ടെന്ന് അത് "വളരെ സങ്കീർണ്ണമാണ്" അല്ലെങ്കിൽ "ഒരു ബ്ലാക്ക് ബോക്സ് ആണ്" എന്നൊക്കെ പറയും. Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കലിനെക്കുറിച്ച് നിങ്ങൾ കേട്ടിട്ടുണ്ടെങ്കിൽ, നിങ്ങൾക്ക് അതിന്റെ രീതി അറിയാം: വലിയ ആരോകൾ (arrows), ഫ്ലോചാർട്ടുകൾ (flowcharts), ഒടുവിൽ സംഭവിക്കാനുള്ള കാര്യങ്ങളെക്കുറിച്ച് പറയുന്ന ചിത്രങ്ങൾ എന്നിവ ഉണ്ടാകും. എന്നാൽ അതൊരിക്കലും ഒടുവിൽ സംഭവിക്കാനുള്ള കാര്യമല്ല. അവിടെ ഓരോ കാര്യങ്ങളും തിരഞ്ഞെടുക്കാനുള്ളതാണ്.
ഇതൊരു ആഴത്തിലുള്ള വിശകലനമാണ്, AI തീരുമാനങ്ങൾ എടുക്കാൻ ഉപയോഗിക്കുന്ന യഥാർത്ഥ അൽഗോരിതങ്ങളെക്കുറിച്ചുള്ള പഠനമാണ് ഇവിടെ നൽകുന്നത്. അല്ലാതെ, വരകളുള്ള ഒരു സ്ലൈഡ് അവതരണമല്ല. AI നമ്മുക്ക് വേണ്ടി തീരുമാനമെടുക്കും എന്ന ചിന്തയിൽ നിന്നും മാറി, ഈ സിസ്റ്റം എങ്ങനെയാണ് കാര്യങ്ങൾ തിരഞ്ഞെടുക്കുന്നത് എന്ന് പറയുകയാണ് ഇതിന്റെ ലക്ഷ്യം. ഒരു സൂചന നൽകാം: സർവ്വജ്ഞാനികളായ ദിവ്യൻമാരെ പോലെയല്ല ഈ സിസ്റ്റം പ്രവർത്തിക്കുന്നത്. വണ്ടിയോടിക്കുന്നതിലെ ട്രാഫിക് ബ്ലോക്കുകളോ, കുട്ടികളെ ഉറക്കുന്നതുമായി ബന്ധപെട്ടുണ്ടാവുന്ന ബുദ്ധിമുട്ടുകളോ ഇല്ലാത്ത വളരെ വേഗത്തിൽ കാര്യങ്ങൾ മനസിലാക്കി പ്രവർത്തിക്കുന്നവരെപ്പോലെയാണ് ഇവ.
"AI-യിലെ തീരുമാനമെടുക്കൽ" എന്നതുകൊണ്ട് നമ്മൾ എന്താണ് അർത്ഥമാക്കുന്നത് (PPT-കൾ സമ്മതിക്കാത്ത കാര്യങ്ങൾ)
"കൃത്രിമ ബുദ്ധിയിലെ തീരുമാനമെടുക്കൽ" കേൾക്കുമ്പോൾ വലിയ കാര്യമായി തോന്നാം, എന്നാൽ ഇത് കുറച്ച് ടെക്നിക്കുകളുടെ ഒരു കൂട്ടമാണ്: റൂൾ അടിസ്ഥാനമാക്കിയുള്ള യുക്തി (rule-based reasoning), തിരയൽ, ഒപ്റ്റിമൈസേഷൻ (optimization), സാധ്യത അനുമാനങ്ങൾ (probabilistic inference), റീൻഫോഴ്സ്മെന്റ് ലേണിംഗ് (reinforcement learning), പ്ലാനിംഗ് (planning), കൂടാതെ ഈ പ്രശ്നത്തെ ഒന്നിപ്പിക്കുന്ന ഹൈബ്രിഡ് സിസ്റ്റം (hybrid system). അൽഗോരിതങ്ങൾക്ക് ഒന്നും "വേണം" എന്ന് തോന്നുന്നില്ല. അവ പ്രത്യേക പരിമിതികൾക്കുള്ളിൽ നിന്നുകൊണ്ട് ചില പ്രത്യേക കാര്യങ്ങൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നു. പരിമിതികളോ ഫംഗ്ഷനോ മാറ്റുകയാണെങ്കിൽ നിങ്ങൾക്ക് വേറൊരു ബുദ്ധി ലഭിക്കും. ഇത് കേൾക്കുമ്പോൾ ലളിതമായി തോന്നാം, നിങ്ങൾ SlideShare-ലെ പകുതിയിലധികം ആളുകളെക്കാൾ മുന്നിലാണ്.
Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കലിൽ മിക്ക PPT-കളിലുമുള്ള യഥാർത്ഥ പ്രശ്നം ലളിതമാക്കുക എന്നത് മാത്രമല്ല, തെറ്റായ രീതിയിൽ ലളിതമാക്കുന്നു എന്നതാണ്. മോഡലുകൾ തീരുമാനമെടുക്കുന്നത് അവ പഠിച്ചതുകൊണ്ടാണ് എന്ന് സൂചിപ്പിക്കുന്നു. പഠനം ഒരു തീരുമാനമല്ല. പഠനം നിങ്ങൾക്ക് ഒരു പോളിസിയോ മോഡലോ നൽകുന്നു. ഒരു ചെസ്സ് കളിയിലെ ആദ്യത്തെ നീക്കം പഠിക്കുന്നതും, നടുവിലുള്ള കളിയിലെ കുഴപ്പങ്ങൾക്കിടയിൽ രക്ഷപ്പെടുന്നതും തമ്മിൽ വ്യത്യാസമുണ്ട്. ആദ്യത്തേത് ഒരു പോയിന്റായി തോന്നാം, എന്നാൽ രണ്ടാമത്തേതാണ് വിജയിക്കുന്നത്.
യഥാർത്ഥ ഉപകരണങ്ങൾ: നിയമങ്ങൾ മുതൽ പ്രതിഫലം വരെ
ഈ കാര്യങ്ങൾ പഴയതാണെന്ന് തോന്നുമെങ്കിലും, ആധുനിക സിസ്റ്റങ്ങൾക്ക് ശക്തി നൽകുന്ന സാങ്കേതിക വിദ്യകൾ എന്തൊക്കെയാണെന്ന് നോക്കാം. അധികം സംസാരിക്കാനില്ല, കാര്യത്തിലേക്ക് വരാം.
റൂൾ അടിസ്ഥാനമാക്കിയുള്ള സിസ്റ്റങ്ങൾ: ഇപ്പോളും മരിച്ചിട്ടില്ല, സത്യസന്ധമാണ്
ചില AI ആളുകൾക്ക് നിയമങ്ങൾ ഒരു നാണക്കേടാണ്, സോക്സും (socks) ചെരുപ്പും ഇടുന്നത് പോലെ. പക്ഷെ റൂൾ അടിസ്ഥാനമാക്കിയുള്ള തീരുമാനമെടുക്കുന്നതിന് ഒരു വലിയ ഗുണമുണ്ട്: സുതാര്യത. ഒരു Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കൽ നിയമങ്ങളെക്കുറിച്ച് പറയാതിരുന്നാൽ, അത് പകുതി മറച്ചുവെക്കുന്നതിന് തുല്യമാണ്. വിദഗ്ധ സിസ്റ്റങ്ങൾ ഡൊമെയ്ൻ പരിജ്ഞാനം if–then സ്റ്റേറ്റ്മെന്റുകളായി എൻകോഡ് ചെയ്യുന്നു. ഇത് ദുർബലമാണ്, എന്നാൽ ഓഡിറ്റ് ചെയ്യാൻ സാധിക്കും. നിങ്ങൾക്ക് കൃത്യമായ കാര്യങ്ങൾ വേണമെങ്കിൽ (ഉദാഹരണത്തിന്: പാലിക്കൽ പരിശോധനകൾ, മെഡിക്കൽ ട്രയാജ് പ്രോട്ടോക്കോളുകൾ) നിയമങ്ങൾ ഇപ്പോളും നല്ല രീതിയിൽ പ്രവർത്തിക്കും.
- Advantage: കൃത്യമായതും, വിശദീകരിക്കാൻ എളുപ്പമുള്ളതും, തെറ്റുകൾ കണ്ടെത്താൻ എളുപ്പമുള്ളതും
- Disadvantage: ഡാറ്റകൾ കൈകാര്യം ചെയ്യാൻ ബുദ്ധിമുട്ടാണ്
ഒരു റൂൾ സിസ്റ്റം എവിടെയാണ് പരാജയപ്പെടുന്നതെന്ന് നിങ്ങൾക്ക് അറിയാൻ സാധിക്കും. എന്നാൽ മിക്ക ആധുനിക സിസ്റ്റങ്ങളും പരാജയപ്പെട്ടാൽ മിണ്ടാതിരിക്കും.
തിരയലും ഒപ്റ്റിമൈസേഷനും: തീരുമാനങ്ങൾ ഒരു വഴികാട്ടിയായി
എല്ലാത്തിനെയും ഡാറ്റ ഉപയോഗിച്ച് പരിശീലിപ്പിക്കുന്നതിന് മുൻപ്, നമ്മൾ വിവരങ്ങൾ തിരയുമായിരുന്നു. വീതിയിലുള്ള തിരയൽ, ആഴത്തിലുള്ള തിരയൽ, A*, ബീം തിരയൽ. ഇത് അത്ര ഗ്ലാമറസ് അല്ല, എന്നാൽ നിങ്ങൾ ഒരു വഴി കണ്ടെത്താൻ ശ്രമിക്കുമ്പോൾ, തിരയൽ ഒരു പ്രധാന പങ്ക് വഹിക്കുന്നു. നല്ല ലക്ഷ്യബോധമുള്ള A*, ലക്ഷ്യമില്ലാത്ത ഒരു മോഡലിനെക്കാൾ മികച്ചതാണ്.
ഒപ്റ്റിമൈസേഷൻ ഇതിനെ പൊതുവായി കാണുന്നു: നിങ്ങൾ ഒരു ലക്ഷ്യവും പരിമിതികളും വെക്കുന്നു, എന്നിട്ട് നിങ്ങൾക്ക് താങ്ങാൻ പറ്റുന്ന ഏറ്റവും നല്ല ഉത്തരം കണ്ടെത്താൻ ശ്രമിക്കുന്നു. കൃത്യസമയത്തിനുള്ളിൽ "ഏകദേശം നല്ലത്" എന്നതിൽ നിന്ന് "നല്ലത്" എന്നതിലേക്ക് എത്താൻ സഹായിക്കുന്ന ചില വഴികൾ ഉണ്ട്: ലീനിയർ പ്രോഗ്രാമിംഗ്, മിക്സഡ്-ഇന്റിജർ പ്രോഗ്രാമിംഗ്, ഇവല്യൂഷണറി അൽഗോരിതം.
- Advantage: ഉറപ്പുള്ള കാര്യങ്ങൾ, നിയന്ത്രിക്കാൻ പറ്റുന്ന ട്രേഡ് ഓഫുകൾ
- Disadvantage: മോഡലിംഗ് ബുദ്ധിമുട്ടാണ്; ലക്ഷ്യങ്ങൾ തെറ്റായി കൊടുക്കാൻ സാധ്യതയുണ്ട്.
ഒരു മോഡൽ വിചിത്രമായ എന്തെങ്കിലും ചെയ്താൽ, നിങ്ങൾ ചോദിച്ച കാര്യം കൃത്യമായി കിട്ടിയതുകൊണ്ടാണ് അങ്ങനെ സംഭവിക്കുന്നത്. നിങ്ങൾ ഉദ്ദേശിച്ചത് വേറെ എന്തെങ്കിലും ആയിരിക്കാം.
സംഭാവ്യതാപരമായ യുക്തി: ഉറപ്പില്ലായിമ ഒരു സവിശേഷതയാണ്
Bayesian നെറ്റ്വർക്കുകൾ, മറഞ്ഞിരിക്കുന്ന മാർക്കോവ് മോഡലുകൾ, കാൽമാൻ ഫിൽട്ടറുകൾ: ലോകം ഉറപ്പുള്ളതാണെന്ന് പറയുന്നതിന് പകരം, ഈ രീതികൾ ഉറപ്പില്ലായ്മയുടെ കണക്കുകൾ സൂക്ഷിക്കുകയും അതിനനുസരിച്ച് പ്രവർത്തിക്കുകയും ചെയ്യുന്നു. വേറൊരു രീതിയിൽ പറഞ്ഞാൽ, യാഥാർഥ്യബോധം.
- Advantage: ഉറപ്പില്ലാത്ത സാഹചര്യത്തിലും നല്ല രീതിയിൽ പ്രവർത്തിക്കുന്നു.
- Disadvantage: ഉയർന്ന അളവിലുള്ള ഡാറ്റ കൈകാര്യം ചെയ്യാൻ ബുദ്ധിമുട്ടാണ്.
"ആത്മവിശ്വാസ സ്കോറുകൾ" ഉപയോഗിച്ച് മിക്ക Artificial Intelligence PPT ഡെക്കുകളും സൂചിപ്പിക്കുന്നത് സംഭാവ്യതാപരമായ രീതികളാണ്. ആത്മവിശ്വാസം ഒരു സാധ്യതയല്ല. സാധ്യത എന്നത് കണക്കുകളാണ്.
റീൻഫോഴ്സ്മെന്റ് ലേണിംഗ്: പ്രതിഫലം നിയമങ്ങൾ ഉണ്ടാക്കുന്നു
റീൻഫോഴ്സ്മെന്റ് ലേണിംഗ് (Q-ലേണിംഗ്, പോളിസി ഗ്രേഡിയന്റുകൾ, ആക്ടർ-ക്രിട്ടിക് വേരിയന്റുകൾ) തീരുമാനമെടുക്കുന്നതിനെ ഒരു സ്കോർബോർഡ് ഉപയോഗിച്ച് വിലയിരുത്തുന്നതിനും തെറ്റുകൾ തിരുത്തുന്നതിനും സഹായിക്കുന്നു. നിങ്ങൾ ആക്ഷനുകൾ തിരഞ്ഞെടുക്കുന്നു, അതിനനുസരിച്ച് പരിസ്ഥിതി നിങ്ങൾക്ക് പ്രതിഫലം നൽകുന്നു, കൂടാതെ കാലക്രമേണ നിങ്ങൾക്ക് ലാഭം കിട്ടുന്ന രീതിയിലേക്ക് നിങ്ങളുടെ പോളിസിയെ മാറ്റുന്നു. ഇവിടെ AI ഒരു ഗെയിം കളിക്കുന്നതുപോലെ തീരുമാനമെടുക്കുന്നു. നിങ്ങൾ ഉണ്ടാക്കിയ ഗെയിം, നിങ്ങൾ അറിഞ്ഞോ ഇല്ലയോ എന്നത് വേറെ കാര്യം.
- Advantage: തുടർച്ചയായ തീരുമാനങ്ങൾ എടുക്കാൻ സഹായിക്കുന്നു.
- Disadvantage: പ്രതിഫലം നേടാനുള്ള എളുപ്പവഴികൾ, ലോകം ചെറുതായി മാറിയാൽപ്പോലും പെട്ടെന്ന് ഇതിന് കാര്യങ്ങൾ മനസിലാക്കാൻ സാധിക്കാതെ വരുന്നു.
റീൻഫോഴ്സ്മെന്റ് ലേണിംഗ് മനുഷ്യർ പഠിക്കുന്നതുപോലെയാണ് എന്ന് പലരും പറയാൻ ഇഷ്ടപ്പെടുന്നു. എന്നാൽ അത് ശരിയല്ല. മനുഷ്യർക്ക് മുൻപരിചയമുണ്ട്, അവർക്ക് ശരീരമുണ്ട്, അവർക്ക് വിരസതയുണ്ട്, കൂടാതെ നല്ല ചിന്തകളുണ്ട്. RL ഏജന്റുമാർക്ക് ഒരു റിവാർഡ് ഫംഗ്ഷനും, കാര്യങ്ങൾ ശരിയാകുന്നത് വരെ എന്തും ചെയ്യാൻ ക്ഷമയുമുണ്ട്.
പ്ലാനിംഗും POMDP-കളും: ലോകം പകുതി മാത്രം കാണുന്നു
യഥാർത്ഥ ലോകത്തിലെ തീരുമാനമെടുക്കൽ കൃത്യമായ വിവരങ്ങളോടെ വരാറില്ല. POMDP-കൾ (Partially Observable Markov Decision Processes) ഉറപ്പില്ലായ്മയെ വ്യക്തമായി കാണിക്കുന്നു: നിങ്ങൾക്ക് അവസ്ഥ അറിയില്ല, അതിനെക്കുറിച്ചുള്ള സൂചനകൾ മാത്രമേ ഉണ്ടാകൂ. കാണാത്ത കാര്യങ്ങൾ വെച്ച് പ്ലാൻ ചെയ്യുമ്പോൾ ഒരു വിശ്വാസമുണ്ടാകും. അതിനനുസരിച്ച് കാര്യങ്ങൾ നടക്കുന്നു എന്ന് വിശ്വസിക്കുക.
- Advantage: ഉറപ്പില്ലായ്മയെക്കുറിച്ച് സത്യസന്ധമായി പറയുന്നു.
- Disadvantage: കണക്കുകൂട്ടാൻ ബുദ്ധിമുട്ടാണ്.
നിങ്ങളുടെ Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കൽ POMDP-യെക്കുറിച്ച് പറയുന്നില്ലെങ്കിൽ, നിങ്ങൾ യാഥാർത്ഥ്യത്തെ ഒരു ഓപ്ഷണൽ സെറ്റിംഗ് ആയിട്ടാണ് കാണുന്നത്.
ഹൈബ്രിഡ് സിസ്റ്റങ്ങളും ന്യൂറോ-സിംബോളിക് മാഷപ്പുകളും
ന്യൂറൽ നെറ്റ്വർക്കുകൾ കാണുകയും ലേബൽ ചെയ്യുകയും ചെയ്യുന്നു; സിംബോളിക് സിസ്റ്റങ്ങൾ വിശദീകരിക്കുകയും നിയന്ത്രിക്കുകയും ചെയ്യുന്നു. ഇത് രണ്ടുംകൂടി ചേർത്താൽ ഉപകാരപ്രദമാകും. കാഴ്ചക്ക് വിഷൻ മോഡലും, സുരക്ഷക്ക് നിയമങ്ങളും ഉപയോഗിക്കുക. സാധ്യമായ കാര്യങ്ങൾ ചെയ്യാൻ ലാംഗ്വേജ് മോഡലും, അതിനായുള്ള പ്ലാനർ ഉപയോഗിക്കുക. ഈ ഹൈബ്രിഡുകൾ ട്രെൻഡി മാത്രമല്ല, എഞ്ചിനീയറിംഗ് വിനയത്തെയും ഇത് കാണിക്കുന്നു: ബുദ്ധിമുട്ടുള്ള കാര്യങ്ങൾ പഠിച്ച മോഡൽ ഉപയോഗിച്ച് ചെയ്യുക, പ്രധാനപ്പെട്ട കാര്യങ്ങൾക്ക് കൃത്യമായ ലോജിക് ഉപയോഗിക്കുക.
- Advantage: ഉപയോഗിക്കാൻ എളുപ്പമാണ്.
- Disadvantage: ഒരുപോലെ ചേർത്ത് വെക്കാൻ ബുദ്ധിമുട്ടാണ്.
തീരുമാന ലൂപ്പ്: മെഷീനുകൾക്കായുള്ള OODA
മിക്ക AI തീരുമാന സിസ്റ്റങ്ങളും ഒരു ലൂപ്പിലാണ് പ്രവർത്തിക്കുന്നത്: നിരീക്ഷിക്കുക, അനുമാനിക്കുക, പ്ലാൻ ചെയ്യുക, പ്രവർത്തിക്കുക, വീണ്ടും ആവർത്തിക്കുക. ഓരോ സ്റ്റെപ്പുകളും പ്രധാനപ്പെട്ടതാണ്. എല്ലാം ശ്രദ്ധിക്കുക, നിങ്ങളുടെ ഉറപ്പില്ലായ്മ നിലനിർത്തുക, സമയത്തിനനുസരിച്ച് പ്ലാൻ ചെയ്യുക, ലോകം കത്തുന്ന രീതിയിലുള്ള പ്രവർത്തികൾ ചെയ്യാതിരിക്കുക.
- Raw ഡാറ്റയിൽ നിന്ന് ഫീച്ചറുകളിലേക്ക് വിവരങ്ങൾ നഷ്ടപ്പെടാൻ സാധ്യതയുണ്ട്, എന്നാൽ ശരിയായ വിവരങ്ങൾ നിലനിർത്താൻ ശ്രമിക്കുക.
- പ്രവചനത്തിൽ നിന്ന് വിശ്വാസത്തിലേക്ക്: ഫീച്ചറുകളിൽ നിന്ന് എന്താണ് സംഭവിക്കുന്നതിനെക്കുറിച്ചുള്ള വിവരങ്ങൾ നൽകുക.
- പോളിസിയിൽ നിന്ന് പ്ലാനിലേക്ക്: കമ്പ്യൂട്ടിനെയും അപകടസാധ്യതയെയും ആശ്രയിച്ച് ഒരു ആക്ഷൻ ക്രമം രൂപപ്പെടുത്തുക.
- ആക്ഷൻ ടു ഫീഡ്ബാക്ക്: പ്രവർത്തിക്കുക, അതിൽനിന്നുമുള്ള ഫലം അളക്കുക, വിശ്വാസങ്ങളും പാരാമീറ്ററുകളും അപ്ഡേറ്റ് ചെയ്യുക. നിങ്ങളുടെ ലൂപ്പ് അനുഭവത്തിൽ നിന്ന് മെച്ചപ്പെടുന്നില്ലെങ്കിൽ, അത് ഓട്ടോമേഷനാണ്, AI അല്ല.
Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കലിൽ ഏറ്റവും വലിയ തെറ്റ് ലൂപ്പ് വൃത്തിയുള്ളതാണെന്ന് വിശ്വസിക്കുന്നതാണ്. പ്രവർത്തനത്തിൽ, സെൻസറുകൾ മാറും, ആളുകൾ ഇടപെടും, അളവുകൾ പരസ്പരം പോരാടും. ലോകം മാറുമ്പോൾ നല്ല സിസ്റ്റങ്ങൾ തകരാറുകൾ ഇല്ലാതെ പ്രവർത്തിക്കും.
അൽഗോരിതങ്ങളിലേക്ക് ആഴത്തിലുള്ള വിശകലനം
യഥാർത്ഥത്തിൽ ആളുകൾ ഉപയോഗിക്കുന്ന അൽഗോരിതങ്ങൾ എന്തൊക്കെയാണെന്ന് നോക്കാം.
Multi-Armed Bandits:
നിങ്ങൾ പുതിയ കാര്യങ്ങൾ പരീക്ഷിക്കുന്നതും, നല്ലരീതിയിൽ പ്രവർത്തിക്കുന്നവയെ ഉപയോഗിക്കുന്നതും തമ്മിൽ ബാലൻസ് (balance) ചെയ്യേണ്ടി വരുമ്പോൾ, മൾട്ടി-ആംഡ് ബാൻഡിറ്റ് A/B ടെസ്റ്റിംഗിനെക്കാൾ നല്ലതാണ്. Thompson sampling ആണ് കൂടുതൽ ആളുകളും ഉപയോഗിക്കുന്നത്.
- ഇവ ഉപയോഗിക്കാൻ പറ്റിയത്: ഫീഡ്ബാക്ക് ലഭിക്കുന്ന ഓൺലൈൻ തീരുമാനങ്ങൾ എടുക്കാൻ
- ഇവ ഉപയോഗിക്കാൻ പാടില്ലാത്തത്: വലിയ കാര്യങ്ങൾ തീരുമാനിക്കുമ്പോൾ, സുരക്ഷ പ്രധാനമായുള്ള കാര്യങ്ങളിൽ
Monte Carlo Tree Search:
MCTS എല്ലാ സാധ്യതകളും എടുക്കുന്നില്ല, സാധ്യമായവ മാത്രം എടുക്കുന്നു. ഇത് അൽഗോരിതത്തിന് തുല്യമാണ്. ഗെയിമുകളിലും പ്ലാനിംഗിലും ഇത് വിജയിക്കും. എന്നാൽ ഇത് ഇല്ലാത്ത കാര്യങ്ങൾ ഉണ്ടെന്ന് വിശ്വസിപ്പിക്കും.
- ഇവ ഉപയോഗിക്കാൻ പറ്റിയത്: ഗെയിമുകൾ, പ്ലാനിംഗ്
- ഇവ ഉപയോഗിക്കാൻ പാടില്ലാത്തത്: മനുഷ്യർ, മാർക്കറ്റ്, {Twitter}
Dynamic Programming:
Bellman equations, value iteration, policy iteration എന്നിവ കൺട്രോൾ തിയറിയുടെ പ്രധാന ഭാഗമാണ്.
- ഇവ ഉപയോഗിക്കാൻ പറ്റിയത്: ചെറിയ Markovian ലോകങ്ങൾ
- ഇവ ഉപയോഗിക്കാൻ പാടില്ലാത്തത്: ബാക്കിയുള്ളവയിലെല്ലാം
Heuristics and Metaheuristics:
Simulated annealing, tabu search, genetic algorithms എന്നിവ കുറഞ്ഞ അളവിൽ മാത്രം ഉപയോഗിക്കുന്ന ചില വഴികളാണ്.
- ഇവ ഉപയോഗിക്കാൻ പറ്റിയത്: സമയം കുറവുള്ളപ്പോൾ
- ഇവ ഉപയോഗിക്കാൻ പാടില്ലാത്തത്: വേഗതയെക്കാൾ ഉറപ്പിന് പ്രാധാന്യം കൊടുക്കുമ്പോൾ
Causal Models:
Causal decision-making നിങ്ങൾക്ക് എന്തെങ്കിലും മാറ്റം വരുത്താൻ സാധിക്കുമോ എന്ന് ചോദിക്കാൻ ഒരു വഴി നൽകുന്നു. Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കൽ കാഷ്വൽ ഇൻഫറൻസിനെക്കുറിച്ച് പറയുന്നില്ലെങ്കിൽ, നിങ്ങൾ ഖേദത്തിനുള്ള ഒരു എഞ്ചിനാണ് ഉണ്ടാക്കുന്നത്.
- ഇവ ഉപയോഗിക്കാൻ പറ്റിയത്: പോളിസി, മെഡിസിൻ
- ഇവ ഉപയോഗിക്കാൻ പാടില്ലാത്തത്: പ്രവചനങ്ങൾ ആവശ്യമുള്ളപ്പോൾ
രണ്ട് ബുദ്ധിമുട്ടുള്ള പ്രശ്നങ്ങൾ: ലക്ഷ്യങ്ങളും പരിമിതികളും
AI തീരുമാനമെടുക്കുന്നതിലെ ആദ്യത്തെ കള്ളം നമ്മൾ "പ്രകടനം" ഒപ്റ്റിമൈസ് ചെയ്യുന്നു എന്നതാണ്. എന്താണ് ഒപ്റ്റിമൈസ് ചെയ്യുന്നത്? ക്ലിക്കുകളോ, പ്രവർത്തന സമയമോ, വരുമാനമോ, സുരക്ഷയോ, കൃത്യതയോ? നിങ്ങൾ ഇത് പറയുന്നില്ലെങ്കിൽ, നിങ്ങൾ ആഗ്രഹിക്കുകയാണ്.
- Trade-off-കൾ ഒരു തെറ്റല്ല. അത് ജോലിയുടെ ഭാഗമാണ്.
- പരിമിതികൾ ഒരു ചിന്തയല്ല. ദോഷം എങ്ങനെ ഇല്ലാതാക്കാം എന്നതാണ് ഇത് കൊണ്ട് ഉദ്ദേശിക്കുന്നത്. നിങ്ങൾ എഴുതുന്നത് കാര്യമായി എടുക്കുക.
കൂടുതൽ ഡാറ്റ ഒരു മോശം ലക്ഷ്യത്തെ പരിഹരിക്കുമെന്ന് കരുതുന്നത് ഒരു തെറ്റിദ്ധാരണയാണ്.
വിശദീകരണം ഒരു ഓപ്ഷനല്ല; അതൊരു പ്രധാനപ്പെട്ട കാര്യമാണ്
വിശദീകരിക്കാൻ സാധിക്കുന്ന AI ഒരു ശല്യമായി തോന്നാം. എന്നാൽ അത് തെറ്റാണ്. "വിശദീകരണം" എന്നത് തീരുമാനത്തെ ആശ്രയിക്കുന്ന ആളുകളുമായി വിശ്വാസം ഉണ്ടാക്കാൻ സഹായിക്കും. എഞ്ചിനീയർമാർക്ക് പോലും അത് ആവശ്യമാണ്. ഒരു മോഡൽ എന്തിനാണ് ഇടത്തേക്ക് തിരിയാൻ പറഞ്ഞതെന്ന് അറിയേണ്ടത് ഒരു അപകടം സംഭവിക്കാതിരിക്കാൻ വേണ്ടിയാണ്.
- ഒരു വിശദീകരണം നൽകുന്നതിലും നല്ലത് മുൻകൂട്ടി അറിയാൻ സാധിക്കുന്നതാണ്.
- കൃത്യമായ സ്വഭാവത്തിന് ഊന്നൽ നൽകുന്ന മോഡലുകൾ ഉണ്ടാക്കുക.
Artificial Intelligence PPT-യിലെ തീരുമാനമെടുക്കൽ ഒരു കളർഫുൾ ഹീറ്റ്മാപ്പ് (colorful heatmap) കാണിക്കുകയും അത് അവിടെ അവസാനിക്കുകയും ചെയ്താൽ, ഒരു സിസ്റ്റം എങ്ങനെ പ്രവർത്തിപ്പിക്കരുതെന്ന് നിങ്ങൾ പഠിച്ചു.
വലിയ ഭാഷാ മോഡലുകളും തീരുമാനങ്ങളും
LLM-കൾക്ക് തീരുമാനങ്ങൾ എടുക്കാൻ സാധിക്കും. ഓപ്ഷനുകൾ പറയാനും, നല്ലതും ചീത്തതുമായ കാര്യങ്ങൾ പറയാനും ഇതിന് സാധിക്കും. എന്നാൽ ഇതിന്റെ മോശം ഭാഗം എന്തെന്നാൽ, ഇത് ഉണ്ടാക്കുകയാണെങ്കിൽ പോലും ആത്മവിശ്വാസത്തോടെ സംസാരിക്കും.
മോഡലിനെക്കൊണ്ട് തീരുമാനം എടുപ്പിക്കുന്നതിന് പകരം, മോഡലിനെക്കൊണ്ട് കാര്യങ്ങൾ പറയിപ്പിക്കുക. എന്നിട്ട് നിയമങ്ങൾ വെച്ച് അതിനെ നിയന്ത്രിക്കുക, ഒരു പ്ലാനർ അല്ലെങ്കിൽ ഒപ്റ്റിമൈസർ ഉപയോഗിച്ച് ശരിയാണോ എന്ന് ഉറപ്പുവരുത്തുക. LLM-കളെ ലൂപ്പിൽ വെക്കുക, സ്റ്റിയറിംഗിൽ വെക്കാതിരിക്കുക.
സ്ലൈഡുകളിൽ നിന്ന് സിസ്റ്റങ്ങളിലേക്ക്: എങ്ങനെയാണ് കാര്യങ്ങൾ പ്രവർത്തിക്കുന്നത്
AI-യിലെ ഒരു ഫങ്ഷണൽ തീരുമാനമെടുക്കൽ സിസ്റ്റം ഒരു സ്ലൈഡ് പോലെ തോന്നുന്നില്ല. അത് ഇങ്ങനെയാണ്:
- കൃത്യമായ ഒരു ലക്ഷ്യം ഉണ്ടായിരിക്കണം.
- ചെയ്യേണ്ടതും ചെയ്യെണ്ടാത്തതുമായ കാര്യങ്ങൾ ഉണ്ടായിരിക്കണം.
- തെറ്റുകൾ സംഭവിക്കാൻ സാധ്യതയുള്ള ഡാറ്റകൾ ഉണ്ടായിരിക്കണം.
- പഠിച്ച കാര്യങ്ങൾ, സ്റ്റാറ്റിസ്റ്റിക്കൽ അനുമാനങ്ങൾ, കൂടാതെ ഉറപ്പില്ലാത്ത കാര്യങ്ങൾ പറയാൻ സാധിക്കുന്ന ഒരു പോളിസി എന്നിവ ഉണ്ടായിരിക്കണം.
- എല്ലാം നിരീക്ഷിക്കാൻ സാധിക്കണം.
- തെറ്റായ കാര്യങ്ങൾ തിരുത്താൻ ആളുകൾ ഉണ്ടായിരിക്കണം.
AI സ്വയം പ്രവർത്തിക്കണം എന്ന് ചിലർ പറയുന്നു. ഒരുപക്ഷെ, സ്വന്തമായി കാര്യങ്ങൾ ചെയ്യുന്നതിലും നല്ലത് കുറച്ചുകൂടി ശ്രദ്ധിച്ച് ചെയ്യുനതല്ലേ.
ഉപകരണങ്ങളെക്കുറിച്ചുള്ള ചോദ്യങ്ങൾ
ലൈബ്രറികളും സേവനങ്ങളും ഉപയോഗിച്ച് നിങ്ങൾക്ക് ഈ തീരുമാനം എടുക്കുന്നതിന് ആവശ്യമായ കാര്യങ്ങൾ കൂട്ടിച്ചേർക്കാൻ സാധിക്കും. നല്ലവ ധാരാളമുണ്ട്. എന്നാൽ കുറഞ്ഞ എണ്ണം സ്ഥിരതയുള്ളതാണ്. നല്ല രീതിയിലുള്ള കാര്യങ്ങൾ ചെയ്യുന്നത് കൂടുതൽ എളുപ്പമാക്കുന്നു.
ഒരു ഉദാഹരണമായി Sider.AI പരിഗണിക്കാവുന്നതാണ്. ഇത് നിങ്ങൾക്ക് ഒരുപാട് കാര്യങ്ങൾ എളുപ്പമാക്കുന്നു. ചിന്തിക്കാനുള്ള കാര്യങ്ങൾ എളുപ്പത്തിൽ ക്രമീകരിക്കാനും, അൽഗോരിതമിക് ഓപ്ഷനുകൾ താരതമ്യം ചെയ്യാനും, LLM സഹായം ഉൽപ്പാദനക്ഷമമാക്കാനും ഇത് സഹായിക്കുന്നു. പതിപ്പുകൾ തമ്മിലുള്ള മാറ്റങ്ങൾ അറിയാനും ഇത് സഹായിക്കുന്നു. AI PPT സർക്യൂട്ടിലെ പൊതുவான മിഥ്യാധാരണകൾ
- കൂടുതൽ ഡാറ്റകൾ നല്ല മോഡലുകളെ തോൽപ്പിക്കും എന്നത് ഒരു മിഥ്യധാരണയാണ്. ചിലപ്പോൾ അത് നല്ല ചിന്തകളെ തോൽപ്പിക്കും. കുറഞ്ഞ ഡാറ്റ ഉപയോഗിച്ച് കൃത്യമായ ലക്ഷ്യത്തോടെ പ്രവർത്തിക്കുന്നത്, തെറ്റായ ഡാറ്റ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നതിലും നല്ലതാണ്.
- "ബ്ലാക്ക് ബോക്സ് ഒഴിവാക്കാൻ പറ്റാത്തതാണ്." എന്നത് ഒരു മിഥ്യധാരണയാണ്.
- "പര്യവേക്ഷണം അപകടകരമാണ്." എന്നത് ഒരു മിഥ്യധാരണയാണ്.
- "ഓട്ടോണമി ആണ് ലക്ഷ്യം." എന്നത് ഒരു മിഥ്യധാരണയാണ്. വിശ്വാസ്യതയാണ് ലക്ഷ്യം.
Caselets:
- Logistics Routing: A* ഉപയോഗിച്ച് കാര്യങ്ങൾ എളുപ്പമാക്കുക, MILP ഉപയോഗിച്ച് ചിലവ് കുറയ്ക്കുക.
- മെഡിക്കൽ ട്രയാജ്: സുരക്ഷക്ക് നിയമങ്ങളും, അപകടസാധ്യതകൾ അറിയാൻ മോഡലുകളും ഉപയോഗിക്കുക.
- Content Moderation: നിയമപരമായ കാര്യങ്ങൾക്കായി ക്ലാസിഫയർ ഉപയോഗിക്കുക.
ഒരു തീരുമാന സിസ്റ്റത്തെ എങ്ങനെ വിലയിരുത്താം
മൂന്ന് ചോദ്യങ്ങൾ ചോദിക്കുക:
- നിങ്ങൾ എന്താണ് ഒപ്റ്റിമൈസ് ചെയ്യുന്നത്? ഉത്തരം ഒന്നോ അതിലധികമോ വാക്യങ്ങളിൽ പറയുക.
- ലോകം മാറുമ്പോൾ എന്ത് സംഭവിക്കും? അവർ അതിനെക്കുറിച്ച് ചിന്തിച്ചിട്ടില്ലെങ്കിൽ ഉത്തരം "വീണ്ടും പരിശീലിപ്പിക്കുക" എന്നായിരിക്കും.
- നിങ്ങൾ തെറ്റാണെന്ന് നിങ്ങൾക്ക് എങ്ങനെ അറിയാം? മറുപടി നിശബ്ദതയാണെങ്കിൽ, അവിടെ നിന്ന് പോവുക.
സ്വന്തമായി എങ്ങനെ കാര്യങ്ങൾ ചെയ്യാം
നിങ്ങളുടേതായ Artificial Intelligence PPT ഉണ്ടാക്കുകയാണെങ്കിൽ, സത്യസന്ധതയോടെ ഉണ്ടാക്കുക:
- തീരുമാന ലൂപ്പും നിങ്ങളുടെ ലക്ഷ്യവും വെച്ച് തുടങ്ങുക.
- "പഠനത്തെയും" "തീരുമാനത്തെയും" വേർതിരിക്കുക.
- നിങ്ങളുടെ പരിമിതികളും അത് എത്രത്തോളം പ്രധാനമാണെന്നും പറയുക.
- Perception, inference, planning എന്നിവയ്ക്കായി അൽഗോരിതങ്ങൾ തിരഞ്ഞെടുക്കുക. ഓരോന്നിന്റെയും പരാജയ സാധ്യതകൾ പറയുക.
- Monitoring വിശദീകരിക്കുക.
- പരിഹരിക്കാത്ത അപകടസാധ്യതകൾ വെച്ച് അവസാനിപ്പിക്കുക. നിങ്ങൾക്ക് അപകടസാധ്യതകൾ ഒന്നുമില്ലെങ്കിൽ, നിങ്ങൾ പൂർത്തിയാക്കിയിട്ടില്ലെന്ന് മനസിലാക്കുക.
"എനിക്കറിയില്ല" എന്ന് പറയുന്നതിന്റെ നല്ലവശം
കൃത്രിമബുദ്ധി സംവിധാനങ്ങൾക്ക് വിട്ടുനിൽക്കാൻ കഴിയണം. ഇതിനെ അനിശ്ചിതത്വ ബോധമുള്ള തീരുമാനമെടുക്കൽ, സെലക്ടീവ് പ്രെഡിക്ഷൻ എന്നെല്ലാമോ വിളിക്കാം. 'കടന്നുപോവുക' എന്ന് പറയാനുള്ള കഴിവാണ് ഒരു ടൂളിനെയും ബാധ്യതയെയും തമ്മിൽ വേർതിരിക്കുന്നത്. മനുഷ്യർ ഇത് സ്വയമേവ ചെയ്യുന്നു. എന്നാൽ, അതിന് കഴിയാത്ത നിരവധി സിസ്റ്റങ്ങൾ നമ്മൾ നിർമ്മിച്ചിട്ടുണ്ട്.
ഇത് നമ്മളെ എവിടെ എത്തിക്കുന്നു
കൃത്രിമബുദ്ധിയിലെ തീരുമാനമെടുക്കൽ ഒരു മാന്ത്രികവിദ്യയല്ല, കൂടാതെ അൽഗോരിതങ്ങളിലേക്കുള്ള ആഴത്തിലുള്ള വിശകലനം ഒരു പുതിയ മതത്തിനായുള്ള പിച്ച് ഡെക്ക് പോലെ വായിക്കരുത്. ഇത് എഞ്ചിനീയറിംഗാണ് - ശ്രദ്ധാപൂർവമായ ലക്ഷ്യങ്ങൾ, വ്യക്തമായ നിയന്ത്രണങ്ങൾ, തുറന്ന അനിശ്ചിതത്വം, കൂടാതെ വിശ്വാസ്യതയ്ക്കായി ചാരുത ഉപേക്ഷിക്കാനുള്ള സന്നദ്ധത എന്നിവ ഇതിൽ അടങ്ങിയിരിക്കുന്നു. അടുത്ത തവണ ഒരു PPT സിസ്റ്റം 'തീരുമാനമെടുക്കാൻ പഠിച്ചു' എന്ന് നിങ്ങളോട് പറഞ്ഞാൽ, പാലം തകർന്നാൽ എന്ത് സംഭവിക്കും, മെട്രിക് തെറ്റാണെങ്കിൽ എന്ത് സംഭവിക്കും, അല്ലെങ്കിൽ ഉപയോക്താവ് ആരും പ്രവചിക്കാത്ത എന്തെങ്കിലും ചെയ്താൽ എന്ത് സംഭവിക്കും എന്ന് ചോദിക്കുക.
ഉത്തരം ഒരു വലിയ ആരോ ആണെങ്കിൽ, നിങ്ങൾക്ക് നിങ്ങളുടെ തീരുമാനം ലഭിച്ചു.
കീവേർഡ്-അവെയർ അനുബന്ധം (കീവേർഡ് സ്റ്റഫ് ചെയ്യാതെ)
- കൃത്രിമബുദ്ധിയിൽ തീരുമാനമെടുക്കൽ: വ്യക്തമായ ലക്ഷ്യങ്ങളും നിയന്ത്രണങ്ങളും ഉപയോഗിച്ച് അനിശ്ചിതത്വത്തിൽ പ്രവർത്തനങ്ങൾ തിരഞ്ഞെടുക്കുന്ന രീതി.
- അൽഗോരിതങ്ങളിലേക്ക് ആഴത്തിലുള്ള വിശകലനം: ഒരു രൂപകമല്ല—തിരയൽ, ഒപ്റ്റിമൈസേഷൻ, പ്രോബബിലിസ്റ്റിക് ഇൻഫറൻസ്, റീഇൻഫോഴ്സ്മെൻ്റ് ലേണിംഗ്, പ്ലാനിംഗ്, കാഷ്വൽ മോഡലിംഗ്, ഹൈബ്രിഡുകൾ.
- പ്രായോഗികമായ കാര്യം: രീതികൾ സംയോജിപ്പിക്കുക, നിയന്ത്രണങ്ങൾ ശക്തമാക്കുക, അനിശ്ചിതത്വം സ്വീകരിക്കുക, എല്ലാം രേഖപ്പെടുത്തുക, ഒരു സ്ലൈഡിനെ ഒരു സിസ്റ്റമായി കണക്കാക്കാതിരിക്കാൻ ശ്രമിക്കുക.
FAQ
Q1: കൃത്രിമബുദ്ധിയിൽ തീരുമാനമെടുക്കൽ എന്നാൽ എന്താണ്?
ഇതൊരു പ്രത്യേക ലക്ഷ്യവും നിയന്ത്രണങ്ങളുമുള്ള അനിശ്ചിതത്വത്തിൽ പ്രവർത്തനങ്ങൾ തിരഞ്ഞെടുക്കുന്നതാണ് - തോന്നലുകളല്ല. ലോകം പരിശീലന സെറ്റിനുമായി പൊരുത്തപ്പെടാൻ വിസമ്മതിക്കുമ്പോൾ മോഡൽ, ഡാറ്റ, ഗാർഡ്റെയിലുകൾ എന്നിവ എങ്ങനെ ഒരുമിച്ച് പ്രവർത്തിക്കുന്നു എന്നതാണ് രസകരമായ ഭാഗം.
Q2: AI തീരുമാനമെടുക്കുന്നതിലേക്ക് ആഴത്തിൽ ഇറങ്ങിച്ചെല്ലുമ്പോൾ ഏതൊക്കെ അൽഗോരിതങ്ങളാണ് പ്രധാനമാകുന്നത്?
തിരയൽ, ഒപ്റ്റിമൈസേഷൻ, പ്രോബബിലിസ്റ്റിക് റീസണിംഗ്, റീഇൻഫോഴ്സ്മെൻ്റ് ലേണിംഗ്, പ്ലാനിംഗ്, കാഷ്വൽ മോഡലുകൾ എന്നിവയാണ് ഇതിന്റെ അടിസ്ഥാനം. പഠിച്ചെടുത്ത പെർസെപ്ഷനെ സിംബോളിക് നിയമങ്ങളുമായി സംയോജിപ്പിക്കുന്ന ഹൈബ്രിഡ് സിസ്റ്റങ്ങളാണ് യഥാർത്ഥത്തിൽ നിലനിൽക്കുന്നത്.
Q3: വലിയ ഭാഷാ മോഡലുകൾ തീരുമാനമെടുക്കുന്നതിന് നല്ലതാണോ?
ഓപ്ഷനുകൾ നിർദ്ദേശിക്കുന്നതിനും പ്ലാനുകൾക്ക് രൂപം നൽകുന്നതിനും അവ മികച്ചതാണ്, എന്നാൽ പരിശോധിക്കാത്ത തീരുമാനമെടുക്കുന്നവരെ നിലയിൽ അവ മോശമാണ്. LLM-കളെ ലൂപ്പിൽ ഉപയോഗിക്കുക: നിർദ്ദേശിക്കുക, നിയന്ത്രിക്കുക, സാധൂകരിക്കുക - തുടർന്ന് ഒരു അഭിഭാഷകനോട് വിശദീകരിക്കേണ്ടി വരുമെന്ന് കരുതി ഓരോ ഘട്ടവും രേഖപ്പെടുത്തുക.
Q4: കൃത്രിമബുദ്ധിയിലെ തീരുമാനമെടുക്കൽ PPT-യിലെ ഏറ്റവും വലിയ തെറ്റുകൾ എങ്ങനെ ഒഴിവാക്കാം?
പഠനത്തെ തീരുമാനമെടുക്കുന്നതിൽ നിന്ന് വേർതിരിക്കുക, ലക്ഷ്യം നിർവ്വചിക്കുക, നിയന്ത്രണങ്ങൾ വ്യക്തമാക്കുക. പരാജയ സാധ്യതകളും നിരീക്ഷണവും കാണിക്കുക - നിങ്ങളുടെ ഡെക്കിൽ മുഴുവൻ ആരോകളും ട്രേഡ്-ഓഫുകളുമില്ലെങ്കിൽ, അത് നാടകമാണ്, എഞ്ചിനീയറിംഗല്ല.
Q5: AI തീരുമാനമെടുക്കൽ വർക്ക്ഫ്ലോകളിൽ Sider.AI-യുടെ പങ്ക് എന്താണ്?
Sider.AI ആശയവിനിമയത്തിനുള്ള വർക്ക്ഫ്ലോകൾ നിർമ്മിക്കുന്നതിനും താരതമ്യം ചെയ്യുന്നതിനും പരിശോധിക്കുന്നതിനും സഹായിക്കുന്നു. അതിനാൽ മാർക്കറ്റിംഗ് ആഗ്രഹിക്കുന്നിടത്ത് LLM സഹായം നൽകുന്നതിനുപകരം എവിടെയാണോ അത് പ്രവർത്തിക്കുന്നത് അവിടെ നൽകാനാകും. മാന്ത്രികവടി എന്നതിലുപരി പ്രായോഗികമായ ആവർത്തനത്തെക്കുറിച്ച് ചിന്തിക്കുക.