पीपीटी (PPT) एआय (AI) ला सोपे दाखवण्याचा प्रयत्न करते तो भाग
कृत्रिम बुद्धिमत्तेतील (artificial intelligence) निर्णय प्रक्रियेबद्दल (decision making) बोलायचं झाल्यास, प्रत्येकजण समजल्याचा आव आणतो - जोपर्यंत ते एकतर हुशारीने निर्णय घेत नाही किंवा एखादी चूक करत नाही. मग अचानक ते 'खूप क्लिष्ट' किंवा 'ब्लॅक बॉक्स' आहे, असं बोलतात, जणू काही गणिताचा केळीच्या सालीवरुन पाय घसरला. जर तुम्ही कधी 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिया' (Decision Making in Artificial Intelligence) यावर आधारित {PPT} पाहिले असेल, तर तुम्हाला कल्पना असेल: मोठे बाण, फ्लोचार्ट आणि क्लिपआर्टचा वापर करतात, जे अटळता दर्शवतात. पण ते अटळ नाही. तो पूर्णपणे निवडीचा भाग आहे.
हा एआय (AI) निर्णय घेण्यासाठी वापरल्या जाणाऱ्या अल्गोरिदमचा सखोल अभ्यास आहे—खऱ्या अल्गोरिदमचा, बॉक्स असलेल्या बाणांच्या स्लाइड डेकचा नाही. ‘एआय (AI) आपल्यासाठी निर्णय घेईल’ हे नाटक कमी करणे आणि या प्रणाली प्रत्यक्षात निवड कशी करतात याबद्दल बोलणे हा यामागचा उद्देश आहे. स्पॉयलर: ते सर्वज्ञानी भविष्यवक्त्यांसारखे नाहीत, तर खूप वेगवान, अतिशय अचूक तर्क करणारे आहेत, ज्यांना कधीही ट्रॅफिकमध्ये थांबावे लागले नाही किंवा लहान मुलांच्या झोपण्याच्या वेळेसाठी समजूत काढावी लागली नाही.
'एआय (AI) मध्ये निर्णय घेणे' म्हणजे काय (आणि {PPT} क्वचितच मान्य करतात)
'कृत्रिम बुद्धिमत्तेमध्ये निर्णय घेणे' हे ऐकायला खूप मोठे वाटते, पण प्रत्यक्षात तो नियमांवर आधारित तर्क, शोध, ऑप्टिमायझेशन (optimization), संभाव्य अनुमान, मजबुतीकरण शिक्षण, नियोजन आणि संकरित प्रणाली (hybrid systems) यांचा एकत्रित भाग आहे. अल्गोरिदमला काहीही 'नको' नसते. ते विशिष्ट कार्ये विशिष्ट परिस्थितीत अनुकूल करतात. कार्य किंवा परिस्थिती बदला आणि तुम्हाला वेगळी 'बुद्धिमत्ता' मिळते. जर हे तुम्हाला स्पष्ट वाटत असेल, तर अभिनंदन—तुम्ही {SlideShare} वरील अर्ध्याहून अधिक डेकपेक्षा पुढे आहात.
खऱ्या 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रियेच्या' {PPT} मध्ये समस्या ही नाही की ते सोपे करतात, तर ते चुकीच्या दिशेने सोपे करतात. त्यातून असं दिसून येतं की मॉडेल्स (models) 'शिकल्यामुळे' निर्णय घेतात. शिकणे म्हणजे निर्णय घेणे नाही. शिकल्याने तुम्हाला धोरण किंवा मॉडेल (model) मिळतं; निर्णय घेणे म्हणजे प्रशिक्षण डेटा (training data) सारख्या नसलेल्या परिस्थितीत ते धोरण वापरणे. बुद्धिबळातील सुरुवातीची चाल लक्षात ठेवणे आणि मधल्या गेममधील गोंधळातून वाचणे यात फरक आहे—पहिला मुद्दा बुलेट पॉईंटमध्ये चांगला दिसतो; तर दुसरा जिंकून देतो.
उपलब्ध साधने: नियमां(rules) पासून ते बक्षिसां(rewards) पर्यंत
चला, एकदम साध्या वाटणाऱ्या (पण अजूनही महत्त्वाच्या) गोष्टींपासून आधुनिक प्रणालींना शक्ती देणाऱ्या तंत्रांपर्यंत सर्व पाहू. साधी भाषा, कोणताही दिखावा न करता.
नियमांवर आधारित प्रणाली: अजूनही पूर्णपणे संपलेली नाही, फक्त प्रामाणिक आहे.
काही एआय (AI) तज्ञांना नियम म्हणजे मोजे घालून सँडल (sandals) घातल्यासारखे वाटते. पण नियमांवर आधारित निर्णय घेण्याचा एक मोठा फायदा आहे: पारदर्शकता. जर 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील {PPT} 'लेगसी' (legacy) म्हणून नियमांकडे दुर्लक्ष करत असेल, तर ते अर्धी कहाणी लपवत आहे. तज्ञ प्रणाली (expert systems) डोमेन (domain) ज्ञानाला 'असं असेल तर तसं' या वाक्यात एन्कोड (encode) करतात. त्या सहज तुटणाऱ्या (brittle) आहेत, हे खरं आहे, पण त्या तपासण्यायोग्य आहेत. जेव्हा तुम्हाला निश्चितता आणि शोधण्यायोग्यता आवश्यक असते— जसे की नियमांचे पालन तपासणे, वैद्यकीय ट्रायएज प्रोटोकॉल (medical triage protocols)—तेव्हा नियम फक्त काम करत नाहीत, तर अधिक चांगले काम करतात.
- फायदे: निश्चित, स्पष्ट, डीबग (debug) करणे सोपे
- तोटे: नाजूक, गोंधळलेल्या डोमेनमध्ये स्केल (scale) करणे कठीण
जेव्हा एखादी नियम प्रणाली (rule system) अयशस्वी होते, तेव्हा ते तुम्हाला कळते. बहुतेक आधुनिक प्रणाली शांतपणे अयशस्वी होतात.
शोध आणि ऑप्टिमायझेशन (Optimization): निर्णय म्हणजे मार्गदर्शन
प्रत्येक गोष्टीला डेटाच्या समुद्रावर प्रशिक्षित करण्यापूर्वी, आपण शोधायचो. रुंदी-आधारित शोध, खोली-आधारित शोध, ए* (A*), बीम शोध. हे आकर्षक नाही, पण जेव्हा तुम्ही मार्ग शोधण्याची समस्या सोडवत असता—शब्दशः किंवा लाक्षणिक अर्थाने—शोध हा आधारस्तंभ असतो. चांगल्या 'हेयुरिस्टिक' (heuristic) असलेला ए* (A*) हा 'स्मार्ट' (smart) उद्दिष्टापेक्षा चांगला असतो.
ऑप्टिमायझेशन (Optimization) याला सामान्य करते: तुम्ही एक उद्दिष्ट फंक्शन (objective function) आणि काही मर्यादा (constraints) निश्चित करता, आणि तुमच्याकडे असलेल्या संगणकीय शक्तीनुसार (compute) सर्वोत्तम उपाय शोधण्याचा प्रयत्न करता. लिनियर प्रोग्रामिंग (Linear programming), मिक्स्ड-इंटिजर प्रोग्रामिंग (mixed-integer programming), इव्होल्यूशनरी अल्गोरिदम्स (evolutionary algorithms)—अल्फाबेट सूप (alphabet soup) डेडलाइननुसार 'जवळपास चांगले' पासून 'पुरेसे चांगले' मिळवण्यापर्यंत मदत करतात.
- फायदे: सिद्ध करता येणारी हमी, नियंत्रणीय ट्रेड-ऑफ (trade-offs)
- तोटे: मॉडेलिंग (modeling) कठीण आहे; उद्दिष्ट्ये सूक्ष्म, विनाशकारी मार्गांनी चुकीची असू शकतात.
जेव्हा एखादे मॉडेल (model) विचित्र काहीतरी करते, तेव्हा बहुतेक वेळा तुम्ही जे मागितले तेच तुम्हाला मिळते—फक्त तुमचा तो अर्थ नसतो.
संभाव्य तर्क: अनिश्चितता हे एक वैशिष्ट्य आहे.
बेesian नेटवर्क (Bayesian networks), हिडन मार्कोव्ह मॉडेल (hidden Markov models), Kalman filters: हे सगळे क्लासिक (classic) आहेत. जग निश्चित आहे असा प्रयत्न करण्याऐवजी, या पद्धती अनिश्चिततेचा सतत मागोवा घेतात आणि त्याविरुद्ध उपाययोजना करतात. दुसऱ्या शब्दांत, वास्तवता.
- फायदे: अनिश्चिततेखाली सैद्धांतिक; अर्थ लावता येणारी रचना
- तोटे: उच्च-dimensional गोंधळाशी जुळवून घेणे त्रासदायक आहे; गृहितके त्रासदायक ठरतात.
संभाव्य पद्धती म्हणजे 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील बहुतेक {PPT} डेक्स 'आत्मविश्वास स्कोअर' (confidence scores) दर्शवतात. आत्मविश्वास ही संभाव्यता नाही. संभाव्यता म्हणजे पावत्या असलेले गणित.
मजबुतीकरण शिक्षण: बक्षिसे नियम बनवतात.
मजबुतीकरण शिक्षण—क्यू-लर्निंग (Q-learning), पॉलिसी ग्रेडियंट (policy gradients), ऍक्टर-क्रिटिक प्रकार—निर्णय घेण्याला गुण देण्यासोबतच (scoreboard) प्रयत्न आणि त्रुटी म्हणून गृहीत धरते. तुम्ही कृती निवडता, वातावरण तुम्हाला बक्षिसे देते आणि तुम्ही तुमच्या धोरणाला (policy) अशा कृतींकडे वळवता ज्यामुळे कालांतराने फायदा होईल. येथे एआय (AI) खऱ्या अर्थाने 'निर्णय घेते', कारण ते एक गेम (game) खेळते—तुम्ही डिझाइन (design) केलेला गेम (game), तुम्हाला ते लक्षात आले असो वा नसो.
- फायदे: क्रमवार निर्णय कार्यांसाठी (sequential decision tasks) मजबूत; तुम्ही स्पष्टपणे कोड (code) न केलेल्या रणनीती शिकते
- तोटे: रिवॉर्ड हॅकिंग (reward hacking); नमुना अकार्यक्षमता; जग थोडं जरी बदललं तरी नाजूक सामान्यीकरण
लोकांना असं म्हणायला आवडतं की मजबुतीकरण शिक्षण 'माणसे जसे शिकतात' तसेच आहे. पण तसं नाहीये. माणसांना पूर्व अनुभव, शरीर, कंटाळा आणि सामान्य ज्ञान असतं. {RL} एजंट्सकडे (agents) एक रिवॉर्ड फंक्शन (reward function) आणि अर्थहीन गोष्टी करून पाहण्याचा अमर्याद धीर असतो, जोपर्यंत ते काम करत नाही.
नियोजन आणि {POMDP}: जग अर्धवट दिसते.
वास्तविक जगातील निर्णय प्रक्रिया क्वचितच परिपूर्ण माहितीसह येते. पार्शियली ऑब्झर्वेबल मार्कोव्ह डिसिजन प्रोसेसेस ({Partially Observable Markov Decision Processes)}({POMDP}) ती अनिश्चितता स्पष्टपणे दर्शवतात: तुम्हाला स्थिती माहीत नसते, फक्त निरीक्षणे (observations) मिळतात जी त्याचा संकेत देतात. आंशिक निरीक्षणाखाली नियोजन तुम्हाला 'बिलीफ स्टेट' (belief state) ठेवण्यास भाग पाडते—'जे आपण पाहिले आहे, त्यानुसार काय घडत आहे' यासाठी एक छान शब्द.
- फायदे: अनिश्चिततेबद्दल प्रामाणिक; समजूतदार कृतीसाठी औपचारिक आधार
- तोटे: संगणकीयदृष्ट्या क्रूर; अंदाजे आकडेवारी ही एक आवश्यक बाब आहे.
जर तुमच्या 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील {PPT} मध्ये किमान '{POMDP}' चा उल्लेख नसेल, तर ते वास्तवाला एक ऐच्छिक सेटिंग (optional setting) मानत आहे.
संकरित प्रणाली आणि न्यूरो-सिम्बॉलिक (neuro-symbolic) मिश्रण
न्यूरल नेटवर्क (neural networks) पाहतात आणि लेबल (label) लावतात; सिम्बॉलिक प्रणाली (symbolic systems) स्पष्ट करतात आणि मर्यादा घालतात. दोघांना एकत्र जोडा आणि तुम्हाला काहीतरी उपयुक्त मिळेल. दृष्टी मॉडेल (vision model) परसेप्शनसाठी (perception), सुरक्षा नियमां(rules)साठी. भाषिक मॉडेल (language model) संभाव्य कृतींसाठी, व्यवहार्यतेसाठी योजनाकार (planner). हे संकरित प्रकार (hybrids) फक्त ट्रेंडी (trendy) नाहीत; ते इंजिनीअरिंग नम्रता दर्शवतात: जिथे परसेप्शन (perception) कठीण आहे तिथे शिकलेले मॉडेल (model) वापरा, जिथे धोका जास्त आहे तिथे स्पष्ट तर्क वापरा.
- फायदे: व्यावहारिक, नियंत्रणीय, दोन्ही जगातील सर्वोत्तम
- तोटे: एकत्रीकरण डोकेदुखी, नाजूक इंटरफेस, duplicated गुंतागुंत
निर्णय चक्र: कमी संक्षेपणासह (acronyms) मशीनसाठी {OODA}
बहुतेक एआय (AI) निर्णय प्रणाली एक चक्र चालवतात: निरीक्षण करा, अनुमान करा, योजना करा, कृती करा, पुन्हा करा. स्लाइड डेक्सला (slide decks) वर्तुळे आणि बाण आवडतात; महत्त्वाचा भाग म्हणजे ताण. प्रत्येक टप्पा तडजोड करतो. निरीक्षण करा (पण सर्वकाही नाही). अनुमान करा (पण तुमची अनिश्चितता ठेवा). योजना करा (पण वेळेनुसार). कृती करा (पण जगाला आग लावू नका).
- परसेप्शन ते सिम्बॉल्स (symbols): कच्च्या डेटापासून वैशिष्ट्यांपर्यंत. माहिती गमावा, शक्यतो योग्य माहिती.
- प्रिडिक्शन (prediction) ते बिलीफ (belief): वैशिष्ट्यांपासून ते काय चालले आहे यावरील वितरणापर्यंत.
- पॉलिसी (policy) ते प्लॅन (plan): सध्याच्या बिलीफपासून (belief) कृती क्रमांपर्यंत, संगणकीय शक्ती (compute) आणि धोक्याच्या क्षमतेनुसार मर्यादित.
- ॲक्शन (action) ते फीडबॅक (feedback): कृती करा, परिणामांचे मोजमाप करा, बिलीफ (belief) आणि पॅरामीटर्स (parameters) अपडेट (update) करा. जर तुमचे चक्र अनुभवाने सुधारत नसेल, तर ते ऑटोमेशन (automation) आहे, एआय (AI) नाही.
'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील {PPT} मधील सर्वात मोठी चूक म्हणजे हे चक्र स्वच्छ असल्याचा देखावा करणे. उत्पादनामध्ये, सेन्सर्स (sensors) भरकटतात, माणसे ढवळाढवळ करतात आणि मेट्रिक्स (metrics) एकमेकांशी लढतात. उत्कृष्ट प्रणाली (systems) त्या असतात, ज्या जगात काहीतरी गडबड झाल्यावर हळूवारपणे कमी होतात.
अल्गोरिदममध्ये सखोल अभ्यास ( buzzword सॉसशिवाय)
चला, लोक जे अल्गोरिदम (algorithms) वापरतात त्यावर एक नजर टाकू—ते काय सोडवतात, ते कसे अयशस्वी होतात आणि ते कुठे चमकतात.
मल्टी-आर्म्ड बँडिट्स (Multi-Armed Bandits): नाटकाशिवाय एक्सप्लोरेशन (exploration)
जेव्हा तुम्हाला नवीन गोष्टी वापरून पाहणे आणि काय काम करते आहे त्याचा फायदा घेणे यात संतुलन साधण्याची गरज असते—जाहिरात निवड, शिफारशींमध्ये बदल, {UI} प्रयोग—तेव्हा मल्टी-आर्म्ड बँडिट्स (multi-armed bandits) वेगासाठी {A/B} टेस्टिंगला हरवतात. थॉम्पसन सॅम्पलिंग (Thompson sampling) हे व्यावहारिकदृष्ट्या आवडते आहे: बेesian, सोपे, प्रभावी. ते पूर्ण {RL} एजंट (agent) असल्याचा दावा करत नाही. त्यामुळेच ते अधिक चांगले आहे.
- यासाठी वापरा: जलद ऑनलाइन (online) निर्णय घेणे, ज्यामध्ये लगेच अभिप्राय मिळतो.
- यासाठी वापरू नका: दीर्घकालीन रणनीती, गुंतागुंतीची dependencies, कोणतीही सुरक्षा-आधारित गोष्ट
मोंटे कार्लो ट्री सर्च (Monte Carlo Tree Search): मर्यादित वेळेत दूरदृष्टीने खेळणे
{MCTS} भविष्यातील शक्यतांचे नमुने (samples) घेते, त्या सर्वांचे नाही, फक्त शक्य असलेल्यांपैकी पुरेसे. हे अल्गोरिदमच्या दृष्टीने असं आहे की 'चला यावर विचार करूया, पण पूर्ण दुपार नाही.' गेम्स (games) आणि संरचित (structured) नियोजनामध्ये ते जिंकते. खुल्या गोंधळात, ते अशी रचना (structure) तयार करते जी अस्तित्वात नाही.
- यासाठी उत्तम: मर्यादित, चांगल्या प्रकारे मॉडेल (model) केलेल्या निर्णय जागा (गेम्स (games), मर्यादित नियोजन)
- यासाठी कमकुवत: न समजलेला गोंधळ (माणसे, बाजार, {Twitter})
डायनॅमिक प्रोग्रामिंग (Dynamic Programming): एका अटकेसह इष्टतम
बेलमन इक्वेशन्स (Bellman equations), व्हॅल्यू इटरेट (value iteration), पॉलिसी इटरेट (policy iteration). कंट्रोल (control) सिद्धांताचे मुकुट jewels, ज्यामध्ये घातांकीय वाढीचा मुकुट आहे. जर स्टेट स्पेस (state space) वाढला, तर तुमचा आशावादही वाढेल.
- यासाठी उत्तम: लहान ते मध्यम मार्कोव्हियन (Markovian) जग, ज्यामध्ये dynamics माहीत आहेत.
- यासाठी कमकुवत: बाकी सर्वकाही, जोपर्यंत तुम्ही अंदाजे आकडेवारी काढत नाही (म्हणजे नेहमीच)
हेयुरिस्टिक्स (Heuristics) आणि मेटाहेयुरिस्टिक्स (Metaheuristics): दिखावा न करणारे कार्यक्षम
सिम्युलेटेड ॲनेलिंग (Simulated annealing), टॅबू सर्च (tabu search), जेनेटिक अल्गोरिदम (genetic algorithms). हे 'खूप गोष्टी वापरून पहा, सर्वोत्तम ठेवा आणि पुढे जा' असे आहेत. हा अपमान नाही. बहुतेक वास्तविक निर्णय याचप्रमाणे असतात, कारण घड्याळ संपत असताना वास्तव तुम्हाला बसून अचूक समीकरण सोडवू देत नाही.
- यासाठी उत्तम: कठीण combinatorial समस्या, जिथे इष्टतम असणे हे एक स्वप्न आहे.
- यासाठी कमकुवत: डोमेन (domains), जिथे वेगापेक्षा हमी अधिक महत्त्वाची आहे.
कौझल मॉडेल (Causal Models): कारण correlation (सहसंबंध) हा एक Con Artist (धोकेबाज) आहे.
कौझल (causal) निर्णय घेणे—होय, पर्ल (Pearl), आलेख (graphs), हस्तक्षेप—तुम्हाला 'जर आपण काहीतरी बदलले तर काय होईल?' असा प्रश्न विचारण्याचा मार्ग देतात, 'शेवटच्या वेळी काय झाले?' याऐवजी. जर तुमच्या 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील {PPT} मध्ये कौझल इन्फरन्स (causal inference) चा उल्लेख नसेल, पण तुमचे उत्पादन असे निर्णय घेत असेल, ज्याचा लोकांवर परिणाम होतो, तर तुम्ही पश्चात्तापासाठी शिफारस इंजिन (recommendation engine) तयार करत आहात.
- यासाठी उत्तम: धोरण, औषध, दुसऱ्या क्रमांकाच्या परिणामांसह उत्पादनातील बदल
- यासाठी कमकुवत: पूर्णपणे predictive कार्ये, जिथे counterfactuals महत्त्वाचे नाहीत.
दोन कठीण समस्या: उद्दिष्ट्ये आणि मर्यादा
एआय (AI) निर्णय प्रक्रियेतील पहिले खोटं हे आहे की आपण 'कार्यक्षमते' ला अनुकूल करत आहोत. नक्की काय अनुकूल करत आहोत? क्लिक (clicks)? अपटाइम (uptime)? महसूल? सुरक्षा? निष्पक्षता? लेटन्सी (latency)? जर तुम्ही ते स्पष्ट केले नाही, तर तुमच्याकडे प्रणाली नाही—तुमच्याकडे फक्त एक इच्छा आहे. उद्दिष्ट फंक्शन (objective function) हे उत्पादन आहे. त्यावर कायदेशीर boilerप्लेटप्रमाणे (boilerplate) वागा आणि ते कायदेशीर boilerप्लेटप्रमाणे (boilerplate) चावेल.
- मल्टी-उद्देशीय ट्रेड-ऑफ (trade-offs) हे बग (bugs) नाहीत. तेच काम आहे. त्यांचे स्पष्टपणे वजन करा, प्रामाणिकपणे वेदना मोजा आणि पॅरेटो फ्रंट्स (Pareto fronts) हे नैतिक compass (compasses) असल्याचा देखावा करू नका.
- मर्यादा ह्या afterthoughts नाहीत. त्या तुम्ही हानी कशी मर्यादित करता हे दर्शवतात. हार्ड मर्यादा (hard constraints) (नाही, खरोखर, कधीही {X} पेक्षा जास्त नको) ह्या सॉफ्ट पेनल्टीजपेक्षा (soft penalties) वेगळ्या आहेत (कृपया {X} पेक्षा जास्त नको, जोपर्यंत ते फायदेशीर नाही). त्या तुम्ही खरोखर बोलत असल्याप्रमाणे लिहा.
उद्योगातील आवडते self-delusion म्हणजे अधिक डेटा (data) वाईट उद्दिष्टाला ठीक करतो असा विचार करणे. ते तसे करत नाही. ते चुकीच्या गोष्टीला खूप कार्यक्षम बनवते.
स्पष्टीकरण ऐच्छिक नाही; ते संदर्भ आहे.
स्पष्ट एआय (AI) साठीचा (explainable AI) दबाव बहुतेक वेळा नियमांचे पालन करण्याच्या दृष्टीने असतो. ते चुकीचे आहे. 'स्पष्टीकरण' म्हणजे तुम्ही ज्या लोकांवर निर्णयासाठी अवलंबून आहात, त्यांच्याशी विश्वास कसा निर्माण करता—ते अभियंते असले तरीही. मॉडेलने (model) 'डावीकडे वळा' असे का म्हटले हे तुम्हाला माहीत असणे आवश्यक आहे, नियामकला (regulator) शांत करण्यासाठी नाही, तर पुन्हा crash (क्रॅश) होण्यापूर्वी ते debug (डीबग) करण्यासाठी.
- पोस्ट-हॉक स्पष्टीकरण (post-hoc explanations) (सॅलियन्सी मॅप्स (saliency maps), {SHAP}) काहीच नसल्यापेक्षा चांगले आहेत, पण ते लिपस्टिकसारखे आहेत—उपयुक्त लिपस्टिक—एका डुकरावर, जो racehorse (रेसहोर्स) असू शकतो.
- बिल्ट-इन इंटरप्रिटेबिलिटी (built-in interpretability) (मोनोटोनिक मॉडेल्स (monotonic models), generalized ऍडिटिव्ह मॉडेल्स (generalized additive models), शिकलेल्या थ्रेशोल्ड्ससह (thresholds) नियम) अंदाजित वर्तनासाठी (predictable behavior) थोडी कच्ची अचूकता दर्शवते. बर्याच डोमेनमध्ये, ती एक चांगली गोष्ट आहे.
जर तुमच्या 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील {PPT} मध्ये एक रंगीत heatmap (हीटमॅप) दाखवला आणि विषय संपवला, तर तुम्ही उत्पादनामध्ये प्रणाली (system) कशी चालवायची नाही हे शिकला आहात.
लार्ज लँग्वेज मॉडेल्स (Large Language Models) आणि निर्णयाचा देखावा
होय, {LLM} निर्णय घेऊ शकतात—किंवा किमान ते अलौकिक (uncanny) ओघवतेपणाने (fluency) निर्णयांचा प्रस्ताव देऊ शकतात. ते पर्याय जागा रेखाटण्यात, ट्रेड-ऑफ्सची (trade-offs) यादी करण्यात, नियोजन चक्राभोवती scaffolding लिहिण्यात उत्तम आहेत. पण आकर्षक भाग हा सर्वात वाईट भाग आहे: ते बनवत असतानाही ते आत्मविश्वासाने बोलतात.
सुरक्षित पॅटर्न (pattern) 'मॉडेलला (model) निर्णय घेऊ द्या' असा नाही. तर तो असा आहे: मॉडेलला (model) सूचना देऊ द्या, नियमां(rules)नुसार मर्यादित करा, योजनाकार (planner) किंवा ऑप्टिमायझरने (optimizer) प्रमाणित करा आणि प्रत्येक स्टेप (step) लॉग (log) करा. {LLM} ला लूपमध्ये ठेवा, wheel (व्हील) वर नाही. तुम्ही तुमच्या कारला ऑटोकरेक्ट (autocorrect) करू देणार नाही.
स्लाइड्सपासून ते सिस्टीम्सपर्यंत (systems): उत्पादनामध्ये (production) प्रत्यक्षात काय काम करते
एआय (AI) मधील एक functional निर्णय प्रणाली (system) स्लाइडसारखी दिसत नाही. ती अशी दिसते:
- एक स्पष्ट उद्दिष्ट, जे आशेऐवजी वास्तव दर्शवते.
- मर्यादा ज्या कडक असणे आवश्यक आहेत तिथे कडक आणि जिथे मऊ ठेवता येतील तिथे मऊ.
- एक डेटा पाइपलाइन (data pipeline), जी तिच्यातील गहाळ भाग मान्य करते.
- एक निर्णय इंजिन (engine), जी पद्धती एकत्र करते: शिकलेले परसेप्शन (perception), संभाव्य अनुमान आणि एक पॉलिसी (policy), जी 'मला खात्री नाही' असे म्हणू शकते.
- ऑब्झर्वेबिलिटी (Observability): ट्रेसिंग (tracing), स्पष्टीकरण आणि रोलबॅक (rollback).
- मानवी देखरेख, ज्यांच्याकडे रद्द करण्याचा अधिकार आहे.
काही वर्तुळांमध्ये शेवटचा भाग योग्य मानला जातो. 'एआय (AI) स्वायत्त (autonomous) असावा.' कदाचित. किंवा कदाचित व्यावसायिक नम्रता press-release machismo पेक्षा चांगली आहे.
अटळ 'साधने' प्रश्न
तुम्ही लायब्ररी (libraries) आणि सेवांच्या मदतीने हा निर्णय स्टॅक (stack) एकत्र करू शकता. भरपूर चांगले आहेत. कमी सातत्यपूर्ण आहेत. सर्वोत्तम सेटअप (setups) घर्षण कमी करतात—प्राॅम्प्ट्स तयार करणे, आऊटपुट (outputs) तपासणे, तर्क chaining करणे, edge केसेस (edge cases) तपासणे—आणि जिथे guardrails महत्त्वाचे आहेत तिथे ते लावणे सोपे करतात.
एक व्यावहारिक उदाहरण म्हणून {Sider.AI} चा विचार करा. ते तुम्हाला sentient बीइंग (being) विकण्याचा प्रयत्न करत नाही. हे एक tool (टूल) आहे, जे प्रत्यक्षात गोंधळलेल्या मधल्या भागाला मदत करते: तर्क chains चा मसुदा तयार करणे, algorithmic पर्यायांची तुलना करणे आणि {LLM} सहाय्य slotting करणे, जिथे ते performative ऐवजी productive आहे. हे unsexy भागांमध्ये चांगले आहे—iteration, inspection आणि 'version १२ आणि १३ मध्ये काय बदलले?' प्रसिद्धीच्या जगात, 'प्रत्यक्षात काम करते' हे एक महाशक्ती आहे.
'एआय (AI) {PPT} सर्किटमध्ये निर्णय घेण्यासाठी सामान्य समज
- समज: 'चांगल्या मॉडेल्सपेक्षा (models) अधिक डेटा (data) महत्त्वाचा आहे.' कधीकधी. बहुतेक वेळा ते वाईट विचारांना हरवते. माफक डेटा (data) असलेले एक स्पष्ट उद्दिष्ट चुकीच्या मेट्रिकवर (metric) असलेल्या firehose पेक्षा अधिक चांगले काम करू शकते.
- समज: 'ब्लॅक बॉक्स (black box) अटळ आहे.' नाही. ते कधीकधी सोयीचे असते. तुम्ही opaque cores च्या भोवती interpretable स्तर (layers) तयार करू शकता. तुम्हाला फक्त काळजी घ्यावी लागेल.
- समज: 'एक्सप्लोरेशन (exploration) धोकादायक आहे.' नक्कीच—आणि स्थिरता पण. बँडिट्स (bandits) एका कारणास्तव अस्तित्वात आहेत.
- समज: 'स्वायत्तता (autonomy) हे ध्येय आहे.' स्वायत्तता (autonomy) हे एक साधन आहे. विश्वसनीयता हे ध्येय आहे.
केसलेट्स (caselets): रबर (rubber) रस्त्याला कुठे भेटतो
- लॉजिस्टिक्स राउटिंग (logistics routing): व्यवहार्यतेसाठी {A*}, खर्चासाठी {MILP}, शेवटच्या क्षणापर्यंतच्या गोंधळासाठी हेयुरिस्टिक्स (heuristics). अनिश्चिततेसह मागणीचा अंदाज मिसळा आणि तुम्हाला एक मजबूत प्रणाली (system) मिळेल. नाही, शहर पूल बंद केल्यावर आठवड्यात एक सिंगल (single) एंड-टू-एंड (end-to-end) डीप नेट (deep net) चांगले काम करणार नाही.
- वैद्यकीय ट्रायएज (medical triage): कडक सुरक्षिततेसाठी नियम, जोखमीचे स्कोअरिंग (scoring) करण्यासाठी संभाव्य मॉडेल्स (models), outliers साठी human-in-the-loop. प्रणालीचा (system) सद्गुण वेग नाही; तर केव्हा हळू करायचं हे तिला माहीत असतं.
- कंटेंट मॉडरेशन (content moderation): ट्रायएजसाठी (triage) क्लासिफायर (classifier), कायदेशीर बंधनांसाठी धोरण नियम, माणसांना appeals. तुम्ही हे 'सोडवणार' नाही, तुम्ही ते manage कराल—जसे एका बाजूला वाढणारे गवत कापणे.
निर्णय प्रणालीचा (system) न्याय कसा करायचा (स्लाइड डेकला (slide deck) नाही)
तीन प्रश्न विचारा:
- तुम्ही नक्की काय ऑप्टिमाइझ (optimize) करत आहात? जर उत्तराला एका वाक्यापेक्षा जास्त किंवा एका वाक्यापेक्षा कमी वेळ लागला, तर काळजी करा.
- जग बदलते तेव्हा काय होते? जर उत्तर 'retrain' (रीट्रेन) असेल, तर त्यांनी drift (ड्रिफ्ट) बद्दल विचार केलेला नाही.
- तुम्ही चुकीचे आहात हे तुम्हाला कसे कळेल? जर उत्तर शांतता असेल, तर तिथून निघून जा.
तुमचा स्वतःचा सखोल अभ्यास कसा तयार करायचा: एक व्यावहारिक रूपरेषा
जर तुम्ही स्वतःचा 'कृत्रिम बुद्धिमत्तेतील निर्णय प्रक्रिये' वरील {PPT} तयार करत असाल—कारण आपण सर्वच कधी ना कधी दोषी असतो—तर तो प्रामाणिकपणे तयार करा:
- निर्णय चक्र आणि तुमच्या उद्दिष्ट फंक्शनने (objective function) सुरुवात करा. एक स्लाइड, साधे टेक्स्ट (text).
- 'शिकणे' 'निर्णय घेण्यापासून' वेगळे करा. दोन स्लाइड्स, फक्त उदाहरणे.
- तुमच्या मर्यादा (constraints) दाखवा आणि त्या कशा कडक आहेत. एक स्लाइड, कोणताही mask (मास्क) नाही.
- परसेप्शन (perception), इन्फरन्स (inference), प्लॅनिंगसाठी (planning) अल्गोरिदम (algorithms) निवडा. प्रत्येकासाठी, अयशस्वी होण्याची कारणे सांगा.
- मॉनिटरिंग (monitoring) स्पष्ट करा: drift, overrides, incident playbooks.
- न सुटलेल्या धोक्यांनी शेवट करा. जर तुमच्याकडे काही नसेल, तर तुम्ही अजून पूर्ण केलेले नाही.
'मला माहीत नाही' म्हणण्याची शांत शक्ती
कृत्रिम बुद्धिमत्ता प्रणाली (AI systems) स्वतःहून माघार घेऊ शकणारी असावी. याला अनिश्चितता-जाणीवपूर्वक निर्णय घेणे (uncertainty-aware decision making), निवडक अंदाज (selective prediction) किंवा जे काही म्हणायचे ते म्हणा. ‘पास’ म्हणण्याची क्षमता हे एक tool आणि दायित्व (liability) यातील फरक आहे. माणसे हे स्वाभाविकपणे करतात. आपण खूप जास्त अशा प्रणाली बनवल्या आहेत, ज्या हे करू शकत नाहीत.
यामुळे आपण कुठे आहोत
कृत्रिम बुद्धिमत्तेतील निर्णय घेणे (Decision making in artificial intelligence) ही जादू नाही, आणि अल्गोरिदम्समध्ये (algorithms) खोलवर जाणे हे एखाद्या नवीन धर्मासाठीच्या pitch deck सारखे नसावे. हे अभियांत्रिकी (engineering) आहे - काळजीपूर्वक उद्दिष्ट्ये, स्पष्ट मर्यादा, स्पष्ट अनिश्चितता आणि विश्वासार्हतेसाठी (reliability) आकर्षकता (elegance) सोडण्याची तयारी. पुढच्या वेळी PPT (PowerPoint Presentation) मध्ये तुम्हाला सांगितले जाईल की प्रणालीने "निर्णय घेणे शिकले," तेव्हा विचारा की जेव्हा पूल तुटलेला असेल, मेट्रिक (metric) चुकीचे असेल किंवा वापरकर्त्याने (user) असे काहीतरी केले ज्याचा कोणीही अंदाज केला नव्हता, तेव्हा काय होते.
जर उत्तर एक मोठा बाण असेल, तर तुमचा निर्णय तुमच्या समोर आहे.
कीवर्ड-जागरूक परिशिष्ट (कीवर्ड स्टफिंगशिवाय)
- कृत्रिम बुद्धिमत्तेतील निर्णय घेणे: स्पष्ट उद्दिष्टांचा आणि मर्यादांचा वापर करून अनिश्चिततेत कृती निवडण्याची पद्धत.
- अल्गोरिदम्समध्ये (algorithms) खोलवर जा: हे एक रूपक नाही—शोध (search), ऑप्टिमायझेशन (optimization), संभाव्य अनुमान (probabilistic inference), रीइन्फोर्समेंट लर्निंग (reinforcement learning), नियोजन (planning), कार्यकारण मॉडेलिंग (causal modeling), संकरित (hybrids).
- व्यवहारिक निष्कर्ष: पद्धतींचे मिश्रण करा, मर्यादा अधिक मजबूत करा, अनिश्चितता स्वीकारा, प्रत्येक गोष्टीचे निरीक्षण करा आणि स्लाइडला प्रणाली (system) असल्याचा देखावा निर्माण करण्याच्या इच्छेला विरोध करा.
FAQ (नेहमी विचारले जाणारे प्रश्न)
प्रश्न १: कृत्रिम बुद्धिमत्तेतील निर्णय घेणे म्हणजे नक्की काय?
हे स्पष्ट उद्दिष्ट आणि मर्यादांसह अनिश्चिततेत कृती निवडणे आहे - केवळ अंदाजाने नव्हे. यात मनोरंजक भाग म्हणजे मॉडेल (model) नाही; तर मॉडेल, डेटा (data) आणि सुरक्षा उपाय (guardrails) हे एकत्रितपणे कसे कार्य करतात, जेव्हा जग प्रशिक्षण (training) डेटाशी जुळण्यास नकार देते.
प्रश्न २: AI निर्णय घेण्यासाठी कोणते अल्गोरिदम्स (algorithms) महत्त्वाचे आहेत?
शोध (search), ऑप्टिमायझेशन (optimization), संभाव्य तर्क (probabilistic reasoning), रीइन्फोर्समेंट लर्निंग (reinforcement learning), नियोजन (planning) आणि कार्यकारण मॉडेल (causal models) हे आधारस्तंभ आहेत. संकरित प्रणाली (Hybrid systems), जी शिकलेल्या आकलनशक्तीला प्रतीकात्मक नियमांबरोबर (symbolic rules) एकत्र करतात, त्या प्रत्यक्षात उत्पादनात टिकून राहतात.
प्रश्न ३: मोठे भाषिक मॉडेल (large language models) निर्णय घेण्यासाठी चांगले आहेत का?
ते पर्याय प्रस्तावित (propose) करण्यासाठी आणि योजना तयार करण्यासाठी उत्कृष्ट आहेत, परंतु तपासणी न केलेले निर्णायक (unchecked deciders) म्हणून ते खूप वाईट आहेत. LLM चा लूपमध्ये (in the loop) वापर करा: सूचना द्या, मर्यादा घाला, प्रमाणित करा—आणि प्रत्येक पायरी (step) अशा प्रकारे नोंदवा जसे की तुम्हाला वकिलाला (lawyer) स्पष्टीकरण द्यावे लागेल.
प्रश्न ४: कृत्रिम बुद्धिमत्तेतील निर्णय (Decision Making in Artificial Intelligence) PPT मधील सर्वात मोठ्या चुका टाळण्यासाठी मी काय करावे?
शिकणे (learning) आणि निर्णय घेणे (deciding) वेगळे करा, उद्दिष्ट (objective) परिभाषित करा आणि मर्यादा स्पष्ट करा. अपयश येण्याची कारणे (failure modes) आणि देखरेख (monitoring) दर्शवा—जर तुमची स्लाइड (slide) फक्त बाणांनी भरलेली असेल आणि त्यात तोडगा (trade-offs) नसेल, तर ते फक्त नाटक आहे, अभियांत्रिकी (engineering) नाही.
प्रश्न ५: Sider.AI AI निर्णय प्रक्रियेत (decision workflows) कुठे बसते?
Sider.AI गोंधळलेल्या मध्यभागी मदत करते—तर्क प्रक्रियेचे authoring, तुलना (comparing) आणि तपासणी (inspecting) करणे—त्यामुळे तुम्ही LLM सहाय्य (assistance) तिथे वापरू शकता जिथे ते खरोखर उपयुक्त आहे, मार्केटिंग (marketing) जिथे ते उपयोगी ठरू शकते असे वाटते तिथे नव्हे. व्यावहारिक पुनरावृत्तीचा (practical iteration) विचार करा, जादूच्या छडीचा नाही.