যে অংশে PPT এআইকে সহজ দেখানোর চেষ্টা করে
কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের বিষয়টা এমন যে সবাই এটা বোঝে ভান করে—যতক্ষণ না এটা কোনো দারুণ সিদ্ধান্ত নেয় অথবা কোনো স্পষ্ট ভুল করে বসে। তখনই হঠাৎ করে এটা 'খুব জটিল' বা 'ব্ল্যাক বক্স' হয়ে যায়, যেন অঙ্ক কলার খোসায় পিছলে গেল। আপনারা যারা কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের ওপর কোনো PPT দেখেছেন, তারা এর নিয়ম জানেন: বড় তীর, ফ্লোচার্ট এবং ক্লিপআর্টের টুকরা যা অনিবার্যতার ইঙ্গিত দেয়। এটা অনিবার্য নয়। এটা পুরোটাই সিদ্ধান্তের খেলা।
এটা অ্যালগরিদমগুলির গভীরে ডুব দেওয়া—আসল অ্যালগরিদম—যা এআই সিদ্ধান্ত গ্রহণে ব্যবহৃত হয়। বক্সযুক্ত তীরসহ কোনো স্লাইড ডেক নয়। এর উদ্দেশ্য হল 'এআই আমাদের জন্য সিদ্ধান্ত নেবে' এই ধারণা থেকে বেরিয়ে আসা এবং এই সিস্টেমগুলো কীভাবে আসলে পছন্দ করে সে সম্পর্কে কথা বলা। স্পয়লার: এগুলো সর্বজ্ঞানী ভবিষ্যদ্বক্তার মতো নয়, বরং খুব দ্রুত, খুব আক্ষরিক অর্থে যুক্তিবাদী যারা কখনো ট্র্যাফিকের মধ্যে বসতে বা বাচ্চাদের ঘুমের সময়ের দর কষাকষি করতে হয়নি।
এআই-এ 'সিদ্ধান্ত গ্রহণ' বলতে আমরা কী বুঝি (এবং PPTs খুব কমই স্বীকার করে)
'কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ' শুনতে মহৎ শোনালেও, বাস্তবে এটি কিছু কৌশলের সমষ্টি: নিয়ম-ভিত্তিক যুক্তি, অনুসন্ধান, অপটিমাইজেশন, সম্ভাব্যতাভিত্তিক অনুমান, রিইনফোর্সমেন্ট লার্নিং, পরিকল্পনা এবং হাইব্রিড সিস্টেম যা পুরো বিষয়টিকে একত্রিত করে। অ্যালগরিদমগুলো কিছুই 'চায়' না। এগুলো নির্দিষ্ট সীমাবদ্ধতার অধীনে নির্দিষ্ট ফাংশন অপটিমাইজ করে। ফাংশন বা সীমাবদ্ধতা পরিবর্তন করুন এবং আপনি একটি ভিন্ন 'বুদ্ধিমত্তা' পাবেন। যদি এটা শুনে আপনার কাছে স্পষ্ট মনে হয়, তাহলে অভিনন্দন—আপনি SlideShare-এর অর্ধেক ডেক থেকে এগিয়ে আছেন।
বেশিরভাগ কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT-এর আসল সমস্যা হল এগুলো সরলীকরণ করে না। সমস্যা হলো, এগুলো ভুল দিকে সরলীকরণ করে। তারা বোঝায় যে মডেলগুলো সিদ্ধান্ত নেয় কারণ তারা 'শিখেছে'। শেখা সিদ্ধান্ত নেওয়া নয়। শেখা আপনাকে একটি নীতি বা মডেল দেয়; সিদ্ধান্ত গ্রহণ হল এমন একটি প্রেক্ষাপটে সেই নীতি চালানো যা প্রশিক্ষণের ডেটার মতো নয়। দাবা খেলার শুরু মুখস্থ করা এবং মধ্য খেলার বিশৃঙ্খলা থেকে বেঁচে থাকার মধ্যে পার্থক্য—প্রথমটি বুলেট পয়েন্টে ভালো দেখায়; দ্বিতীয়টি জেতার জন্য জরুরি।
আসল সরঞ্জাম: নিয়ম থেকে পুরস্কার
আসুন আমরা সেই বিষয়গুলো নিয়ে আলোচনা করি যা শুনতে অদ্ভুত লাগে (তবে এখনও গুরুত্বপূর্ণ) থেকে শুরু করে আধুনিক সিস্টেমগুলোকে শক্তিশালী করে এমন কৌশলগুলো পর্যন্ত। সরল ভাষায়, কোনো অতিরিক্ত আকর্ষণ ছাড়াই।
নিয়ম-ভিত্তিক সিস্টেম: এখনও মৃত নয়, শুধু সৎ
কিছু এআই লোকের কাছে নিয়মগুলি বিব্রতকর, যেমন স্যান্ডেলের সাথে মোজা পরা। তবে নিয়ম-ভিত্তিক সিদ্ধান্ত গ্রহণের একটি বড় সুবিধা রয়েছে: স্বচ্ছতা। যদি কোনো কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT নিয়মগুলোকে 'পুরানো' হিসাবে বাদ দেয় তবে এটি অর্ধেক গল্প লুকিয়ে রাখছে। বিশেষজ্ঞ সিস্টেমগুলো ডোমেইন জ্ঞানকে যদি-তাহলে বিবৃতি হিসাবে এনকোড করে। এগুলো ভঙ্গুর, হ্যাঁ, তবে এগুলো নিরীক্ষণযোগ্য। যখন আপনার ডিটারমিনিজম এবং ট্রেসেবিলিটির প্রয়োজন হয়—সম্মতি পরীক্ষা, মেডিকেল ট্রায়াজ প্রোটোকল—তখন নিয়মগুলো কেবল কাজ করে না; বরং আরও ভালোভাবে কাজ করে।
- সুবিধা: ডিটারমিনিস্টিক, ব্যাখ্যাযোগ্য, ডিবাগ করা সহজ
- অসুবিধা: ভঙ্গুর, জটিল ডোমেইনগুলোতে স্কেল করা কঠিন
আপনি জানতে পারবেন কখন একটি নিয়ম সিস্টেম ব্যর্থ হয় কারণ এটি আপনাকে জানায়। বেশিরভাগ আধুনিক সিস্টেম নীরবে ব্যর্থ হয়।
অনুসন্ধান এবং অপটিমাইজেশন: সিদ্ধান্ত নেভিগেশন হিসাবে
আমরা ডেটার সমুদ্রে সবকিছু প্রশিক্ষিত করার আগে, আমরা অনুসন্ধান করতাম। ব্রেডথ-ফার্স্ট সার্চ, ডেপথ-ফার্স্ট সার্চ, A*, বিম সার্চ। এটি তেমন আকর্ষণীয় নয়, তবে যখনই আপনি কোনো পথ খোঁজার সমস্যা সমাধান করছেন—আক্ষরিক বা রূপকভাবে—তখন অনুসন্ধান হল মেরুদণ্ড। একটি ভাল হিউরিস্টিক সহ A* একটি দুর্বল উদ্দেশ্য সহ একটি 'স্মার্ট' মডেলকে পরাজিত করে।
অপটিমাইজেশন এটিকে আরও বিস্তৃত করে: আপনি একটি উদ্দেশ্য ফাংশন এবং সীমাবদ্ধতা নির্ধারণ করেন, তারপর আপনার কাছে থাকা কম্পিউটিং শক্তি দিয়ে সবচেয়ে ভালো সমাধানের দিকে যান। লিনিয়ার প্রোগ্রামিং, মিক্সড-ইনটিজার প্রোগ্রামিং, ইভোল্যুশনারি অ্যালগরিদম—একটি সময়সীমার মধ্যে 'প্রায় ভালো' থেকে 'যথেষ্ট ভালো' হওয়ার জন্য বর্ণানুক্রমিক স্যুপ।
- সুবিধা: প্রমাণযোগ্য নিশ্চয়তা, নিয়ন্ত্রণযোগ্য ট্রেড-অফ
- অসুবিধা: মডেলিং কঠিন; উদ্দেশ্যগুলি সূক্ষ্ম, বিপর্যয়কর উপায়ে ভুলভাবে নির্দিষ্ট করা হতে পারে
যখন একটি মডেল অদ্ভুত কিছু করে, তখন প্রায়শই এর কারণ হল আপনি ঠিক সেটাই পেয়েছেন যা আপনি চেয়েছিলেন—কিন্তু তা নয় যা আপনি বুঝিয়েছিলেন।
সম্ভাব্যতাভিত্তিক যুক্তি: অনিশ্চয়তা একটি বৈশিষ্ট্য
বায়েসিয়ান নেটওয়ার্ক, হিডেন মারকভ মডেল, কালম্যান ফিল্টার: ক্লাসিক। বিশ্ব নিশ্চিত এমন ভান না করে, এই পদ্ধতিগুলো অনিশ্চয়তার একটি চলমান হিসাব রাখে এবং এর বিরুদ্ধে পদক্ষেপ নেয়। অন্য কথায়, বাস্তববাদিতা।
- সুবিধা: অনিশ্চয়তার অধীনে নীতিগত; ব্যাখ্যাযোগ্য কাঠামো
- অসুবিধা: উচ্চ-মাত্রিক জটিলতায় স্কেলিং বেদনাদায়ক; অনুমানগুলি ফিরে আসে
সম্ভাব্যতাভিত্তিক পদ্ধতিগুলো হল সেই জিনিস যা বেশিরভাগ কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT ডেক্স 'confidence scores' দিয়ে বোঝায়। আত্মবিশ্বাস সম্ভাবনা নয়। সম্ভাবনা হল রসিদ সহ গণিত।
রিইনফোর্সমেন্ট লার্নিং: পুরস্কার নিয়ম তৈরি করে
রিইনফোর্সমেন্ট লার্নিং—Q-লার্নিং, পলিসি গ্র্যাডিয়েন্ট, অ্যাক্টর-ক্রিটিক ভ্যারিয়েন্ট—সিদ্ধান্ত গ্রহণকে একটি স্কোরবোর্ড সহ চেষ্টা এবং ত্রুটি হিসাবে তৈরি করে। আপনি পদক্ষেপ বাছাই করেন, পরিবেশ আপনাকে পুরস্কার দেয় এবং আপনি আপনার নীতিকে এমন পদক্ষেপের দিকে ঠেলে দেন যা সময়ের সাথে সাথে লাভজনক হয়। এখানেই এআই সত্যিকার অর্থে 'সিদ্ধান্ত নেয়', এই অর্থে যে এটি একটি গেম খেলে—আপনি যে গেমটি ডিজাইন করেছেন, আপনি এটি উপলব্ধি করুন বা না করুন।
- সুবিধা: ক্রমিক সিদ্ধান্তের কাজের জন্য শক্তিশালী; এমন কৌশলগুলি শেখে যা আপনি স্পষ্টভাবে কোড করেননি
- অসুবিধা: পুরস্কার হ্যাকিং; নমুনা অদক্ষতা; বিশ্ব সামান্য পরিবর্তিত হলেও ভঙ্গুর সাধারণীকরণ
লোকেরা দাবি করতে ভালোবাসে যে রিইনফোর্সমেন্ট লার্নিং 'মানুষ কীভাবে শেখে' তার মতো। আসলে নয়। মানুষের পূর্ব অভিজ্ঞতা, শরীর, একঘেয়েমি এবং সাধারণ জ্ঞান আছে। RL এজেন্টের একটি পুরস্কার ফাংশন রয়েছে এবং কাজ না হওয়া পর্যন্ত অর্থহীন চেষ্টা করার অসীম ধৈর্য রয়েছে।
পরিকল্পনা এবং POMDPs: বিশ্ব অর্ধেক দৃশ্যমান
বাস্তব বিশ্বের সিদ্ধান্ত গ্রহণ খুব কমই নিখুঁত তথ্যের সাথে আসে। পার্শিয়ালি অবজারভেবল মারকভ ডিসিশন প্রসেস (POMDPs) সেই অনিশ্চয়তাকে স্পষ্টভাবে মডেল করে: আপনি অবস্থা জানেন না, শুধুমাত্র সেই পর্যবেক্ষণগুলো জানেন যা এটির ইঙ্গিত দেয়। আংশিক পর্যবেক্ষণযোগ্যতার অধীনে পরিকল্পনা আপনাকে একটি বিশ্বাসের অবস্থা রাখতে বাধ্য করে—'আমরা যা দেখেছি তার ভিত্তিতে কী ঘটছে বলে আমরা মনে করি' এর জন্য একটি অভিনব শব্দ।
- সুবিধা: অনিশ্চয়তা সম্পর্কে সৎ; সংবেদনশীল কর্মের জন্য আনুষ্ঠানিক ভিত্তি
- অসুবিধা: computationally brutal; approximation একটি প্রয়োজনীয় মন্দ
যদি আপনার কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT অন্তত 'POMDP' শব্দটি ফিসফিস না করে, তবে এটি বাস্তবতাকে একটি ঐচ্ছিক সেটিংস হিসাবে দেখছে।
হাইব্রিড সিস্টেম এবং নিউরো-সিম্বলিক ম্যাশআপ
নিউরনাল নেটওয়ার্ক দেখে এবং লেবেল দেয়; সিম্বলিক সিস্টেম ব্যাখ্যা করে এবং সীমাবদ্ধ করে। তাদের একসাথে যুক্ত করুন এবং আপনি দরকারী কিছু পাবেন। উপলব্ধির জন্য ভিশন মডেল, নিরাপত্তার জন্য নিয়ম। প্রার্থী পদক্ষেপের জন্য ভাষা মডেল, সম্ভাবনার জন্য পরিকল্পনাকারী। এই হাইব্রিডগুলো কেবল প্রচলিত নয়; তারা প্রকৌশলগত নম্রতা প্রতিফলিত করে: যেখানে উপলব্ধি কঠিন সেখানে একটি শেখা মডেল ব্যবহার করুন, যেখানে ঝুঁকি বেশি সেখানে স্পষ্ট যুক্তি ব্যবহার করুন।
- সুবিধা: বাস্তবসম্মত, নিয়ন্ত্রণযোগ্য, উভয়ের সেরা
- অসুবিধা: ইন্টিগ্রেশন মাথাব্যথা, ভঙ্গুর ইন্টারফেস, নকল জটিলতা
সিদ্ধান্ত লুপ: মেশিনের জন্য OODA, কম সংক্ষিপ্ত রূপ সহ
বেশিরভাগ এআই সিদ্ধান্ত সিস্টেম একটি লুপ চালায়: পর্যবেক্ষণ, অনুমান, পরিকল্পনা, কাজ, পুনরাবৃত্তি। স্লাইড ডেকগুলো বৃত্ত এবং তীর পছন্দ করে; গুরুত্বপূর্ণ বিষয় হল উত্তেজনা। প্রতিটি ধাপ আপস করে। পর্যবেক্ষণ করুন (তবে সবকিছু নয়)। অনুমান করুন (তবে আপনার অনিশ্চয়তা বজায় রাখুন)। পরিকল্পনা করুন (তবে সময়ের মধ্যে)। কাজ করুন (তবে বিশ্বকে জ্বালিয়ে দেবেন না)।
- প্রত্যক্ষণ থেকে প্রতীক: কাঁচা ডেটা থেকে বৈশিষ্ট্য। তথ্য হারান, আশা করি সঠিক তথ্য।
- অনুমান থেকে বিশ্বাস: বৈশিষ্ট্য থেকে আসলে কী ঘটছে তার একটি বিতরণ।
- নীতি থেকে পরিকল্পনা: বর্তমান বিশ্বাস থেকে একটি কর্মের ক্রম, গণনা এবং ঝুঁকির ক্ষুধা দ্বারা সীমাবদ্ধ।
- কর্ম থেকে প্রতিক্রিয়া: কাজ করুন, ফলাফল পরিমাপ করুন, বিশ্বাস এবং প্যারামিটার আপডেট করুন। যদি আপনার লুপ অভিজ্ঞতার সাথে উন্নত না হয় তবে এটি অটোমেশন, এআই নয়।
কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT-তে সবচেয়ে বড় ভুল হল লুপটিকে পরিষ্কার দেখানো। উৎপাদনে, সেন্সর সরে যায়, মানুষ হস্তক্ষেপ করে এবং মেট্রিকগুলো একে অপরের সাথে লড়াই করে। দুর্দান্ত সিস্টেমগুলো হল সেইগুলো যা বিশ্ব যখন কাঁধে ঝাঁকায় তখন ধীরে ধীরে খারাপ হয়ে যায়।
অ্যালগরিদমের গভীরে ডুব (Buzzword সস ছাড়া)
আসুন আমরা দেখি লোকেরা আসলে কোন অ্যালগরিদম ব্যবহার করে—তারা কী সমাধান করে, কীভাবে তারা ব্যর্থ হয় এবং কোথায় তারা উজ্জ্বল।
মাল্টি-আর্মড ব্যান্ডিটস: নাটক ছাড়া অনুসন্ধান
যখন আপনার নতুন জিনিস চেষ্টা করার সাথে যা কাজ করে তা ব্যবহার করার মধ্যে ভারসাম্য বজায় রাখতে হয়—বিজ্ঞাপন নির্বাচন, সুপারিশ পরিবর্তন, UI পরীক্ষা—মাল্টি-আর্মড ব্যান্ডিটস গতির জন্য A/B পরীক্ষাকে হার মানায়। থম্পসন স্যাম্পলিং বাস্তববাদী পছন্দের: বায়েসিয়ান, সরল, কার্যকর। এটি একটি সম্পূর্ণ RL এজেন্ট হওয়ার ভান করে না। এটি এটির জন্য আরও ভাল।
- এটির জন্য ব্যবহার করুন: প্রতিক্রিয়ার সাথে দ্রুত অনলাইন সিদ্ধান্ত গ্রহণ
- এটির জন্য ব্যবহার করবেন না: দীর্ঘ-অনুভূমিক কৌশল, জটিল নির্ভরতা, নিরাপত্তা-সংকটপূর্ণ কিছু
মন্টে কার্লো ট্রি সার্চ: বাজেটের মধ্যে দূরদর্শিতা বাজানো
MCTS ভবিষ্যৎ নমুনা নেয়, তাদের সবগুলি নয়, কেবল সম্ভাব্যগুলি যথেষ্ট। এটি অ্যালগরিদমিকভাবে 'আসুন এটি নিয়ে চিন্তা করি, তবে পুরো বিকেল নয়' এর সমতুল্য। গেমস এবং কাঠামোবদ্ধ পরিকল্পনায় এটি জিতে যায়। উন্মুক্ত বিশৃঙ্খলায় এটি এমন কাঠামো তৈরি করে যা সেখানে নেই।
- এটির জন্য দুর্দান্ত: সীমাবদ্ধ, ভালোভাবে মডেল করা সিদ্ধান্ত স্থান (গেমস, সীমাবদ্ধ পরিকল্পনা)
- এটির জন্য দুর্বল: মডেলবিহীন বিশৃঙ্খলা (মানুষ, বাজার, )
ডায়নামিক প্রোগ্রামিং: একটি ক্যাচ সহ অনুকূল
বেলম্যান সমীকরণ, মান পুনরাবৃত্তি, নীতি পুনরাবৃত্তি। নিয়ন্ত্রণ তত্ত্বের মুকুট মণি, একটি মুকুট যা সূচকীয় বৃদ্ধি দিয়ে তৈরি। যদি রাজ্য স্থান বিস্ফোরিত হয় তবে আপনার আশাবাদও বিস্ফোরিত হয়।
- এটির জন্য দুর্দান্ত: পরিচিত গতিশীলতা সহ ছোট থেকে মাঝারি মারকভিয়ান বিশ্ব
- এটির জন্য দুর্বল: অন্য সবকিছু, যদি না আপনি আনুমানিক করেন (যার অর্থ, সবসময়)
হিউরিস্টিকস এবং মেটাহিউরিস্টিকস: অনাড়ম্বর কর্মীরা
সিমুলেটেড অ্যানিলিং, টাবু সার্চ, জেনেটিক অ্যালগরিদম। এগুলো মহিমান্বিত 'অনেক জিনিস চেষ্টা করুন, সেরাটি রাখুন, চালিয়ে যান'। এটি অপমান নয়। বেশিরভাগ বাস্তব সিদ্ধান্ত এইরকম দেখায় কারণ বাস্তবতা আপনাকে বসে থাকতে এবং একটি সঠিক সমীকরণ সমাধান করতে দেবে না যখন ঘড়ি চলছে।
- এটির জন্য দুর্দান্ত: কঠিন সমন্বিত সমস্যা যেখানে অনুকূল একটি ফ্যান্টাসি
- এটির জন্য দুর্বল: ডোমেইন যেখানে গতির চেয়ে নিশ্চয়তা বেশি গুরুত্বপূর্ণ
কার্যকারণ মডেল: কারণ পারস্পরিক সম্পর্ক একটি প্রতারক
কার্যকারণ সিদ্ধান্ত গ্রহণ—হ্যাঁ, পার্ল, গ্রাফ, হস্তক্ষেপ—আপনাকে জিজ্ঞাসা করার একটি উপায় দেয় 'যদি আমরা সত্যিই কিছু পরিবর্তন করি তাহলে কী হবে?' পরিবর্তে 'শেষবার কী হয়েছিল?'। যদি আপনার কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT কার্যকারণ অনুমানকে উল্লেখ না করে, তবে আপনার পণ্য এমন পছন্দ করে যা মানুষকে প্রভাবিত করে, আপনি অনুশোচনার জন্য একটি সুপারিশ ইঞ্জিন তৈরি করছেন।
- এটির জন্য দুর্দান্ত: নীতি, ওষুধ, দ্বিতীয়-ক্রম প্রভাব সহ পণ্যের পরিবর্তন
- এটির জন্য দুর্বল: সম্পূর্ণরূপে ভবিষ্যদ্বাণীমূলক কাজ যেখানে প্রতি-বাস্তবতার কোনো গুরুত্ব নেই
দুটি কঠিন সমস্যা: উদ্দেশ্য এবং সীমাবদ্ধতা
এআই সিদ্ধান্ত গ্রহণের প্রথম মিথ্যা হল আমরা 'পারফরম্যান্স' অপটিমাইজ করছি। ঠিক কী অপটিমাইজ করছি? ক্লিক? আপটাইম? রাজস্ব? নিরাপত্তা? ন্যায্যতা? লেটেন্সি? আপনি যদি এটি স্পষ্টভাবে না বলেন তবে আপনার কাছে কোনো সিস্টেম নেই—আপনার একটি ইচ্ছা আছে। উদ্দেশ্য ফাংশন হল পণ্য। এটিকে আইনি বয়লারপ্লেটের মতো আচরণ করুন এবং এটি আইনি বয়লারপ্লেটের মতোই আঘাত করবে।
- বহু-উদ্দেশ্যমূলক ট্রেড-অফ বাগ নয়। এগুলোই কাজ। এগুলিকে স্পষ্টভাবে ওজন করুন, ক্ষতিটি সততার সাথে পরিমাপ করুন এবং এমন ভান করবেন না যে প্যারেটো ফ্রন্টগুলি নৈতিক কম্পাস।
- সীমাবদ্ধতাগুলি পরে চিন্তা করার বিষয় নয়। এগুলোই আপনি কীভাবে ক্ষতি সীমাবদ্ধ করেন। কঠিন সীমাবদ্ধতা (না, সত্যিই, কখনও X অতিক্রম করবেন না) নরম শাস্তির থেকে আলাদা (দয়া করে X অতিক্রম করবেন না যদি না এটি লাভজনক হয়)। এমনভাবে লিখুন যেন আপনি সত্যিই এটি বোঝাতে চেয়েছেন।
শিল্পের প্রিয় স্ব-প্রতারণা হল আরও ডেটা একটি খারাপ উদ্দেশ্যকে ঠিক করে দেয় এমন চিন্তা করা। এটি করে না। এটি ভুল জিনিসটিকে খুব দক্ষ করে তোলে।
ব্যাখ্যা করার ক্ষমতা ঐচ্ছিক নয়; এটি প্রসঙ্গ
ব্যাখ্যাযোগ্য এআই-এর জন্য চাপ প্রায়শই একটি সম্মতি উপদ্রব হিসাবে তৈরি করা হয়। এটি পিছনের দিকে। 'ব্যাখ্যা করার ক্ষমতা' হল আপনি কীভাবে সেই লোকদের সাথে বিশ্বাস তৈরি করবেন যারা সিদ্ধান্তের উপর নির্ভর করে—এমনকি যদি তারা প্রকৌশলীও হয়। আপনার জানা দরকার কেন মডেলটি 'বাম দিকে ঘুরতে' বলেছিল, কোনো নিয়ন্ত্রককে খুশি করার জন্য নয়, বরং আবার ঘটার আগে একটি ক্র্যাশ ডিবাগ করার জন্য।
- পোস্ট-হক ব্যাখ্যা (স্যালিয়েন্সি ম্যাপ, SHAP) কিছুই না থাকার চেয়ে ভালো, তবে সেগুলি লিপস্টিক—দরকারী লিপস্টিক—একটি শূকরের উপর যা একটি ঘোড়দৌড়ের ঘোড়া হতে পারে।
- বিল্ট-ইন ইন্টারপ্রেটেবিলিটি (মনোটোনিক মডেল, জেনারেলাইজড অ্যাডিটিভ মডেল, শেখা থ্রেশহোল্ড সহ নিয়ম) পূর্বাভাসের আচরণের জন্য কিছুটা কাঁচা নির্ভুলতার সাথে আপস করে। অনেক ডোমেইনে, এটি একটি দর কষাকষি।
যদি আপনার কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT একটি রঙিন হিটম্যাপ দেখায় এবং এটিকে দিনের সমাপ্তি বলে, তবে আপনি সঠিকভাবে শিখেছেন কীভাবে উৎপাদনে একটি সিস্টেম চালাতে হয় না।
বৃহৎ ভাষা মডেল এবং সিদ্ধান্তের মরীচিকা
হ্যাঁ, LLM সিদ্ধান্ত নিতে পারে—অথবা অন্তত তারা অসাধারণ সাবলীলতার সাথে সিদ্ধান্তের প্রস্তাব দিতে পারে। তারা বিকল্প স্থান স্কেচ করতে, ট্রেড-অফের তালিকা করতে, এমনকি একটি পরিকল্পনার লুপের চারপাশে স্কাফোল্ডিং লিখতে দুর্দান্ত। তবে প্রলুব্ধকর অংশটি সবচেয়ে খারাপ অংশ: তারা বানিয়ে বললেও আত্মবিশ্বাসী শোনা যায়।
নিরাপদ প্যাটার্নটি 'মডেলকে সিদ্ধান্ত নিতে দিন' নয়। এটি হল: মডেলকে পরামর্শ দিতে দিন, নিয়ম দিয়ে সীমাবদ্ধ করুন, একটি পরিকল্পনাকারী বা অপটিমাইজার দিয়ে যাচাই করুন এবং প্রতিটি ধাপ লগ করুন। LLM-কে লুপে রাখুন, হুইলে নয়। আপনি আপনার গাড়ি চালানোর জন্য স্বয়ংক্রিয় সংশোধনকে দেবেন না।
স্লাইড থেকে সিস্টেমে: উৎপাদনে আসলে কী কাজ করে
এআই-এ একটি কার্যকরী সিদ্ধান্ত গ্রহণ সিস্টেম স্লাইডের মতো দেখায় না। এটি দেখতে এইরকম:
- একটি স্পষ্ট উদ্দেশ্য যা বাস্তবতাকে প্রতিফলিত করে, আশাকে নয়।
- সীমাবদ্ধতাগুলি যেখানে কঠিন হওয়া উচিত সেখানে কঠিন, যেখানে নরম হওয়া উচিত সেখানে নরম।
- একটি ডেটা পাইপলাইন যা নিজের অনুপস্থিত অংশগুলি স্বীকার করে।
- একটি সিদ্ধান্ত ইঞ্জিন যা পদ্ধতি মিশ্রিত করে: শেখা উপলব্ধি, সম্ভাব্যতাভিত্তিক অনুমান এবং একটি নীতি যা বলতে পারে 'আমি নিশ্চিত নই'।
- পর্যবেক্ষণযোগ্যতা: ট্রেসিং, ব্যাখ্যা এবং রোলব্যাক।
- বাতিল করার কর্তৃত্ব সহ মানুষের তত্ত্বাবধান।
শেষ অংশটি কিছু মহলে অমার্জিত বলে বিবেচিত হয়। 'এআই স্বয়ংক্রিয় হওয়া উচিত'। সম্ভবত। অথবা সম্ভবত পেশাদার নম্রতা প্রেস-রিলিজের পুরুষত্বের চেয়ে ভালো।
অনিবার্য 'সরঞ্জাম' প্রশ্ন
আপনি লাইব্রেরি এবং পরিষেবাগুলির একটি নক্ষত্রের সাথে এই সিদ্ধান্তের স্ট্যাক একত্রিত করতে পারেন। প্রচুর ভালো আছে। কম ধারাবাহিক আছে। সেরা সেটআপগুলি ঘর্ষণ কমায়—প্রম্পট তৈরি করা, আউটপুট পরিদর্শন করা, যুক্তি শৃঙ্খলাবদ্ধ করা, প্রান্তিক কেস পরীক্ষা করা—এবং যেখানে গুরুত্বপূর্ণ সেখানে গার্ডরেল রাখা সহজ করে তোলে।
একটি বাস্তব উদাহরণ হিসাবে Sider.AI বিবেচনা করুন। এটি আপনাকে কোনো অনুভূতিশীল প্রাণী বিক্রি করার চেষ্টা করছে না। এটি এমন সরঞ্জাম যা আসলে জটিল মধ্যবর্তী অংশকে সামলাতে সাহায্য করে: যুক্তির শৃঙ্খলা তৈরি করা, অ্যালগরিদমিক বিকল্পগুলির তুলনা করা এবং LLM সহায়তাকে সেখানে স্থাপন করা যেখানে এটি পরিবেশন করার পরিবর্তে উৎপাদনশীল। এটি অনাড়ম্বর বিটগুলিতে ভালো—পুনরাবৃত্তি, পরিদর্শন এবং 'সংস্করণ 12 এবং 13 এর মধ্যে কী পরিবর্তিত হয়েছে?'। প্রচারের বিশ্বে, 'আসলে কাজ করে' একটি অতি ক্ষমতা। এআই PPT সার্কিটে সিদ্ধান্ত নেওয়ার সাধারণ মিথ
- মিথ: 'আরও ডেটা ভালো মডেলকে হার মানায়'। কখনও কখনও। প্রায়শই এটি খারাপ চিন্তাভাবনাকে হার মানায়। পরিমিত ডেটা সহ একটি স্পষ্ট উদ্দেশ্য ভুল মেট্রিকের দিকে তাক করা ফায়ারহোজকে ছাড়িয়ে যেতে পারে।
- মিথ: 'ব্ল্যাক বক্স অনিবার্য'। না। এটি কখনও কখনও সুবিধাজনক। আপনি অস্বচ্ছ কোরের চারপাশে ব্যাখ্যাযোগ্য স্তর তৈরি করতে পারেন। আপনাকে শুধু যত্ন নিতে হবে।
- মিথ: 'অনুসন্ধান ঝুঁকিপূর্ণ'। অবশ্যই—এবং স্থবিরতাও তাই। ব্যান্ডিটগুলি একটি কারণে বিদ্যমান।
- মিথ: 'স্বয়ংক্রিয়তা হল লক্ষ্য'। স্বয়ংক্রিয়তা একটি উপায়। নির্ভরযোগ্যতা হল লক্ষ্য।
কেসলেট: যেখানে রাবার রাস্তায় মিলিত হয়
- লজিস্টিকস রুটিং: সম্ভাবনার জন্য A*, খরচের জন্য MILP, শেষ মাইলের বিশৃঙ্খলার জন্য হিউরিস্টিকস। অনিশ্চয়তা সহ একটি চাহিদার পূর্বাভাস যোগ করুন এবং আপনি একটি শক্তিশালী সিস্টেম পাবেন। না, একটি একক এন্ড-টু-এন্ড ডিপ নেট দ্বিতীয় সপ্তাহে ভালো করবে না যখন শহর একটি সেতু বন্ধ করে দেয়।
- মেডিকেল ট্রায়াজ: কঠিন নিরাপত্তার জন্য নিয়ম, ঝুঁকি স্কোরিংয়ের জন্য সম্ভাব্যতাভিত্তিক মডেল, বহিরাগতদের জন্য মানব-ইন-দ্য-লুপ। সিস্টেমের গুণ দ্রুততা নয়; এটি কখন ধীর হতে হবে তা জানা।
- কন্টেন্ট মডারেশন: ট্রায়াজের জন্য ক্লাসিফায়ার, আইনি সীমাবদ্ধতার জন্য নীতি নিয়ম, মানুষের কাছে আপিল। আপনি এটি 'সমাধান' করবেন না, আপনি এটি পরিচালনা করবেন—একটি লন কাটার মতো যা তির্যকভাবে বৃদ্ধি পায়।
কীভাবে একটি সিদ্ধান্ত সিস্টেম বিচার করবেন (স্লাইড ডেক নয়)
তিনটি প্রশ্ন জিজ্ঞাসা করুন:
- আপনি ঠিক কী অপটিমাইজ করছেন? যদি উত্তরের জন্য একের বেশি বাক্য বা একের কম বাক্য লাগে, তবে চিন্তা করুন।
- বিশ্ব পরিবর্তিত হলে কী হয়? যদি উত্তর হয় 'পুনরায় প্রশিক্ষণ দিন', তবে তারা প্রবাহ সম্পর্কে চিন্তা করেনি।
- আপনি কীভাবে জানবেন কখন আপনি ভুল করছেন? যদি উত্তর নীরবতা হয়, তবে চলে যান।
নিজের গভীরে ডুব তৈরি করা: একটি ব্যবহারিক রূপরেখা
যদি আপনি নিজের কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT একত্রিত করেন—কারণ আমরা সকলেই শেষ পর্যন্ত দোষী—তবে এটিকে সততার উপর ভিত্তি করে তৈরি করুন:
- সিদ্ধান্ত লুপ এবং আপনার উদ্দেশ্য ফাংশন দিয়ে শুরু করুন। একটি স্লাইড, সরল পাঠ্য।
- 'শেখা' থেকে 'সিদ্ধান্ত নেওয়া' আলাদা করুন। দুটি স্লাইড, শুধুমাত্র উদাহরণ।
- আপনার সীমাবদ্ধতাগুলি দেখান এবং কেন সেগুলি কঠিন। একটি স্লাইড, কোনো ব্যঙ্গোক্তি নয়।
- প্রত্যক্ষণ, অনুমান, পরিকল্পনার জন্য অ্যালগরিদম চয়ন করুন। প্রতিটির জন্য, ব্যর্থতার মোড তালিকাভুক্ত করুন।
- পর্যবেক্ষণ ব্যাখ্যা করুন: প্রবাহ, ওভাররাইড, ঘটনা প্লেবুক।
- অমীমাংসিত ঝুঁকি দিয়ে শেষ করুন। যদি আপনার কোনো ঝুঁকি না থাকে, তবে আপনি সম্পন্ন করেননি।
'আমি জানি না' বলার নীরব শক্তি
AI সিস্টেমগুলোর বিরত থাকার ক্ষমতা থাকা উচিত। এটাকে অনিশ্চয়তা-সচেতন সিদ্ধান্ত গ্রহণ, নির্বাচনি ভবিষ্যৎবাণী অথবা অন্য যেকোনো কিছুই বলতে পারেন। "বাদ দিন" বলার ক্ষমতা একটি সরঞ্জাম এবং একটি দায়বদ্ধতার মধ্যে পার্থক্য গড়ে দেয়। মানুষের মধ্যে এই সহজাত প্রবৃত্তিটি রয়েছে। আমরা এমন অনেক সিস্টেম তৈরি করেছি যেগুলোর এই ক্ষমতা নেই।
এতে আমাদের কী করার আছে
কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ কোনো জাদু নয়, এবং অ্যালগরিদমের গভীরে ডুব দেওয়াকে নতুন কোনো ধর্মের প্রচারণার মতো মনে হওয়া উচিত নয়। এটি হলো প্রকৌশল - সতর্কতার সাথে উদ্দেশ্য নির্ধারণ, সুস্পষ্ট সীমাবদ্ধতা, অকপট অনিশ্চয়তা এবং নির্ভরযোগ্যতার জন্য চমৎকারিত্ব ত্যাগ করার মানসিকতা। পরবর্তীতে যখন কোনো PPT আপনাকে বলবে যে সিস্টেমটি "সিদ্ধান্ত নিতে শিখেছে", তখন জিজ্ঞাসা করুন যখন ব্রিজটি ভেঙে গেছে, মেট্রিক ভুল, অথবা ব্যবহারকারী এমন কিছু করেছে যা কেউ অনুমান করতে পারেনি তখন কী হবে।
যদি উত্তর হয় একটি বড় তীর, তাহলে আপনার সিদ্ধান্ত আপনার কাছেই আছে।
কীওয়ার্ড-সচেতন পরিশিষ্ট (কীওয়ার্ড স্টাফিং ছাড়া)
- কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ: সুস্পষ্ট উদ্দেশ্য এবং সীমাবদ্ধতা ব্যবহার করে অনিশ্চয়তার মধ্যে কর্ম নির্বাচন করার অনুশীলন।
- অ্যালগরিদমের গভীরে ডুব: এটি কোনো রূপক নয়—অনুসন্ধান, অপটিমাইজেশন, সম্ভাব্য অনুমান, রিইনফোর্সমেন্ট লার্নিং, পরিকল্পনা, কার্যকারণ মডেলিং, সংকর।
- বাস্তব শিক্ষা: পদ্ধতিগুলোর মিশ্রণ করুন, সীমাবদ্ধতাগুলোকে আরও কঠিন করুন, অনিশ্চয়তাকে গ্রহণ করুন, সবকিছু নিরীক্ষণ করুন এবং একটি স্লাইডকে সিস্টেম হিসাবে দেখানোর আকাঙ্ক্ষা প্রতিহত করুন।
সাধারণ জিজ্ঞাসা (FAQ)
প্রশ্ন ১: কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ আসলে কী?
এটি হলো একটি সুস্পষ্ট উদ্দেশ্য এবং সীমাবদ্ধতা সহ অনিশ্চয়তার মধ্যে কর্ম নির্বাচন করা—অনুমান নয়। মজার বিষয় হলো মডেল নয়; মডেল, ডেটা এবং সুরক্ষাবিধি একসাথে কীভাবে কাজ করে যখন বিশ্ব প্রশিক্ষণ সেটের সাথে মিলতে অস্বীকার করে।
প্রশ্ন ২: AI সিদ্ধান্ত গ্রহণে গভীরভাবে জানার জন্য কোন অ্যালগরিদমগুলো গুরুত্বপূর্ণ?
অনুসন্ধান, অপটিমাইজেশন, সম্ভাব্য যুক্তি, রিইনফোর্সমেন্ট লার্নিং, পরিকল্পনা এবং কার্যকারণ মডেলগুলো হলো মূল ভিত্তি। সংকর সিস্টেম যা অর্জিত ধারণাগুলোকে প্রতীকী নিয়মের সাথে একত্রিত করে, সেগুলোই মূলত উৎপাদনে টিকে থাকে।
প্রশ্ন ৩: বৃহৎ ভাষা মডেলগুলো কি সিদ্ধান্ত গ্রহণের জন্য ভালো?
এগুলো বিকল্প প্রস্তাব করা এবং পরিকল্পনার কাঠামো তৈরির জন্য চমৎকার, কিন্তু কোনো রকম যাচাই-বাছাই ছাড়া সিদ্ধান্ত গ্রহণকারী হিসাবে খুবই খারাপ। LLM-কে লুপের মধ্যে ব্যবহার করুন: প্রস্তাব করুন, সীমাবদ্ধ করুন, যাচাই করুন—তারপর প্রতিটি ধাপ লগ করুন যেন আপনাকে একজন আইনজীবীর কাছে এটি ব্যাখ্যা করতে হবে।
প্রশ্ন ৪: কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT-তে আমি কীভাবে সবচেয়ে বড় ভুলগুলো এড়িয়ে যাব?
শেখাকে সিদ্ধান্ত গ্রহণ থেকে আলাদা করুন, উদ্দেশ্য সংজ্ঞায়িত করুন এবং সীমাবদ্ধতাগুলো স্পষ্টভাবে উল্লেখ করুন। ব্যর্থতার ধরণ এবং নিরীক্ষণ দেখান—যদি আপনার ডেকটি কেবল তীর এবং কোনো আপোষ না দেখায়, তবে এটি থিয়েটার, প্রকৌশল নয়।
প্রশ্ন ৫: AI সিদ্ধান্ত গ্রহণের কর্মপ্রবাহে Sider.AI কোথায় খাপ খায়?
Sider.AI জটিল বিষয়গুলোতে সাহায্য করে—যুক্তি কর্মপ্রবাহ তৈরি, তুলনা এবং পরিদর্শন করতে—যাতে আপনি LLM-এর সহায়তা সেখানে রাখতে পারেন যেখানে এটি কাজ করে, মার্কেটিং যেখানে চায় সেখানে নয়। ব্যবহারিক পুনরাবৃত্তির কথা ভাবুন, জাদুর কাঠির কথা নয়।