What is decision making in artificial intelligence, really?

It’s choosing actions under uncertainty with an explicit objective and constraints—not vibes. The interesting part isn’t the model; it’s how the model, data, and guardrails work together when the world refuses to match the training set.

Which algorithms matter for a deep dive into AI decision making?

Search, optimization, probabilistic reasoning, reinforcement learning, planning, and causal models are the spine. Hybrid systems that combine learned perception with symbolic rules are what actually survive production.

Are large language models good for decision making?

They’re great at proposing options and scaffolding plans, terrible as unchecked deciders. Use LLMs in the loop: suggest, constrain, validate—then log every step like you’ll need to explain it to a lawyer.

How do I avoid the biggest mistakes in a Decision Making in Artificial Intelligence PPT?

Separate learning from deciding, define the objective, and spell out constraints. Show failure modes and monitoring—if your deck is all arrows and no trade-offs, it’s theater, not engineering.

Where does [Sider.AI](https://sider.ai) fit into AI decision workflows?

[Sider.AI](https://sider.ai) helps with the messy middle—authoring, comparing, and inspecting reasoning workflows—so you can put LLM assistance where it works instead of where marketing wishes it did. Think practical iteration, not magic wand.

এআই-তে সিদ্ধান্ত গ্রহণ: স্লাইড ডেকগুলি ভুল পথে যায়

যে অংশে PPT এআইকে সহজ দেখানোর চেষ্টা করে

কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের বিষয়টা এমন যে সবাই এটা বোঝে ভান করে—যতক্ষণ না এটা কোনো দারুণ সিদ্ধান্ত নেয় অথবা কোনো স্পষ্ট ভুল করে বসে। তখনই হঠাৎ করে এটা 'খুব জটিল' বা 'ব্ল্যাক বক্স' হয়ে যায়, যেন অঙ্ক কলার খোসায় পিছলে গেল। আপনারা যারা কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের ওপর কোনো PPT দেখেছেন, তারা এর নিয়ম জানেন: বড় তীর, ফ্লোচার্ট এবং ক্লিপআর্টের টুকরা যা অনিবার্যতার ইঙ্গিত দেয়। এটা অনিবার্য নয়। এটা পুরোটাই সিদ্ধান্তের খেলা।

এটা অ্যালগরিদমগুলির গভীরে ডুব দেওয়া—আসল অ্যালগরিদম—যা এআই সিদ্ধান্ত গ্রহণে ব্যবহৃত হয়। বক্সযুক্ত তীরসহ কোনো স্লাইড ডেক নয়। এর উদ্দেশ্য হল 'এআই আমাদের জন্য সিদ্ধান্ত নেবে' এই ধারণা থেকে বেরিয়ে আসা এবং এই সিস্টেমগুলো কীভাবে আসলে পছন্দ করে সে সম্পর্কে কথা বলা। স্পয়লার: এগুলো সর্বজ্ঞানী ভবিষ্যদ্বক্তার মতো নয়, বরং খুব দ্রুত, খুব আক্ষরিক অর্থে যুক্তিবাদী যারা কখনো ট্র্যাফিকের মধ্যে বসতে বা বাচ্চাদের ঘুমের সময়ের দর কষাকষি করতে হয়নি।

এআই-এ 'সিদ্ধান্ত গ্রহণ' বলতে আমরা কী বুঝি (এবং PPTs খুব কমই স্বীকার করে)

'কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ' শুনতে মহৎ শোনালেও, বাস্তবে এটি কিছু কৌশলের সমষ্টি: নিয়ম-ভিত্তিক যুক্তি, অনুসন্ধান, অপটিমাইজেশন, সম্ভাব্যতাভিত্তিক অনুমান, রিইনফোর্সমেন্ট লার্নিং, পরিকল্পনা এবং হাইব্রিড সিস্টেম যা পুরো বিষয়টিকে একত্রিত করে। অ্যালগরিদমগুলো কিছুই 'চায়' না। এগুলো নির্দিষ্ট সীমাবদ্ধতার অধীনে নির্দিষ্ট ফাংশন অপটিমাইজ করে। ফাংশন বা সীমাবদ্ধতা পরিবর্তন করুন এবং আপনি একটি ভিন্ন 'বুদ্ধিমত্তা' পাবেন। যদি এটা শুনে আপনার কাছে স্পষ্ট মনে হয়, তাহলে অভিনন্দন—আপনি SlideShare-এর অর্ধেক ডেক থেকে এগিয়ে আছেন।

বেশিরভাগ কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT-এর আসল সমস্যা হল এগুলো সরলীকরণ করে না। সমস্যা হলো, এগুলো ভুল দিকে সরলীকরণ করে। তারা বোঝায় যে মডেলগুলো সিদ্ধান্ত নেয় কারণ তারা 'শিখেছে'। শেখা সিদ্ধান্ত নেওয়া নয়। শেখা আপনাকে একটি নীতি বা মডেল দেয়; সিদ্ধান্ত গ্রহণ হল এমন একটি প্রেক্ষাপটে সেই নীতি চালানো যা প্রশিক্ষণের ডেটার মতো নয়। দাবা খেলার শুরু মুখস্থ করা এবং মধ্য খেলার বিশৃঙ্খলা থেকে বেঁচে থাকার মধ্যে পার্থক্য—প্রথমটি বুলেট পয়েন্টে ভালো দেখায়; দ্বিতীয়টি জেতার জন্য জরুরি।

আসল সরঞ্জাম: নিয়ম থেকে পুরস্কার

আসুন আমরা সেই বিষয়গুলো নিয়ে আলোচনা করি যা শুনতে অদ্ভুত লাগে (তবে এখনও গুরুত্বপূর্ণ) থেকে শুরু করে আধুনিক সিস্টেমগুলোকে শক্তিশালী করে এমন কৌশলগুলো পর্যন্ত। সরল ভাষায়, কোনো অতিরিক্ত আকর্ষণ ছাড়াই।

নিয়ম-ভিত্তিক সিস্টেম: এখনও মৃত নয়, শুধু সৎ

কিছু এআই লোকের কাছে নিয়মগুলি বিব্রতকর, যেমন স্যান্ডেলের সাথে মোজা পরা। তবে নিয়ম-ভিত্তিক সিদ্ধান্ত গ্রহণের একটি বড় সুবিধা রয়েছে: স্বচ্ছতা। যদি কোনো কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT নিয়মগুলোকে 'পুরানো' হিসাবে বাদ দেয় তবে এটি অর্ধেক গল্প লুকিয়ে রাখছে। বিশেষজ্ঞ সিস্টেমগুলো ডোমেইন জ্ঞানকে যদি-তাহলে বিবৃতি হিসাবে এনকোড করে। এগুলো ভঙ্গুর, হ্যাঁ, তবে এগুলো নিরীক্ষণযোগ্য। যখন আপনার ডিটারমিনিজম এবং ট্রেসেবিলিটির প্রয়োজন হয়—সম্মতি পরীক্ষা, মেডিকেল ট্রায়াজ প্রোটোকল—তখন নিয়মগুলো কেবল কাজ করে না; বরং আরও ভালোভাবে কাজ করে।

সুবিধা: ডিটারমিনিস্টিক, ব্যাখ্যাযোগ্য, ডিবাগ করা সহজ

অসুবিধা: ভঙ্গুর, জটিল ডোমেইনগুলোতে স্কেল করা কঠিন

আপনি জানতে পারবেন কখন একটি নিয়ম সিস্টেম ব্যর্থ হয় কারণ এটি আপনাকে জানায়। বেশিরভাগ আধুনিক সিস্টেম নীরবে ব্যর্থ হয়।

অনুসন্ধান এবং অপটিমাইজেশন: সিদ্ধান্ত নেভিগেশন হিসাবে

আমরা ডেটার সমুদ্রে সবকিছু প্রশিক্ষিত করার আগে, আমরা অনুসন্ধান করতাম। ব্রেডথ-ফার্স্ট সার্চ, ডেপথ-ফার্স্ট সার্চ, A*, বিম সার্চ। এটি তেমন আকর্ষণীয় নয়, তবে যখনই আপনি কোনো পথ খোঁজার সমস্যা সমাধান করছেন—আক্ষরিক বা রূপকভাবে—তখন অনুসন্ধান হল মেরুদণ্ড। একটি ভাল হিউরিস্টিক সহ A* একটি দুর্বল উদ্দেশ্য সহ একটি 'স্মার্ট' মডেলকে পরাজিত করে।

অপটিমাইজেশন এটিকে আরও বিস্তৃত করে: আপনি একটি উদ্দেশ্য ফাংশন এবং সীমাবদ্ধতা নির্ধারণ করেন, তারপর আপনার কাছে থাকা কম্পিউটিং শক্তি দিয়ে সবচেয়ে ভালো সমাধানের দিকে যান। লিনিয়ার প্রোগ্রামিং, মিক্সড-ইনটিজার প্রোগ্রামিং, ইভোল্যুশনারি অ্যালগরিদম—একটি সময়সীমার মধ্যে 'প্রায় ভালো' থেকে 'যথেষ্ট ভালো' হওয়ার জন্য বর্ণানুক্রমিক স্যুপ।

সুবিধা: প্রমাণযোগ্য নিশ্চয়তা, নিয়ন্ত্রণযোগ্য ট্রেড-অফ

অসুবিধা: মডেলিং কঠিন; উদ্দেশ্যগুলি সূক্ষ্ম, বিপর্যয়কর উপায়ে ভুলভাবে নির্দিষ্ট করা হতে পারে

যখন একটি মডেল অদ্ভুত কিছু করে, তখন প্রায়শই এর কারণ হল আপনি ঠিক সেটাই পেয়েছেন যা আপনি চেয়েছিলেন—কিন্তু তা নয় যা আপনি বুঝিয়েছিলেন।

সম্ভাব্যতাভিত্তিক যুক্তি: অনিশ্চয়তা একটি বৈশিষ্ট্য

বায়েসিয়ান নেটওয়ার্ক, হিডেন মারকভ মডেল, কালম্যান ফিল্টার: ক্লাসিক। বিশ্ব নিশ্চিত এমন ভান না করে, এই পদ্ধতিগুলো অনিশ্চয়তার একটি চলমান হিসাব রাখে এবং এর বিরুদ্ধে পদক্ষেপ নেয়। অন্য কথায়, বাস্তববাদিতা।

সুবিধা: অনিশ্চয়তার অধীনে নীতিগত; ব্যাখ্যাযোগ্য কাঠামো

অসুবিধা: উচ্চ-মাত্রিক জটিলতায় স্কেলিং বেদনাদায়ক; অনুমানগুলি ফিরে আসে

সম্ভাব্যতাভিত্তিক পদ্ধতিগুলো হল সেই জিনিস যা বেশিরভাগ কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT ডেক্স 'confidence scores' দিয়ে বোঝায়। আত্মবিশ্বাস সম্ভাবনা নয়। সম্ভাবনা হল রসিদ সহ গণিত।

রিইনফোর্সমেন্ট লার্নিং: পুরস্কার নিয়ম তৈরি করে

রিইনফোর্সমেন্ট লার্নিং—Q-লার্নিং, পলিসি গ্র্যাডিয়েন্ট, অ্যাক্টর-ক্রিটিক ভ্যারিয়েন্ট—সিদ্ধান্ত গ্রহণকে একটি স্কোরবোর্ড সহ চেষ্টা এবং ত্রুটি হিসাবে তৈরি করে। আপনি পদক্ষেপ বাছাই করেন, পরিবেশ আপনাকে পুরস্কার দেয় এবং আপনি আপনার নীতিকে এমন পদক্ষেপের দিকে ঠেলে দেন যা সময়ের সাথে সাথে লাভজনক হয়। এখানেই এআই সত্যিকার অর্থে 'সিদ্ধান্ত নেয়', এই অর্থে যে এটি একটি গেম খেলে—আপনি যে গেমটি ডিজাইন করেছেন, আপনি এটি উপলব্ধি করুন বা না করুন।

সুবিধা: ক্রমিক সিদ্ধান্তের কাজের জন্য শক্তিশালী; এমন কৌশলগুলি শেখে যা আপনি স্পষ্টভাবে কোড করেননি

অসুবিধা: পুরস্কার হ্যাকিং; নমুনা অদক্ষতা; বিশ্ব সামান্য পরিবর্তিত হলেও ভঙ্গুর সাধারণীকরণ

লোকেরা দাবি করতে ভালোবাসে যে রিইনফোর্সমেন্ট লার্নিং 'মানুষ কীভাবে শেখে' তার মতো। আসলে নয়। মানুষের পূর্ব অভিজ্ঞতা, শরীর, একঘেয়েমি এবং সাধারণ জ্ঞান আছে। RL এজেন্টের একটি পুরস্কার ফাংশন রয়েছে এবং কাজ না হওয়া পর্যন্ত অর্থহীন চেষ্টা করার অসীম ধৈর্য রয়েছে।

পরিকল্পনা এবং POMDPs: বিশ্ব অর্ধেক দৃশ্যমান

বাস্তব বিশ্বের সিদ্ধান্ত গ্রহণ খুব কমই নিখুঁত তথ্যের সাথে আসে। পার্শিয়ালি অবজারভেবল মারকভ ডিসিশন প্রসেস (POMDPs) সেই অনিশ্চয়তাকে স্পষ্টভাবে মডেল করে: আপনি অবস্থা জানেন না, শুধুমাত্র সেই পর্যবেক্ষণগুলো জানেন যা এটির ইঙ্গিত দেয়। আংশিক পর্যবেক্ষণযোগ্যতার অধীনে পরিকল্পনা আপনাকে একটি বিশ্বাসের অবস্থা রাখতে বাধ্য করে—'আমরা যা দেখেছি তার ভিত্তিতে কী ঘটছে বলে আমরা মনে করি' এর জন্য একটি অভিনব শব্দ।

সুবিধা: অনিশ্চয়তা সম্পর্কে সৎ; সংবেদনশীল কর্মের জন্য আনুষ্ঠানিক ভিত্তি

অসুবিধা: computationally brutal; approximation একটি প্রয়োজনীয় মন্দ

যদি আপনার কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT অন্তত 'POMDP' শব্দটি ফিসফিস না করে, তবে এটি বাস্তবতাকে একটি ঐচ্ছিক সেটিংস হিসাবে দেখছে।

হাইব্রিড সিস্টেম এবং নিউরো-সিম্বলিক ম্যাশআপ

নিউরনাল নেটওয়ার্ক দেখে এবং লেবেল দেয়; সিম্বলিক সিস্টেম ব্যাখ্যা করে এবং সীমাবদ্ধ করে। তাদের একসাথে যুক্ত করুন এবং আপনি দরকারী কিছু পাবেন। উপলব্ধির জন্য ভিশন মডেল, নিরাপত্তার জন্য নিয়ম। প্রার্থী পদক্ষেপের জন্য ভাষা মডেল, সম্ভাবনার জন্য পরিকল্পনাকারী। এই হাইব্রিডগুলো কেবল প্রচলিত নয়; তারা প্রকৌশলগত নম্রতা প্রতিফলিত করে: যেখানে উপলব্ধি কঠিন সেখানে একটি শেখা মডেল ব্যবহার করুন, যেখানে ঝুঁকি বেশি সেখানে স্পষ্ট যুক্তি ব্যবহার করুন।

সুবিধা: বাস্তবসম্মত, নিয়ন্ত্রণযোগ্য, উভয়ের সেরা

অসুবিধা: ইন্টিগ্রেশন মাথাব্যথা, ভঙ্গুর ইন্টারফেস, নকল জটিলতা

সিদ্ধান্ত লুপ: মেশিনের জন্য OODA, কম সংক্ষিপ্ত রূপ সহ

বেশিরভাগ এআই সিদ্ধান্ত সিস্টেম একটি লুপ চালায়: পর্যবেক্ষণ, অনুমান, পরিকল্পনা, কাজ, পুনরাবৃত্তি। স্লাইড ডেকগুলো বৃত্ত এবং তীর পছন্দ করে; গুরুত্বপূর্ণ বিষয় হল উত্তেজনা। প্রতিটি ধাপ আপস করে। পর্যবেক্ষণ করুন (তবে সবকিছু নয়)। অনুমান করুন (তবে আপনার অনিশ্চয়তা বজায় রাখুন)। পরিকল্পনা করুন (তবে সময়ের মধ্যে)। কাজ করুন (তবে বিশ্বকে জ্বালিয়ে দেবেন না)।

প্রত্যক্ষণ থেকে প্রতীক: কাঁচা ডেটা থেকে বৈশিষ্ট্য। তথ্য হারান, আশা করি সঠিক তথ্য।

অনুমান থেকে বিশ্বাস: বৈশিষ্ট্য থেকে আসলে কী ঘটছে তার একটি বিতরণ।

নীতি থেকে পরিকল্পনা: বর্তমান বিশ্বাস থেকে একটি কর্মের ক্রম, গণনা এবং ঝুঁকির ক্ষুধা দ্বারা সীমাবদ্ধ।

কর্ম থেকে প্রতিক্রিয়া: কাজ করুন, ফলাফল পরিমাপ করুন, বিশ্বাস এবং প্যারামিটার আপডেট করুন। যদি আপনার লুপ অভিজ্ঞতার সাথে উন্নত না হয় তবে এটি অটোমেশন, এআই নয়।

কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT-তে সবচেয়ে বড় ভুল হল লুপটিকে পরিষ্কার দেখানো। উৎপাদনে, সেন্সর সরে যায়, মানুষ হস্তক্ষেপ করে এবং মেট্রিকগুলো একে অপরের সাথে লড়াই করে। দুর্দান্ত সিস্টেমগুলো হল সেইগুলো যা বিশ্ব যখন কাঁধে ঝাঁকায় তখন ধীরে ধীরে খারাপ হয়ে যায়।

অ্যালগরিদমের গভীরে ডুব (Buzzword সস ছাড়া)

আসুন আমরা দেখি লোকেরা আসলে কোন অ্যালগরিদম ব্যবহার করে—তারা কী সমাধান করে, কীভাবে তারা ব্যর্থ হয় এবং কোথায় তারা উজ্জ্বল।

মাল্টি-আর্মড ব্যান্ডিটস: নাটক ছাড়া অনুসন্ধান

যখন আপনার নতুন জিনিস চেষ্টা করার সাথে যা কাজ করে তা ব্যবহার করার মধ্যে ভারসাম্য বজায় রাখতে হয়—বিজ্ঞাপন নির্বাচন, সুপারিশ পরিবর্তন, UI পরীক্ষা—মাল্টি-আর্মড ব্যান্ডিটস গতির জন্য A/B পরীক্ষাকে হার মানায়। থম্পসন স্যাম্পলিং বাস্তববাদী পছন্দের: বায়েসিয়ান, সরল, কার্যকর। এটি একটি সম্পূর্ণ RL এজেন্ট হওয়ার ভান করে না। এটি এটির জন্য আরও ভাল।

এটির জন্য ব্যবহার করুন: প্রতিক্রিয়ার সাথে দ্রুত অনলাইন সিদ্ধান্ত গ্রহণ

এটির জন্য ব্যবহার করবেন না: দীর্ঘ-অনুভূমিক কৌশল, জটিল নির্ভরতা, নিরাপত্তা-সংকটপূর্ণ কিছু

মন্টে কার্লো ট্রি সার্চ: বাজেটের মধ্যে দূরদর্শিতা বাজানো

MCTS ভবিষ্যৎ নমুনা নেয়, তাদের সবগুলি নয়, কেবল সম্ভাব্যগুলি যথেষ্ট। এটি অ্যালগরিদমিকভাবে 'আসুন এটি নিয়ে চিন্তা করি, তবে পুরো বিকেল নয়' এর সমতুল্য। গেমস এবং কাঠামোবদ্ধ পরিকল্পনায় এটি জিতে যায়। উন্মুক্ত বিশৃঙ্খলায় এটি এমন কাঠামো তৈরি করে যা সেখানে নেই।

এটির জন্য দুর্দান্ত: সীমাবদ্ধ, ভালোভাবে মডেল করা সিদ্ধান্ত স্থান (গেমস, সীমাবদ্ধ পরিকল্পনা)

এটির জন্য দুর্বল: মডেলবিহীন বিশৃঙ্খলা (মানুষ, বাজার, )

ডায়নামিক প্রোগ্রামিং: একটি ক্যাচ সহ অনুকূল

বেলম্যান সমীকরণ, মান পুনরাবৃত্তি, নীতি পুনরাবৃত্তি। নিয়ন্ত্রণ তত্ত্বের মুকুট মণি, একটি মুকুট যা সূচকীয় বৃদ্ধি দিয়ে তৈরি। যদি রাজ্য স্থান বিস্ফোরিত হয় তবে আপনার আশাবাদও বিস্ফোরিত হয়।

এটির জন্য দুর্দান্ত: পরিচিত গতিশীলতা সহ ছোট থেকে মাঝারি মারকভিয়ান বিশ্ব

এটির জন্য দুর্বল: অন্য সবকিছু, যদি না আপনি আনুমানিক করেন (যার অর্থ, সবসময়)

হিউরিস্টিকস এবং মেটাহিউরিস্টিকস: অনাড়ম্বর কর্মীরা

সিমুলেটেড অ্যানিলিং, টাবু সার্চ, জেনেটিক অ্যালগরিদম। এগুলো মহিমান্বিত 'অনেক জিনিস চেষ্টা করুন, সেরাটি রাখুন, চালিয়ে যান'। এটি অপমান নয়। বেশিরভাগ বাস্তব সিদ্ধান্ত এইরকম দেখায় কারণ বাস্তবতা আপনাকে বসে থাকতে এবং একটি সঠিক সমীকরণ সমাধান করতে দেবে না যখন ঘড়ি চলছে।

এটির জন্য দুর্দান্ত: কঠিন সমন্বিত সমস্যা যেখানে অনুকূল একটি ফ্যান্টাসি

এটির জন্য দুর্বল: ডোমেইন যেখানে গতির চেয়ে নিশ্চয়তা বেশি গুরুত্বপূর্ণ

কার্যকারণ মডেল: কারণ পারস্পরিক সম্পর্ক একটি প্রতারক

কার্যকারণ সিদ্ধান্ত গ্রহণ—হ্যাঁ, পার্ল, গ্রাফ, হস্তক্ষেপ—আপনাকে জিজ্ঞাসা করার একটি উপায় দেয় 'যদি আমরা সত্যিই কিছু পরিবর্তন করি তাহলে কী হবে?' পরিবর্তে 'শেষবার কী হয়েছিল?'। যদি আপনার কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT কার্যকারণ অনুমানকে উল্লেখ না করে, তবে আপনার পণ্য এমন পছন্দ করে যা মানুষকে প্রভাবিত করে, আপনি অনুশোচনার জন্য একটি সুপারিশ ইঞ্জিন তৈরি করছেন।

এটির জন্য দুর্দান্ত: নীতি, ওষুধ, দ্বিতীয়-ক্রম প্রভাব সহ পণ্যের পরিবর্তন

এটির জন্য দুর্বল: সম্পূর্ণরূপে ভবিষ্যদ্বাণীমূলক কাজ যেখানে প্রতি-বাস্তবতার কোনো গুরুত্ব নেই

দুটি কঠিন সমস্যা: উদ্দেশ্য এবং সীমাবদ্ধতা

এআই সিদ্ধান্ত গ্রহণের প্রথম মিথ্যা হল আমরা 'পারফরম্যান্স' অপটিমাইজ করছি। ঠিক কী অপটিমাইজ করছি? ক্লিক? আপটাইম? রাজস্ব? নিরাপত্তা? ন্যায্যতা? লেটেন্সি? আপনি যদি এটি স্পষ্টভাবে না বলেন তবে আপনার কাছে কোনো সিস্টেম নেই—আপনার একটি ইচ্ছা আছে। উদ্দেশ্য ফাংশন হল পণ্য। এটিকে আইনি বয়লারপ্লেটের মতো আচরণ করুন এবং এটি আইনি বয়লারপ্লেটের মতোই আঘাত করবে।

বহু-উদ্দেশ্যমূলক ট্রেড-অফ বাগ নয়। এগুলোই কাজ। এগুলিকে স্পষ্টভাবে ওজন করুন, ক্ষতিটি সততার সাথে পরিমাপ করুন এবং এমন ভান করবেন না যে প্যারেটো ফ্রন্টগুলি নৈতিক কম্পাস।

সীমাবদ্ধতাগুলি পরে চিন্তা করার বিষয় নয়। এগুলোই আপনি কীভাবে ক্ষতি সীমাবদ্ধ করেন। কঠিন সীমাবদ্ধতা (না, সত্যিই, কখনও X অতিক্রম করবেন না) নরম শাস্তির থেকে আলাদা (দয়া করে X অতিক্রম করবেন না যদি না এটি লাভজনক হয়)। এমনভাবে লিখুন যেন আপনি সত্যিই এটি বোঝাতে চেয়েছেন।

শিল্পের প্রিয় স্ব-প্রতারণা হল আরও ডেটা একটি খারাপ উদ্দেশ্যকে ঠিক করে দেয় এমন চিন্তা করা। এটি করে না। এটি ভুল জিনিসটিকে খুব দক্ষ করে তোলে।

ব্যাখ্যা করার ক্ষমতা ঐচ্ছিক নয়; এটি প্রসঙ্গ

ব্যাখ্যাযোগ্য এআই-এর জন্য চাপ প্রায়শই একটি সম্মতি উপদ্রব হিসাবে তৈরি করা হয়। এটি পিছনের দিকে। 'ব্যাখ্যা করার ক্ষমতা' হল আপনি কীভাবে সেই লোকদের সাথে বিশ্বাস তৈরি করবেন যারা সিদ্ধান্তের উপর নির্ভর করে—এমনকি যদি তারা প্রকৌশলীও হয়। আপনার জানা দরকার কেন মডেলটি 'বাম দিকে ঘুরতে' বলেছিল, কোনো নিয়ন্ত্রককে খুশি করার জন্য নয়, বরং আবার ঘটার আগে একটি ক্র্যাশ ডিবাগ করার জন্য।

পোস্ট-হক ব্যাখ্যা (স্যালিয়েন্সি ম্যাপ, SHAP) কিছুই না থাকার চেয়ে ভালো, তবে সেগুলি লিপস্টিক—দরকারী লিপস্টিক—একটি শূকরের উপর যা একটি ঘোড়দৌড়ের ঘোড়া হতে পারে।

বিল্ট-ইন ইন্টারপ্রেটেবিলিটি (মনোটোনিক মডেল, জেনারেলাইজড অ্যাডিটিভ মডেল, শেখা থ্রেশহোল্ড সহ নিয়ম) পূর্বাভাসের আচরণের জন্য কিছুটা কাঁচা নির্ভুলতার সাথে আপস করে। অনেক ডোমেইনে, এটি একটি দর কষাকষি।

যদি আপনার কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT একটি রঙিন হিটম্যাপ দেখায় এবং এটিকে দিনের সমাপ্তি বলে, তবে আপনি সঠিকভাবে শিখেছেন কীভাবে উৎপাদনে একটি সিস্টেম চালাতে হয় না।

বৃহৎ ভাষা মডেল এবং সিদ্ধান্তের মরীচিকা

হ্যাঁ, LLM সিদ্ধান্ত নিতে পারে—অথবা অন্তত তারা অসাধারণ সাবলীলতার সাথে সিদ্ধান্তের প্রস্তাব দিতে পারে। তারা বিকল্প স্থান স্কেচ করতে, ট্রেড-অফের তালিকা করতে, এমনকি একটি পরিকল্পনার লুপের চারপাশে স্কাফোল্ডিং লিখতে দুর্দান্ত। তবে প্রলুব্ধকর অংশটি সবচেয়ে খারাপ অংশ: তারা বানিয়ে বললেও আত্মবিশ্বাসী শোনা যায়।

নিরাপদ প্যাটার্নটি 'মডেলকে সিদ্ধান্ত নিতে দিন' নয়। এটি হল: মডেলকে পরামর্শ দিতে দিন, নিয়ম দিয়ে সীমাবদ্ধ করুন, একটি পরিকল্পনাকারী বা অপটিমাইজার দিয়ে যাচাই করুন এবং প্রতিটি ধাপ লগ করুন। LLM-কে লুপে রাখুন, হুইলে নয়। আপনি আপনার গাড়ি চালানোর জন্য স্বয়ংক্রিয় সংশোধনকে দেবেন না।

স্লাইড থেকে সিস্টেমে: উৎপাদনে আসলে কী কাজ করে

এআই-এ একটি কার্যকরী সিদ্ধান্ত গ্রহণ সিস্টেম স্লাইডের মতো দেখায় না। এটি দেখতে এইরকম:

একটি স্পষ্ট উদ্দেশ্য যা বাস্তবতাকে প্রতিফলিত করে, আশাকে নয়।

সীমাবদ্ধতাগুলি যেখানে কঠিন হওয়া উচিত সেখানে কঠিন, যেখানে নরম হওয়া উচিত সেখানে নরম।

একটি ডেটা পাইপলাইন যা নিজের অনুপস্থিত অংশগুলি স্বীকার করে।

একটি সিদ্ধান্ত ইঞ্জিন যা পদ্ধতি মিশ্রিত করে: শেখা উপলব্ধি, সম্ভাব্যতাভিত্তিক অনুমান এবং একটি নীতি যা বলতে পারে 'আমি নিশ্চিত নই'।

পর্যবেক্ষণযোগ্যতা: ট্রেসিং, ব্যাখ্যা এবং রোলব্যাক।

বাতিল করার কর্তৃত্ব সহ মানুষের তত্ত্বাবধান।

শেষ অংশটি কিছু মহলে অমার্জিত বলে বিবেচিত হয়। 'এআই স্বয়ংক্রিয় হওয়া উচিত'। সম্ভবত। অথবা সম্ভবত পেশাদার নম্রতা প্রেস-রিলিজের পুরুষত্বের চেয়ে ভালো।

অনিবার্য 'সরঞ্জাম' প্রশ্ন

আপনি লাইব্রেরি এবং পরিষেবাগুলির একটি নক্ষত্রের সাথে এই সিদ্ধান্তের স্ট্যাক একত্রিত করতে পারেন। প্রচুর ভালো আছে। কম ধারাবাহিক আছে। সেরা সেটআপগুলি ঘর্ষণ কমায়—প্রম্পট তৈরি করা, আউটপুট পরিদর্শন করা, যুক্তি শৃঙ্খলাবদ্ধ করা, প্রান্তিক কেস পরীক্ষা করা—এবং যেখানে গুরুত্বপূর্ণ সেখানে গার্ডরেল রাখা সহজ করে তোলে।

একটি বাস্তব উদাহরণ হিসাবে Sider.AI বিবেচনা করুন। এটি আপনাকে কোনো অনুভূতিশীল প্রাণী বিক্রি করার চেষ্টা করছে না। এটি এমন সরঞ্জাম যা আসলে জটিল মধ্যবর্তী অংশকে সামলাতে সাহায্য করে: যুক্তির শৃঙ্খলা তৈরি করা, অ্যালগরিদমিক বিকল্পগুলির তুলনা করা এবং LLM সহায়তাকে সেখানে স্থাপন করা যেখানে এটি পরিবেশন করার পরিবর্তে উৎপাদনশীল। এটি অনাড়ম্বর বিটগুলিতে ভালো—পুনরাবৃত্তি, পরিদর্শন এবং 'সংস্করণ 12 এবং 13 এর মধ্যে কী পরিবর্তিত হয়েছে?'। প্রচারের বিশ্বে, 'আসলে কাজ করে' একটি অতি ক্ষমতা।

এআই PPT সার্কিটে সিদ্ধান্ত নেওয়ার সাধারণ মিথ

মিথ: 'আরও ডেটা ভালো মডেলকে হার মানায়'। কখনও কখনও। প্রায়শই এটি খারাপ চিন্তাভাবনাকে হার মানায়। পরিমিত ডেটা সহ একটি স্পষ্ট উদ্দেশ্য ভুল মেট্রিকের দিকে তাক করা ফায়ারহোজকে ছাড়িয়ে যেতে পারে।

মিথ: 'ব্ল্যাক বক্স অনিবার্য'। না। এটি কখনও কখনও সুবিধাজনক। আপনি অস্বচ্ছ কোরের চারপাশে ব্যাখ্যাযোগ্য স্তর তৈরি করতে পারেন। আপনাকে শুধু যত্ন নিতে হবে।

মিথ: 'অনুসন্ধান ঝুঁকিপূর্ণ'। অবশ্যই—এবং স্থবিরতাও তাই। ব্যান্ডিটগুলি একটি কারণে বিদ্যমান।

মিথ: 'স্বয়ংক্রিয়তা হল লক্ষ্য'। স্বয়ংক্রিয়তা একটি উপায়। নির্ভরযোগ্যতা হল লক্ষ্য।

কেসলেট: যেখানে রাবার রাস্তায় মিলিত হয়

লজিস্টিকস রুটিং: সম্ভাবনার জন্য A*, খরচের জন্য MILP, শেষ মাইলের বিশৃঙ্খলার জন্য হিউরিস্টিকস। অনিশ্চয়তা সহ একটি চাহিদার পূর্বাভাস যোগ করুন এবং আপনি একটি শক্তিশালী সিস্টেম পাবেন। না, একটি একক এন্ড-টু-এন্ড ডিপ নেট দ্বিতীয় সপ্তাহে ভালো করবে না যখন শহর একটি সেতু বন্ধ করে দেয়।

মেডিকেল ট্রায়াজ: কঠিন নিরাপত্তার জন্য নিয়ম, ঝুঁকি স্কোরিংয়ের জন্য সম্ভাব্যতাভিত্তিক মডেল, বহিরাগতদের জন্য মানব-ইন-দ্য-লুপ। সিস্টেমের গুণ দ্রুততা নয়; এটি কখন ধীর হতে হবে তা জানা।

কন্টেন্ট মডারেশন: ট্রায়াজের জন্য ক্লাসিফায়ার, আইনি সীমাবদ্ধতার জন্য নীতি নিয়ম, মানুষের কাছে আপিল। আপনি এটি 'সমাধান' করবেন না, আপনি এটি পরিচালনা করবেন—একটি লন কাটার মতো যা তির্যকভাবে বৃদ্ধি পায়।

কীভাবে একটি সিদ্ধান্ত সিস্টেম বিচার করবেন (স্লাইড ডেক নয়)

তিনটি প্রশ্ন জিজ্ঞাসা করুন:

আপনি ঠিক কী অপটিমাইজ করছেন? যদি উত্তরের জন্য একের বেশি বাক্য বা একের কম বাক্য লাগে, তবে চিন্তা করুন।

বিশ্ব পরিবর্তিত হলে কী হয়? যদি উত্তর হয় 'পুনরায় প্রশিক্ষণ দিন', তবে তারা প্রবাহ সম্পর্কে চিন্তা করেনি।

আপনি কীভাবে জানবেন কখন আপনি ভুল করছেন? যদি উত্তর নীরবতা হয়, তবে চলে যান।

নিজের গভীরে ডুব তৈরি করা: একটি ব্যবহারিক রূপরেখা

যদি আপনি নিজের কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT একত্রিত করেন—কারণ আমরা সকলেই শেষ পর্যন্ত দোষী—তবে এটিকে সততার উপর ভিত্তি করে তৈরি করুন:

সিদ্ধান্ত লুপ এবং আপনার উদ্দেশ্য ফাংশন দিয়ে শুরু করুন। একটি স্লাইড, সরল পাঠ্য।

'শেখা' থেকে 'সিদ্ধান্ত নেওয়া' আলাদা করুন। দুটি স্লাইড, শুধুমাত্র উদাহরণ।

আপনার সীমাবদ্ধতাগুলি দেখান এবং কেন সেগুলি কঠিন। একটি স্লাইড, কোনো ব্যঙ্গোক্তি নয়।

প্রত্যক্ষণ, অনুমান, পরিকল্পনার জন্য অ্যালগরিদম চয়ন করুন। প্রতিটির জন্য, ব্যর্থতার মোড তালিকাভুক্ত করুন।

পর্যবেক্ষণ ব্যাখ্যা করুন: প্রবাহ, ওভাররাইড, ঘটনা প্লেবুক।

অমীমাংসিত ঝুঁকি দিয়ে শেষ করুন। যদি আপনার কোনো ঝুঁকি না থাকে, তবে আপনি সম্পন্ন করেননি।

'আমি জানি না' বলার নীরব শক্তি

AI সিস্টেমগুলোর বিরত থাকার ক্ষমতা থাকা উচিত। এটাকে অনিশ্চয়তা-সচেতন সিদ্ধান্ত গ্রহণ, নির্বাচনি ভবিষ্যৎবাণী অথবা অন্য যেকোনো কিছুই বলতে পারেন। "বাদ দিন" বলার ক্ষমতা একটি সরঞ্জাম এবং একটি দায়বদ্ধতার মধ্যে পার্থক্য গড়ে দেয়। মানুষের মধ্যে এই সহজাত প্রবৃত্তিটি রয়েছে। আমরা এমন অনেক সিস্টেম তৈরি করেছি যেগুলোর এই ক্ষমতা নেই।

এতে আমাদের কী করার আছে

কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ কোনো জাদু নয়, এবং অ্যালগরিদমের গভীরে ডুব দেওয়াকে নতুন কোনো ধর্মের প্রচারণার মতো মনে হওয়া উচিত নয়। এটি হলো প্রকৌশল - সতর্কতার সাথে উদ্দেশ্য নির্ধারণ, সুস্পষ্ট সীমাবদ্ধতা, অকপট অনিশ্চয়তা এবং নির্ভরযোগ্যতার জন্য চমৎকারিত্ব ত্যাগ করার মানসিকতা। পরবর্তীতে যখন কোনো PPT আপনাকে বলবে যে সিস্টেমটি "সিদ্ধান্ত নিতে শিখেছে", তখন জিজ্ঞাসা করুন যখন ব্রিজটি ভেঙে গেছে, মেট্রিক ভুল, অথবা ব্যবহারকারী এমন কিছু করেছে যা কেউ অনুমান করতে পারেনি তখন কী হবে।

যদি উত্তর হয় একটি বড় তীর, তাহলে আপনার সিদ্ধান্ত আপনার কাছেই আছে।

কীওয়ার্ড-সচেতন পরিশিষ্ট (কীওয়ার্ড স্টাফিং ছাড়া)

কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ: সুস্পষ্ট উদ্দেশ্য এবং সীমাবদ্ধতা ব্যবহার করে অনিশ্চয়তার মধ্যে কর্ম নির্বাচন করার অনুশীলন।

অ্যালগরিদমের গভীরে ডুব: এটি কোনো রূপক নয়—অনুসন্ধান, অপটিমাইজেশন, সম্ভাব্য অনুমান, রিইনফোর্সমেন্ট লার্নিং, পরিকল্পনা, কার্যকারণ মডেলিং, সংকর।

বাস্তব শিক্ষা: পদ্ধতিগুলোর মিশ্রণ করুন, সীমাবদ্ধতাগুলোকে আরও কঠিন করুন, অনিশ্চয়তাকে গ্রহণ করুন, সবকিছু নিরীক্ষণ করুন এবং একটি স্লাইডকে সিস্টেম হিসাবে দেখানোর আকাঙ্ক্ষা প্রতিহত করুন।

সাধারণ জিজ্ঞাসা (FAQ)

প্রশ্ন ১: কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণ আসলে কী? এটি হলো একটি সুস্পষ্ট উদ্দেশ্য এবং সীমাবদ্ধতা সহ অনিশ্চয়তার মধ্যে কর্ম নির্বাচন করা—অনুমান নয়। মজার বিষয় হলো মডেল নয়; মডেল, ডেটা এবং সুরক্ষাবিধি একসাথে কীভাবে কাজ করে যখন বিশ্ব প্রশিক্ষণ সেটের সাথে মিলতে অস্বীকার করে।

প্রশ্ন ২: AI সিদ্ধান্ত গ্রহণে গভীরভাবে জানার জন্য কোন অ্যালগরিদমগুলো গুরুত্বপূর্ণ? অনুসন্ধান, অপটিমাইজেশন, সম্ভাব্য যুক্তি, রিইনফোর্সমেন্ট লার্নিং, পরিকল্পনা এবং কার্যকারণ মডেলগুলো হলো মূল ভিত্তি। সংকর সিস্টেম যা অর্জিত ধারণাগুলোকে প্রতীকী নিয়মের সাথে একত্রিত করে, সেগুলোই মূলত উৎপাদনে টিকে থাকে।

প্রশ্ন ৩: বৃহৎ ভাষা মডেলগুলো কি সিদ্ধান্ত গ্রহণের জন্য ভালো? এগুলো বিকল্প প্রস্তাব করা এবং পরিকল্পনার কাঠামো তৈরির জন্য চমৎকার, কিন্তু কোনো রকম যাচাই-বাছাই ছাড়া সিদ্ধান্ত গ্রহণকারী হিসাবে খুবই খারাপ। LLM-কে লুপের মধ্যে ব্যবহার করুন: প্রস্তাব করুন, সীমাবদ্ধ করুন, যাচাই করুন—তারপর প্রতিটি ধাপ লগ করুন যেন আপনাকে একজন আইনজীবীর কাছে এটি ব্যাখ্যা করতে হবে।

প্রশ্ন ৪: কৃত্রিম বুদ্ধিমত্তায় সিদ্ধান্ত গ্রহণের PPT-তে আমি কীভাবে সবচেয়ে বড় ভুলগুলো এড়িয়ে যাব? শেখাকে সিদ্ধান্ত গ্রহণ থেকে আলাদা করুন, উদ্দেশ্য সংজ্ঞায়িত করুন এবং সীমাবদ্ধতাগুলো স্পষ্টভাবে উল্লেখ করুন। ব্যর্থতার ধরণ এবং নিরীক্ষণ দেখান—যদি আপনার ডেকটি কেবল তীর এবং কোনো আপোষ না দেখায়, তবে এটি থিয়েটার, প্রকৌশল নয়।

প্রশ্ন ৫: AI সিদ্ধান্ত গ্রহণের কর্মপ্রবাহে Sider.AI কোথায় খাপ খায়? Sider.AI জটিল বিষয়গুলোতে সাহায্য করে—যুক্তি কর্মপ্রবাহ তৈরি, তুলনা এবং পরিদর্শন করতে—যাতে আপনি LLM-এর সহায়তা সেখানে রাখতে পারেন যেখানে এটি কাজ করে, মার্কেটিং যেখানে চায় সেখানে নয়। ব্যবহারিক পুনরাবৃত্তির কথা ভাবুন, জাদুর কাঠির কথা নয়।