What are the most important guardrails for AI agents?

Start with clear policy rules, least-privilege tool permissions, PII redaction, budget caps, and safety filters. Add human-in-the-loop approvals for high-risk actions and full observability to detect issues early.

How do you evaluate AI agent performance effectively?

Combine offline golden datasets and adversarial tests with online A/B tests and shadow mode. Track task success, safety violations, cost per task, latency, and user feedback for a complete view.

How can I prevent AI agents from hallucinating?

Use retrieval from curated sources, require citations, and implement self-check or verifier models. Set schema validation and conservative defaults when confidence is low.

When should a human review an AI agent’s work?

Route high-risk actions—funds movement, policy exceptions, sensitive communications—to human approval. You can relax thresholds over time as metrics stabilize.

What tools help set guardrails and monitor agents?

You’ll need policy-as-code configs, schema validators, safety classifiers, and tracing dashboards. Platforms like [Sider.AI](https://sider.ai) can centralize permissions, budget caps, and step-by-step traces to speed safe deployment.

AI এজেন্টের জন্য গার্ডরেল নির্ধারণ এবং কর্মক্ষমতা মূল্যায়ন করার পদ্ধতি

একটি নিরাপদ, নির্ভরযোগ্য AI এজেন্টের জন্য বাস্তবসম্মত ব্লুপ্রিন্ট

বিষয়টি কল্পনা করুন: আপনার স্বয়ংক্রিয় AI এজেন্ট আত্মবিশ্বাসের সাথে কাজ সম্পাদন করে, টুল ব্যবহার করে এবং গ্রাহকদের মেসেজ পাঠায়—এবং তারপর এটি চুপচাপ একটি ভুল করে, API বাজেটের চেয়ে বেশি খরচ করে ফেলে অথবা সংবেদনশীল ডেটার কিছু অংশ ফাঁস করে দেয়। একটি বাগ রিপোর্ট পাওয়ার পর, আপনাকে ফিচারগুলি রোলব্যাক করতে এবং কঠিন প্রশ্নের উত্তর দিতে হয়।

গার্ডরেল হলো কিভাবে আপনি এটি প্রতিরোধ করবেন। পারফরম্যান্স মূল্যায়ন হলো কিভাবে আপনি এটি প্রমাণ করবেন।

এই গাইড আপনাকে দেখাবে কিভাবে AI এজেন্টদের জন্য গার্ডরেল সেট করতে হয় এবং এমন একটি সিস্টেমের মাধ্যমে পারফরম্যান্স মূল্যায়ন করতে হয় যা আপনি মাস নয়, সপ্তাহের মধ্যে স্থাপন করতে পারবেন। আমরা নীতি, রানটাইম কন্ট্রোল, অফলাইন এবং অনলাইন মূল্যায়ন এবং সেই ফিডব্যাক লুপগুলি নিয়ে আলোচনা করব যা আপনার ঝুঁকির সীমার মধ্যে থেকে এজেন্টদের উন্নতি করতে সাহায্য করে।

আমরা আপনার স্ট্যাকের সাথে মানানসই করে ব্যবহারযোগ্য চেকলিস্ট, উদাহরণ এবং টেমপ্লেট সহ একটি ব্যবহারিক, সমাধান-ভিত্তিক পদ্ধতি ব্যবহার করব।

AI এজেন্টদের জন্য "গার্ডরেল" আসলে কী বোঝায়?

গার্ডরেল হল সেই সুস্পষ্ট নীতি, সীমাবদ্ধতা এবং রানটাইম প্রক্রিয়া যা কোনো AI এজেন্ট কী করতে, বলতে বা খরচ করতে পারে তার সীমা নির্ধারণ করে—বৈধ কাজে বাধা না দিয়ে। এদেরকে এভাবে ভাবা যেতে পারে:

নীতি: কী অনুমোদিত বা অননুমোদিত (যেমন, PII হ্যান্ডলিং, খরচের সীমা, ব্র্যান্ড ভয়েস, টুল ব্যবহারের সুযোগ)।

বাস্তবায়ন: আপনি কিভাবে সেই নিয়মগুলি প্রয়োগ করেন (যেমন, কনটেন্ট ফিল্টার, টুলের অনুমতি, খরচের ঊর্ধ্বসীমা)।

পর্যবেক্ষণযোগ্যতা: আপনি কিভাবে নিয়ম লঙ্ঘন সনাক্ত করেন (যেমন, লগিং, ট্রেস, সুরক্ষা পতাকা)।

সংশোধন: নিয়ম ভাঙলে কী ঘটে (যেমন, রোলব্যাক, মানুষের অনুমোদন, ঘটনার সতর্কতা)।

আপনি যখন AI এজেন্টদের জন্য গার্ডরেল সেট করেন, তখন আপনি একটি সুরক্ষা জাল তৈরি করছেন যা ব্যবহারকারীর আস্থা, আইনি সম্মতি এবং ব্র্যান্ডের অখণ্ডতাকে অগ্রাধিকার দেয়—এবং একই সাথে উচ্চ থ্রুপুট বজায় রাখে।

7-স্তরের গার্ডরেল স্ট্যাক (নীতি থেকে রানটাইম পর্যন্ত)

এই স্তরের পদ্ধতি ব্যবহার করুন যাতে একটি স্তরের ব্যর্থতা অন্য স্তরে প্রভাব ফেলতে না পারে।

নীতি এবং অভিপ্রায় স্তর

উদ্দেশ্য এবং সীমা নির্ধারণ করুন: এজেন্টটি কীসের জন্য এবং কীসের জন্য নয়।

সংক্ষিপ্ত, পরীক্ষাযোগ্য নীতি বিবৃতি লিখুন। উদাহরণ: "এজেন্ট গ্রাহকদের কাছে অভ্যন্তরীণ টিকিট আইডি প্রকাশ করতে পারবে না।"

নীতিগুলিকে নিয়মকানুনের সাথে সংযুক্ত করুন: PII-এর জন্য GDPR/CCPA, লগিংয়ের জন্য SOC 2 কন্ট্রোল, সেক্টর-নির্দিষ্ট নিয়ম।

পরিচয় এবং অনুমতি

প্রত্যেক এজেন্টকে একটি স্বতন্ত্র সার্ভিস আইডেন্টিটি দিন।

টুল পারমিশনগুলির সুযোগ নির্ধারণ করুন (কম সুযোগের নীতি): শুধুমাত্র পড়া বনাম লেখা বনাম অ্যাডমিন।

শংসাপত্রগুলি ঘোরান; একটি সিক্রেট ম্যানেজারে সংরক্ষণ করুন।

উচ্চ-ঝুঁকির কাজের জন্য সুস্পষ্ট সক্ষমতা মঞ্জুরি আবশ্যক করুন (রিফান্ড, কোড স্থাপন)।

ডেটা অ্যাক্সেস এবং রিডাকশন

ডেটা উৎসের জন্য অনুমোদিত তালিকা (allowlist) প্রয়োগ করুন; যতক্ষণ না পর্যন্ত যথাযথ কারণ দেখানো যাচ্ছে, কাঁচা প্রোডাকশন ডেটাবেস ব্লক করুন।

ইনজেকশন এবং প্রি-আউটপুটে PII রিডাক্ট করুন।

সিক্রেট (কী, টোকেন) মাস্ক করুন এবং লগগুলিকে কার্যকর রাখতে ডিটারমিনিস্টিক রিডাকশন ব্যবহার করুন।

পুনরুদ্ধার ফিল্টার প্রয়োগ করুন: সময়সীমা, নেমস্পেস, সংবেদনশীলতা ট্যাগ।

প্রম্পট এবং টুল-ব্যবহারের সীমাবদ্ধতা

সিস্টেম প্রম্পট: সুস্পষ্ট, পরীক্ষাযোগ্য শর্তাবলীতে নীতিগুলি এনকোড করুন ("কখনও যাচাই না করা চিকিৎসা পরামর্শ দেবেন না")।

টুল স্কিমা: ইনপুট এবং আউটপুটগুলি যাচাই করুন (JSON স্কিমা, enum সীমাবদ্ধতা)।

বাজেট ক্যাপ: টোকেন, সময় এবং টাস্ক প্রতি খরচের ঊর্ধ্বসীমা; অনিয়ন্ত্রিত লুপের উপর সার্কিট-ব্রেকার।

ঝুঁকিপূর্ণ কাজের জন্য প্রতিফলন এবং সমালোচনার ধাপ (কাজ করার আগে স্ব-পরীক্ষা)।

কনটেন্ট এবং সুরক্ষা ফিল্টার

প্রি- এবং পোস্ট-জেনারেশন ক্লাসিফিকেশন: টক্সিসিটি, PII, হ্যালুসিনেশন ঝুঁকি, ব্র্যান্ড স্টাইল।

সংবেদনশীল বিষয়ের জন্য নিয়ম-ভিত্তিক ফলব্যাক (অর্থ, স্বাস্থ্য, আইন)।

যে আউটপুটগুলির জন্য মানুষের পর্যালোচনার প্রয়োজন, সেগুলিতে ওয়াটারমার্ক দিন।

মানুষ-ইন-দ্য-লুপ (HITL) চেকপয়েন্ট

উচ্চ-ঝুঁকির কাজগুলি অনুমোদনের সারিতে প্রেরণ করুন।

পর্যালোচকদের কাঠামোগত রুব্রিক্স দিন (সঠিকতা, সুর, সম্মতি)।

আংশিক অনুমোদন সমর্থন করুন (সম্পাদনা অনুমোদন করুন, রিফান্ড বাতিল করুন)।

আরও ভাল স্বয়ংক্রিয় অনুমোদন প্রশিক্ষণের জন্য পর্যালোচকদের সিদ্ধান্ত লগ করুন।

পর্যবেক্ষণযোগ্যতা, সতর্কতা এবং ঘটনা প্রতিক্রিয়া

ইনপুট, আউটপুট এবং লেটেন্সি সহ প্রতিটি টুল কল ট্রেস করুন।

ইভেন্ট ট্যাগ করুন: policy_violation, safety_flag, override, customer_escalation।

খরচের উল্লম্ফন, লুপ স্টর্ম এবং পুনরাবৃত্ত প্রত্যাখ্যানের উপর রিয়েল-টাইম সতর্কতা।

রোলব্যাক এবং যোগাযোগ টেমপ্লেট সহ ঘটনার প্লেবুক।

কাগজ থেকে প্রোডাকশন: একটি গার্ডরেল সেটআপ চেকলিস্ট

এজেন্টের লক্ষ্য এবং অ-লক্ষ্যগুলি এক পৃষ্ঠায় সংজ্ঞায়িত করুন।

নীতিগুলিকে প্রম্পট নির্দেশাবলী এবং টুলের সীমাবদ্ধতায় অনুবাদ করুন।

পুনরুদ্ধার এবং আউটপুট উভয়ের জন্য ডেটা ফিল্টার এবং PII রিডাকশন তৈরি করুন।

বাজেট সেট করুন: সর্বোচ্চ টোকেন, প্রতি ধাপে সর্বোচ্চ টুল, টাস্ক প্রতি সর্বোচ্চ মোট খরচ।

কনটেন্ট ফিল্টার এবং ব্র্যান্ড স্টাইল চেক যুক্ত করুন।

উচ্চ-ঝুঁকির বিভাগগুলির জন্য HITL আবশ্যক করুন।

পর্যবেক্ষণযোগ্যতা প্রয়োগ করুন: লগ, ট্রেস, ড্যাশবোর্ড।

ঘটনার প্লেবুক এবং অন-কল সতর্কতা তৈরি করুন।

বৈরী পরীক্ষা চালান; ত্রুটিগুলি সংশোধন করুন; লঞ্চের আগে পুনরায় চালান।

AI এজেন্ট পারফরম্যান্স মূল্যায়ন: অফলাইন এবং অনলাইন

যা আপনি পরিমাপ করেন না, তা আপনি পরিচালনা করতে পারবেন না। আপনার উন্নয়ন জীবনচক্রে মূল্যায়ন তৈরি করুন।

1) লঞ্চের আগে সাফল্যের মেট্রিক সংজ্ঞায়িত করুন

টাস্ক সাফল্যের হার: এজেন্ট কি লক্ষ্য পূরণ করেছে?

প্রথম-বারের সঠিকতা: পর্যালোচনা ছাড়াই প্রাথমিক আউটপুট সঠিক ছিল?

সুরক্ষা/সম্মতি স্কোর: প্রতি 1,000টি ইন্টারঅ্যাকশনে লঙ্ঘন।

সফল টাস্ক প্রতি খরচ: সাফল্য প্রতি টোকেন + টুল।

সমাধানের জন্য লেটেন্সি: একটি ওয়ার্কফ্লো সম্পূর্ণ করার সময়।

গ্রাহক অভিজ্ঞতা: CSAT, সহায়তা, এসকেলেশন হার।

হ্যালুসিনেশন হার: একটি বেঞ্চমার্ক সেটে 100টি উত্তরের মধ্যে ভুল তথ্য।

2) অফলাইন (প্রি-প্রোডাকশন) মূল্যায়ন

গোল্ডেন ডেটাসেট: গ্রাউন্ড-ট্রুথ উত্তর সহ প্রতিনিধি টাস্ক তৈরি করুন।

সিনথেটিক প্রান্তিক কেস: বৈরী প্রম্পট, প্রম্পট ইনজেকশন, টুলের অপব্যবহার।

প্রম্পটের জন্য ইউনিট পরীক্ষা: স্ন্যাপশট পরীক্ষা যাতে রিগ্রেশন স্পষ্ট হয়।

টুল সিমুলেশন: প্যারামিটার যাচাইকরণ এবং পুনরায় চেষ্টাগুলি যাচাই করার জন্য বাহ্যিক সিস্টেমগুলিকে স্টাব করুন।

নীতি নিরীক্ষণ: আপনার নিজের নিয়মগুলির বিরুদ্ধে রেড-টিম।

আউটপুট রুব্রিক্স: সঠিকতা, সুর এবং সম্মতির জন্য ধারাবাহিক গ্রেডিং।

স্কোরিং অ্যাপ্রোচ: স্বয়ংক্রিয় মেট্রিক (স্কিমা বৈধতা, PII উপস্থিতি) এবং LLM-কে বিচারক হিসাবে ব্যবহারের মিশ্রণ করুন, শুধুমাত্র যেখানে ক্যালিব্রেট করা হয়েছে। সবসময় মানুষের সাথে স্পট-চেক করুন যতক্ষণ না পর্যন্ত চুক্তি উচ্চ হয়।

3) অনলাইন (পোস্ট-লঞ্চ) মূল্যায়ন

শ্যাডো মোড: এজেন্ট ড্রাফট করে; মানুষ সিদ্ধান্ত নেয়। ডেল্টা তুলনা করুন।

A/B পরীক্ষা: গার্ডরেল ভেরিয়েন্ট (কঠোর বনাম অনুমতিমূলক) এবং প্রম্পট সংস্করণ।

ইন্টারলিভিং: সূক্ষ্ম জয়গুলি সনাক্ত করতে একটি সেশনের মধ্যে বিকল্প কৌশল।

ক্যানারি রিলিজ: কঠোর পর্যবেক্ষণের সাথে 1-5% সেশনে রোল আউট করুন।

ফিডব্যাক ক্যাপচার: থাম্বস আপ/ডাউন, দ্রুত ট্যাগ (ভুল, অফ-ব্র্যান্ড, অনিরাপদ)।

কাউন্টারফ্যাকচুয়াল লগ: পুনরুৎপাদন করার জন্য ব্যর্থ সেশনের সম্পূর্ণ ট্রেস সংরক্ষণ করুন।

গার্ডরেল ডিজাইন করা যা উৎপাদনশীলতাকে নষ্ট করে না

অতিমাত্রায় করা সহজ। লক্ষ্য হল আনুপাতিক নিয়ন্ত্রণ: যেখানে ঝুঁকি বেশি, সেখানে শক্তিশালী সুরক্ষা, যেখানে কম, সেখানে হালকা স্পর্শ।

ঝুঁকি-স্তরের টাস্ক: প্রভাব অনুসারে টাস্কগুলিকে শ্রেণীবদ্ধ করুন (যেমন, টিয়ার 3 = সর্বজনীন কনটেন্ট; টিয়ার 1 = তহবিল স্থানান্তর)। টিয়ার বাড়ার সাথে সাথে শক্তিশালী গার্ডরেল প্রয়োগ করুন।

প্রগতিশীল প্রকাশ: এজেন্ট নির্ভরযোগ্যতা প্রমাণ করার সাথে সাথে আরও বেশি সক্ষমতা আনলক করুন।

অভিযোজিত থ্রেশহোল্ড: অসঙ্গতি বেড়ে গেলে ফিল্টারগুলি কঠোর করুন; স্থিতিশীল হলে শিথিল করুন।

স্মার্ট প্রত্যাখ্যান: কঠিন "না" বলার পরিবর্তে বিকল্প দিন।

ক্যাশিং এবং পুনরুদ্ধার: কর্তৃত্বপূর্ণ পুনরুদ্ধার এবং স্বল্প-মেয়াদী স্মৃতির মাধ্যমে হ্যালুসিনেশন হ্রাস করুন।

খরচ-সচেতন পরিকল্পনা: ড্রাফটিংয়ের জন্য সস্তা মডেলগুলিকে উৎসাহিত করুন; চূড়ান্তকরণের জন্য উচ্চ-গুণমানের মডেল ব্যবহার করুন।

ডোমেইন অনুসারে বাস্তব উদাহরণ

গ্রাহক সহায়তা এজেন্ট:

গার্ডরেল: জ্ঞান ভাণ্ডার পুনরুদ্ধারের মধ্যে সীমাবদ্ধ করুন; PII রিডাক্ট করুন; আইনি/চিকিৎসা পরামর্শ ব্লক করুন; $50-এর বেশি রিফান্ডের জন্য HITL।

মূল্যায়ন: সমাধানের হার, প্রথম প্রতিক্রিয়ার সময়, এসকেলেশন হার, নীতি লঙ্ঘনের হার।

সেলস আউটরিচ এজেন্ট:

গার্ডরেল: ব্র্যান্ড ভয়েস এবং সম্মতি পাঠ্য প্রয়োগ করুন; প্রেরণ থ্রটল করুন; ডোমেইন অনুমোদিত তালিকা; অপ্ট-আউট সম্মান করুন।

মূল্যায়ন: উত্তরের হার, যোগ্য মিটিং বুক করা, স্প্যাম অভিযোগ, আনসাবস্ক্রাইব।

কোডিং এজেন্ট:

গার্ডরেল: পরীক্ষা পাস না হওয়া পর্যন্ত শুধুমাত্র পড়া; স্যান্ডবক্সযুক্ত সম্পাদন; নির্ভরতা অনুমোদিত তালিকা; লাইসেন্স স্ক্যানার।

মূল্যায়ন: পরীক্ষার পাসের হার, PR প্রতি পর্যালোচনার মন্তব্য, সুরক্ষা সন্ধান, বিল্ড টাইম।

ডেটা বিশ্লেষক এজেন্ট:

গার্ডরেল: প্যারামিটারাইজড কোয়েরি, সারি-স্তরের সুরক্ষা, PII মাস্কিং, সময়-সীমা ফিল্টার।

মূল্যায়ন: কোয়েরির খরচ, গোল্ড নোটবুকের বিপরীতে সঠিকতা, আউটপুটের পুনঃব্যবহারযোগ্যতা।

প্যাটার্ন যা প্রোডাকশনে কাজ করে

নীতি হিসাবে সিস্টেম প্রম্পট: এগুলিকে সংক্ষিপ্ত, সংখ্যাযুক্ত এবং পরীক্ষাযোগ্য রাখুন। উদাহরণ: "1) শুধুমাত্র প্রদত্ত সরঞ্জাম ব্যবহার করুন। 2) অভ্যন্তরীণ আইডি কখনই প্রকাশ করবেন না। 3) যদি প্রয়োজনীয়তা অস্পষ্ট হয় তবে একবার স্পষ্টীকরণের জন্য জিজ্ঞাসা করুন।"

JSON-প্রথম আউটপুট: ব্যর্থ হলে অটো-রিট্রাই সহ ভ্যালিডেটর দ্বারা কঠোর স্কিমা প্রয়োগ করা হয়।

বাজেট এনভেলপ: ব্যাকঅফ এবং সামারি-অন-এক্সহস্টশন সহ প্রতি-ধাপ এবং প্রতি-পর্বের ক্যাপ।

ডুয়েল মডেল: দ্রুত মডেল ড্রাফট করে; নির্ভরযোগ্য মডেল যাচাই করে এবং সম্পাদনা করে।

টুল কল সংশয়বাদ: সম্পাদন করার আগে এজেন্টকে উচ্চ-ঝুঁকির কাজগুলি স্ব-যাচাই করতে বলুন।

রিপ্লে হার্নেস: প্রতিটি পরিবর্তনের পরে অতীতের ব্যর্থতাগুলি পুনরায় চালান; রিগ্রেশন সমাধান হলেই প্রেরণ করুন।

পুনরুদ্ধার এবং স্মৃতির জন্য গার্ডরেল

সোর্স-অফ-ট্রুথ নির্বাচন: কাঁচা ওয়েব ফলাফলের চেয়ে কিউরেটেড কর্পোরাকে পছন্দ করুন।

অ্যাট্রিবিউশন প্রয়োজনীয়তা: এজেন্টকে উৎস উদ্ধৃত করতে বা ট্রেসযোগ্য আইডি সরবরাহ করতে বলুন।

ফ্রেশনেস উইন্ডো: সময়-সংবেদনশীল উত্তরের জন্য N দিনের মধ্যে আপডেট হওয়া ডকুমেন্টগুলিতে সীমাবদ্ধ করুন।

মেমরি TTL: বাসি বা অতিরিক্ত ফিট হওয়া আচরণ রোধ করতে সেশন মেমরি অটো-এক্সপায়ার করুন।

ইনজেকশন প্রতিরোধ: পুনরুদ্ধার করা কনটেন্ট থেকে নির্দেশাবলী সরান; কনটেন্ট সেপারেটর এবং সাইনড কনটেক্সট ব্যবহার করুন।

থামানো ছাড়াই সুরক্ষা পরিমাপ করা

সুরক্ষা স্কোরকার্ড: সাপ্তাহিক রোলআপ—PII ঘটনা, ব্লক করা কাজ, ওভাররাইড, রিফান্ড রিভার্সাল।

লক্ষ্য নির্ধারণ: মেট্রিক প্রতি থ্রেশহোল্ড সেট করুন (যেমন, প্রতি 1k সেশনে <0.1% PII লিক)।

মূল-কারণ পর্যালোচনা: যে কোনও গুরুতর ঘটনার জন্য, প্রম্পট, সরঞ্জাম বা অনুমতি আপডেট করুন—তারপর পুনরায় পরীক্ষা করুন।

একা তীব্রতার চেয়ে ফলাফলের উপর জোর দিন: বিরল বড় নিষেধাজ্ঞার চেয়ে ছোটখাটো ঘন ঘন পরিবর্তনকে পছন্দ করুন।

সরঞ্জাম পরামর্শ (তৈরি বনাম কেনা)

কোড হিসাবে নীতি: নিয়মের জন্য কনফিগারেশন ফাইল ব্যবহার করুন যাতে আপনি সংস্করণ, পর্যালোচনা এবং রোল ব্যাক করতে পারেন।

যাচাইকরণ স্তর: JSON স্কিমা ভ্যালিডেটর, টাইপ গার্ড এবং সরঞ্জামগুলির জন্য চুক্তি পরীক্ষা।

সুরক্ষা শ্রেণীবদ্ধকারী: PII এবং বিষাক্ততার জন্য হালকা পাঠ্য শ্রেণীবদ্ধকারী; নিয়মের তালিকার সাথে একত্রিত করুন।

ট্রেসিং এবং বিশ্লেষণ: স্প্যান, ত্রুটি, খরচ এবং ব্যবহারকারীর প্রতিক্রিয়া কেন্দ্রীভূত করুন।

মূল্যায়ন হার্নেস: ড্যাশবোর্ড এবং ডিফিংসহ গোল্ডেন সেটের জন্য ব্যাচ রানার।

HITL কনসোল: সারি, অনুমোদন এবং রুব্রিক্স সহ টীকা।

নোট করার মতো: আপনি যদি প্রোটোটাইপিং করেন এবং এজেন্টদের স্পিন আপ করার, গার্ডরেল প্রয়োগ করার এবং ট্রেস পর্যালোচনা করার জন্য একটি জায়গা চান, তাহলে Sider.AI ওয়ার্কফ্লোকে সুগম করতে পারে। প্রসঙ্গত, দলগুলি সরঞ্জাম অনুমতি কনফিগার করতে, বাজেট ক্যাপ সেট করতে, ধাপে ধাপে যুক্তির ট্রেস পরিদর্শন করতে এবং পাশাপাশি মূল্যায়ন চালাতে এটি ব্যবহার করে, যা নিরাপদ-লঞ্চের সময় কমিয়ে দেয়।

এই সপ্তাহে গার্ডরেল সেট করার জন্য একটি ধাপে ধাপে টেমপ্লেট

1-2 দিন: সুযোগ এবং নীতি

এজেন্টের মিশন এবং অ-লক্ষ্য লিখুন।

8-12টি গার্ডরেল নিয়ম খসড়া করুন; সরঞ্জাম এবং প্রম্পটের সাথে ম্যাপ করুন।

ঝুঁকির স্তর এবং HITL সীমা নির্ধারণ করুন।

3-4 দিন: নিয়ন্ত্রণ প্রয়োগ করুন

ডেটা ফিল্টারিং এবং রিডাকশন যুক্ত করুন।

টুল ইনপুট/আউটপুটের জন্য JSON স্কিমা এনকোড করুন।

বাজেট ক্যাপ এবং সার্কিট-ব্রেকার যুক্ত করুন।

সুরক্ষা এবং ব্র্যান্ড স্টাইল চেক সংহত করুন।

5 দিন: পর্যবেক্ষণযোগ্যতা এবং পরীক্ষা

ট্রেসিং এবং খরচ ড্যাশবোর্ড চালু করুন।

প্রান্তিক কেস সহ 100-300 আইটেমের একটি গোল্ডেন সেট তৈরি করুন।

বৈরী পরীক্ষা চালান; লঙ্ঘন সংশোধন করুন।

ঘটনার প্লেবুক তৈরি করুন।

2 সপ্তাহ: পাইলট

শ্যাডো মোডে প্রেরণ করুন।

ফিডব্যাক সংগ্রহ করুন; কঠোর বনাম আলগা ফিল্টারগুলির A/B পরীক্ষা করুন।

প্রম্পট, থ্রেশহোল্ড এবং HITL রুট টিউন করুন।

ক্যানারি রোলআউটে প্রসারিত করুন।

এড়াতে সাধারণ অ্যান্টি-প্যাটার্ন

অতিরিক্ত দীর্ঘ সিস্টেম প্রম্পট যা মূল নিয়মগুলিকে চাপা দেয়।

সীমাহীন সরঞ্জাম অনুমতি ("* যে কোনও কিছু কল করতে পারে")।

লগে কাঁচা PII সংরক্ষণ করা।

ক্যালিব্রেশন ছাড়াই সম্পূর্ণরূপে "LLM-কে বিচারক" হিসাবে ব্যবহারের উপর নির্ভর করা।

ঝুঁকিপূর্ণ কাজের জন্য কোনও গোল্ডেন সেট কভারেজ নেই।

ঘটনার প্লেবুক ছাড়া প্রেরণ করা।

দ্রুত রেফারেন্স: নমুনা গার্ডরেল নীতি

উদ্দেশ্য: বিলিং প্রশ্নের জন্য গ্রাহক সমর্থন বিচ্যুতি। অ-লক্ষ্য: আইনি, চিকিৎসা বা HR পরামর্শ। নিয়ম:

শুধুমাত্র KB এবং বিলিং API ব্যবহার করুন; কাঁচা ব্যবহারকারী টেবিল কখনই কোয়েরি করবেন না।

প্রকাশ্যে অনুরোধ করা হলে অ্যাকাউন্ট আইডির শেষ 4টি সংখ্যা ব্যতীত আউটপুটে সমস্ত PII রিডাক্ট করুন।

$50-এর বেশি রিফান্ডের জন্য মানুষের অনুমোদনের প্রয়োজন।

অভ্যন্তরীণ টিকিট আইডি কখনই প্রকাশ করবেন না।

যদি অনিশ্চিত হন, উত্তর দেওয়ার আগে একটি স্পষ্টীকরণ প্রশ্ন জিজ্ঞাসা করুন।

নীতির উত্তরের জন্য KB আর্টিকেলের আইডি উল্লেখ করুন।

3টি সরঞ্জাম কলের পরে বন্ধ করুন; সমাধান না হলে সংক্ষিপ্তসার করুন এবং বৃদ্ধি করুন।

যদি সুরক্ষা বা সম্মতি ফিল্টার ট্রিগার করে তবে বাতিল করুন।

মেট্রিক: সমাধানের হার ≥ 75%, নীতি লঙ্ঘন ≤ 0.1%/1k সেশন, গড় খরচ ≤ প্রতি সমাধান করা টিকিটে $0.08।

একসাথে আনা: নিয়ন্ত্রণ, আত্মবিশ্বাস এবং ক্রমাগত শিক্ষা

মহান AI এজেন্টরা শুধু স্মার্ট নয়—তারা অনুমানযোগ্য। আপনি যখন AI এজেন্টদের জন্য গার্ডরেল সেট করেন এবং পারফরম্যান্স মূল্যায়ন করেন, তখন আপনি একটি শক্ত লুপ তৈরি করেন: সীমা নির্ধারণ করুন, ফলাফল পরিমাপ করুন, শিখুন এবং পুনরায় স্থাপন করুন। আপনি দ্রুত এগিয়ে যাবেন কারণ আপনি সতর্কতামূলক টেপ নয়, আত্মবিশ্বাসের সাথে প্রেরণ করেন।

পরবর্তী পদক্ষেপ:

আজই একটি নীতি-হিসাবে-কোড ফাইল শুরু করুন; এটিকে 200 লাইনের নিচে রাখুন।

30টি বৈরী প্রম্পট সহ আপনার প্রথম 150-কেসের গোল্ডেন সেট তৈরি করুন।

আপনার পরবর্তী রিলিজের আগে বাজেট ক্যাপ এবং সরঞ্জাম স্কিমা যুক্ত করুন।

শ্যাডো মোড এবং একটি সুস্পষ্ট A/B হাইপোথিসিসের সাথে পাইলট করুন।

সাপ্তাহিকভাবে সুরক্ষা স্কোরকার্ড পর্যালোচনা করুন এবং মেট্রিক স্থিতিশীল হওয়ার সাথে সাথে ম্যানুয়াল চেকগুলি বন্ধ করুন।

মূল বিষয়:

লেয়ার গার্ডরেল: নীতি → অনুমতি → ডেটা → সরঞ্জাম → ফিল্টার → HITL → পর্যবেক্ষণযোগ্যতা।

যা গুরুত্বপূর্ণ তা পরিমাপ করুন: সাফল্য, সুরক্ষা, খরচ, লেটেন্সি এবং অভিজ্ঞতা।

ঝুঁকির স্তর এবং প্রগতিশীল ক্ষমতার সাথে সুরক্ষা এবং গতির ভারসাম্য বজায় রাখুন।

মূল্যায়নকে ক্রমাগত হিসাবে বিবেচনা করুন—গেট হিসাবে নয়, একটি ফিডব্যাক ইঞ্জিন হিসাবে।

FAQ

প্রশ্ন 1: AI এজেন্টদের জন্য সবচেয়ে গুরুত্বপূর্ণ গার্ডরেলগুলি কী কী? স্পষ্ট নীতি নিয়ম, সর্বনিম্ন সুযোগের সরঞ্জাম অনুমতি, PII রিডাকশন, বাজেট ক্যাপ এবং সুরক্ষা ফিল্টার দিয়ে শুরু করুন। উচ্চ-ঝুঁকির কাজের জন্য মানুষ-ইন-দ্য-লুপ অনুমোদন এবং সমস্যাগুলি দ্রুত সনাক্ত করার জন্য সম্পূর্ণ পর্যবেক্ষণযোগ্যতা যুক্ত করুন।

প্রশ্ন 2: আপনি কিভাবে AI এজেন্টের কর্মক্ষমতা কার্যকরভাবে মূল্যায়ন করবেন? অনলাইন A/B পরীক্ষা এবং শ্যাডো মোডের সাথে অফলাইন গোল্ডেন ডেটাসেট এবং বৈরী পরীক্ষা একত্রিত করুন। একটি সম্পূর্ণ দৃশ্যের জন্য টাস্ক সাফল্য, সুরক্ষা লঙ্ঘন, টাস্ক প্রতি খরচ, লেটেন্সি এবং ব্যবহারকারীর প্রতিক্রিয়া ট্র্যাক করুন।

প্রশ্ন 3: আমি কিভাবে AI এজেন্টদের হ্যালুসিনেট করা থেকে আটকাতে পারি? কিউরেটেড উৎস থেকে পুনরুদ্ধার ব্যবহার করুন, উদ্ধৃতিগুলির প্রয়োজন করুন এবং স্ব-চেক বা যাচাইকারী মডেল প্রয়োগ করুন। আত্মবিশ্বাস কম হলে স্কিমা বৈধতা এবং রক্ষণশীল ডিফল্ট সেট করুন।

প্রশ্ন 4: কখন একজন মানুষের AI এজেন্টের কাজ পর্যালোচনা করা উচিত? উচ্চ-ঝুঁকির কাজ—তহবিল স্থানান্তর, নীতি ব্যতিক্রম, সংবেদনশীল যোগাযোগ—মানুষের অনুমোদনের জন্য রুট করুন। মেট্রিক স্থিতিশীল হওয়ার সাথে সাথে আপনি সময়ের সাথে সাথে থ্রেশহোল্ড শিথিল করতে পারেন।

প্রশ্ন 5: গার্ডরেল সেট করতে এবং এজেন্টদের নিরীক্ষণ করতে কোন সরঞ্জামগুলি সাহায্য করে? আপনার নীতি-হিসাবে-কোড কনফিগারেশন, স্কিমা ভ্যালিডেটর, সুরক্ষা শ্রেণীবদ্ধকারী এবং ট্রেসিং ড্যাশবোর্ডের প্রয়োজন হবে। Sider.AI-এর মতো প্ল্যাটফর্মগুলি নিরাপদ স্থাপনাকে দ্রুত করার জন্য অনুমতি, বাজেট ক্যাপ এবং ধাপে ধাপে ট্রেস কেন্দ্রীভূত করতে পারে।