একটি নিরাপদ, নির্ভরযোগ্য AI এজেন্টের জন্য বাস্তবসম্মত ব্লুপ্রিন্ট
বিষয়টি কল্পনা করুন: আপনার স্বয়ংক্রিয় AI এজেন্ট আত্মবিশ্বাসের সাথে কাজ সম্পাদন করে, টুল ব্যবহার করে এবং গ্রাহকদের মেসেজ পাঠায়—এবং তারপর এটি চুপচাপ একটি ভুল করে, API বাজেটের চেয়ে বেশি খরচ করে ফেলে অথবা সংবেদনশীল ডেটার কিছু অংশ ফাঁস করে দেয়। একটি বাগ রিপোর্ট পাওয়ার পর, আপনাকে ফিচারগুলি রোলব্যাক করতে এবং কঠিন প্রশ্নের উত্তর দিতে হয়।
গার্ডরেল হলো কিভাবে আপনি এটি প্রতিরোধ করবেন। পারফরম্যান্স মূল্যায়ন হলো কিভাবে আপনি এটি প্রমাণ করবেন।
এই গাইড আপনাকে দেখাবে কিভাবে AI এজেন্টদের জন্য গার্ডরেল সেট করতে হয় এবং এমন একটি সিস্টেমের মাধ্যমে পারফরম্যান্স মূল্যায়ন করতে হয় যা আপনি মাস নয়, সপ্তাহের মধ্যে স্থাপন করতে পারবেন। আমরা নীতি, রানটাইম কন্ট্রোল, অফলাইন এবং অনলাইন মূল্যায়ন এবং সেই ফিডব্যাক লুপগুলি নিয়ে আলোচনা করব যা আপনার ঝুঁকির সীমার মধ্যে থেকে এজেন্টদের উন্নতি করতে সাহায্য করে।
আমরা আপনার স্ট্যাকের সাথে মানানসই করে ব্যবহারযোগ্য চেকলিস্ট, উদাহরণ এবং টেমপ্লেট সহ একটি ব্যবহারিক, সমাধান-ভিত্তিক পদ্ধতি ব্যবহার করব।
AI এজেন্টদের জন্য "গার্ডরেল" আসলে কী বোঝায়?
গার্ডরেল হল সেই সুস্পষ্ট নীতি, সীমাবদ্ধতা এবং রানটাইম প্রক্রিয়া যা কোনো AI এজেন্ট কী করতে, বলতে বা খরচ করতে পারে তার সীমা নির্ধারণ করে—বৈধ কাজে বাধা না দিয়ে। এদেরকে এভাবে ভাবা যেতে পারে:
- নীতি: কী অনুমোদিত বা অননুমোদিত (যেমন, PII হ্যান্ডলিং, খরচের সীমা, ব্র্যান্ড ভয়েস, টুল ব্যবহারের সুযোগ)।
- বাস্তবায়ন: আপনি কিভাবে সেই নিয়মগুলি প্রয়োগ করেন (যেমন, কনটেন্ট ফিল্টার, টুলের অনুমতি, খরচের ঊর্ধ্বসীমা)।
- পর্যবেক্ষণযোগ্যতা: আপনি কিভাবে নিয়ম লঙ্ঘন সনাক্ত করেন (যেমন, লগিং, ট্রেস, সুরক্ষা পতাকা)।
- সংশোধন: নিয়ম ভাঙলে কী ঘটে (যেমন, রোলব্যাক, মানুষের অনুমোদন, ঘটনার সতর্কতা)।
আপনি যখন AI এজেন্টদের জন্য গার্ডরেল সেট করেন, তখন আপনি একটি সুরক্ষা জাল তৈরি করছেন যা ব্যবহারকারীর আস্থা, আইনি সম্মতি এবং ব্র্যান্ডের অখণ্ডতাকে অগ্রাধিকার দেয়—এবং একই সাথে উচ্চ থ্রুপুট বজায় রাখে।
7-স্তরের গার্ডরেল স্ট্যাক (নীতি থেকে রানটাইম পর্যন্ত)
এই স্তরের পদ্ধতি ব্যবহার করুন যাতে একটি স্তরের ব্যর্থতা অন্য স্তরে প্রভাব ফেলতে না পারে।
- উদ্দেশ্য এবং সীমা নির্ধারণ করুন: এজেন্টটি কীসের জন্য এবং কীসের জন্য নয়।
- সংক্ষিপ্ত, পরীক্ষাযোগ্য নীতি বিবৃতি লিখুন। উদাহরণ: "এজেন্ট গ্রাহকদের কাছে অভ্যন্তরীণ টিকিট আইডি প্রকাশ করতে পারবে না।"
- নীতিগুলিকে নিয়মকানুনের সাথে সংযুক্ত করুন: PII-এর জন্য GDPR/CCPA, লগিংয়ের জন্য SOC 2 কন্ট্রোল, সেক্টর-নির্দিষ্ট নিয়ম।
- প্রত্যেক এজেন্টকে একটি স্বতন্ত্র সার্ভিস আইডেন্টিটি দিন।
- টুল পারমিশনগুলির সুযোগ নির্ধারণ করুন (কম সুযোগের নীতি): শুধুমাত্র পড়া বনাম লেখা বনাম অ্যাডমিন।
- শংসাপত্রগুলি ঘোরান; একটি সিক্রেট ম্যানেজারে সংরক্ষণ করুন।
- উচ্চ-ঝুঁকির কাজের জন্য সুস্পষ্ট সক্ষমতা মঞ্জুরি আবশ্যক করুন (রিফান্ড, কোড স্থাপন)।
- ডেটা অ্যাক্সেস এবং রিডাকশন
- ডেটা উৎসের জন্য অনুমোদিত তালিকা (allowlist) প্রয়োগ করুন; যতক্ষণ না পর্যন্ত যথাযথ কারণ দেখানো যাচ্ছে, কাঁচা প্রোডাকশন ডেটাবেস ব্লক করুন।
- ইনজেকশন এবং প্রি-আউটপুটে PII রিডাক্ট করুন।
- সিক্রেট (কী, টোকেন) মাস্ক করুন এবং লগগুলিকে কার্যকর রাখতে ডিটারমিনিস্টিক রিডাকশন ব্যবহার করুন।
- পুনরুদ্ধার ফিল্টার প্রয়োগ করুন: সময়সীমা, নেমস্পেস, সংবেদনশীলতা ট্যাগ।
- প্রম্পট এবং টুল-ব্যবহারের সীমাবদ্ধতা
- সিস্টেম প্রম্পট: সুস্পষ্ট, পরীক্ষাযোগ্য শর্তাবলীতে নীতিগুলি এনকোড করুন ("কখনও যাচাই না করা চিকিৎসা পরামর্শ দেবেন না")।
- টুল স্কিমা: ইনপুট এবং আউটপুটগুলি যাচাই করুন (JSON স্কিমা, enum সীমাবদ্ধতা)।
- বাজেট ক্যাপ: টোকেন, সময় এবং টাস্ক প্রতি খরচের ঊর্ধ্বসীমা; অনিয়ন্ত্রিত লুপের উপর সার্কিট-ব্রেকার।
- ঝুঁকিপূর্ণ কাজের জন্য প্রতিফলন এবং সমালোচনার ধাপ (কাজ করার আগে স্ব-পরীক্ষা)।
- কনটেন্ট এবং সুরক্ষা ফিল্টার
- প্রি- এবং পোস্ট-জেনারেশন ক্লাসিফিকেশন: টক্সিসিটি, PII, হ্যালুসিনেশন ঝুঁকি, ব্র্যান্ড স্টাইল।
- সংবেদনশীল বিষয়ের জন্য নিয়ম-ভিত্তিক ফলব্যাক (অর্থ, স্বাস্থ্য, আইন)।
- যে আউটপুটগুলির জন্য মানুষের পর্যালোচনার প্রয়োজন, সেগুলিতে ওয়াটারমার্ক দিন।
- মানুষ-ইন-দ্য-লুপ (HITL) চেকপয়েন্ট
- উচ্চ-ঝুঁকির কাজগুলি অনুমোদনের সারিতে প্রেরণ করুন।
- পর্যালোচকদের কাঠামোগত রুব্রিক্স দিন (সঠিকতা, সুর, সম্মতি)।
- আংশিক অনুমোদন সমর্থন করুন (সম্পাদনা অনুমোদন করুন, রিফান্ড বাতিল করুন)।
- আরও ভাল স্বয়ংক্রিয় অনুমোদন প্রশিক্ষণের জন্য পর্যালোচকদের সিদ্ধান্ত লগ করুন।
- পর্যবেক্ষণযোগ্যতা, সতর্কতা এবং ঘটনা প্রতিক্রিয়া
- ইনপুট, আউটপুট এবং লেটেন্সি সহ প্রতিটি টুল কল ট্রেস করুন।
- ইভেন্ট ট্যাগ করুন: policy_violation, safety_flag, override, customer_escalation।
- খরচের উল্লম্ফন, লুপ স্টর্ম এবং পুনরাবৃত্ত প্রত্যাখ্যানের উপর রিয়েল-টাইম সতর্কতা।
- রোলব্যাক এবং যোগাযোগ টেমপ্লেট সহ ঘটনার প্লেবুক।
কাগজ থেকে প্রোডাকশন: একটি গার্ডরেল সেটআপ চেকলিস্ট
- এজেন্টের লক্ষ্য এবং অ-লক্ষ্যগুলি এক পৃষ্ঠায় সংজ্ঞায়িত করুন।
- নীতিগুলিকে প্রম্পট নির্দেশাবলী এবং টুলের সীমাবদ্ধতায় অনুবাদ করুন।
- পুনরুদ্ধার এবং আউটপুট উভয়ের জন্য ডেটা ফিল্টার এবং PII রিডাকশন তৈরি করুন।
- বাজেট সেট করুন: সর্বোচ্চ টোকেন, প্রতি ধাপে সর্বোচ্চ টুল, টাস্ক প্রতি সর্বোচ্চ মোট খরচ।
- কনটেন্ট ফিল্টার এবং ব্র্যান্ড স্টাইল চেক যুক্ত করুন।
- উচ্চ-ঝুঁকির বিভাগগুলির জন্য HITL আবশ্যক করুন।
- পর্যবেক্ষণযোগ্যতা প্রয়োগ করুন: লগ, ট্রেস, ড্যাশবোর্ড।
- ঘটনার প্লেবুক এবং অন-কল সতর্কতা তৈরি করুন।
- বৈরী পরীক্ষা চালান; ত্রুটিগুলি সংশোধন করুন; লঞ্চের আগে পুনরায় চালান।
AI এজেন্ট পারফরম্যান্স মূল্যায়ন: অফলাইন এবং অনলাইন
যা আপনি পরিমাপ করেন না, তা আপনি পরিচালনা করতে পারবেন না। আপনার উন্নয়ন জীবনচক্রে মূল্যায়ন তৈরি করুন।
1) লঞ্চের আগে সাফল্যের মেট্রিক সংজ্ঞায়িত করুন
- টাস্ক সাফল্যের হার: এজেন্ট কি লক্ষ্য পূরণ করেছে?
- প্রথম-বারের সঠিকতা: পর্যালোচনা ছাড়াই প্রাথমিক আউটপুট সঠিক ছিল?
- সুরক্ষা/সম্মতি স্কোর: প্রতি 1,000টি ইন্টারঅ্যাকশনে লঙ্ঘন।
- সফল টাস্ক প্রতি খরচ: সাফল্য প্রতি টোকেন + টুল।
- সমাধানের জন্য লেটেন্সি: একটি ওয়ার্কফ্লো সম্পূর্ণ করার সময়।
- গ্রাহক অভিজ্ঞতা: CSAT, সহায়তা, এসকেলেশন হার।
- হ্যালুসিনেশন হার: একটি বেঞ্চমার্ক সেটে 100টি উত্তরের মধ্যে ভুল তথ্য।
2) অফলাইন (প্রি-প্রোডাকশন) মূল্যায়ন
- গোল্ডেন ডেটাসেট: গ্রাউন্ড-ট্রুথ উত্তর সহ প্রতিনিধি টাস্ক তৈরি করুন।
- সিনথেটিক প্রান্তিক কেস: বৈরী প্রম্পট, প্রম্পট ইনজেকশন, টুলের অপব্যবহার।
- প্রম্পটের জন্য ইউনিট পরীক্ষা: স্ন্যাপশট পরীক্ষা যাতে রিগ্রেশন স্পষ্ট হয়।
- টুল সিমুলেশন: প্যারামিটার যাচাইকরণ এবং পুনরায় চেষ্টাগুলি যাচাই করার জন্য বাহ্যিক সিস্টেমগুলিকে স্টাব করুন।
- নীতি নিরীক্ষণ: আপনার নিজের নিয়মগুলির বিরুদ্ধে রেড-টিম।
- আউটপুট রুব্রিক্স: সঠিকতা, সুর এবং সম্মতির জন্য ধারাবাহিক গ্রেডিং।
স্কোরিং অ্যাপ্রোচ: স্বয়ংক্রিয় মেট্রিক (স্কিমা বৈধতা, PII উপস্থিতি) এবং LLM-কে বিচারক হিসাবে ব্যবহারের মিশ্রণ করুন, শুধুমাত্র যেখানে ক্যালিব্রেট করা হয়েছে। সবসময় মানুষের সাথে স্পট-চেক করুন যতক্ষণ না পর্যন্ত চুক্তি উচ্চ হয়।
3) অনলাইন (পোস্ট-লঞ্চ) মূল্যায়ন
- শ্যাডো মোড: এজেন্ট ড্রাফট করে; মানুষ সিদ্ধান্ত নেয়। ডেল্টা তুলনা করুন।
- A/B পরীক্ষা: গার্ডরেল ভেরিয়েন্ট (কঠোর বনাম অনুমতিমূলক) এবং প্রম্পট সংস্করণ।
- ইন্টারলিভিং: সূক্ষ্ম জয়গুলি সনাক্ত করতে একটি সেশনের মধ্যে বিকল্প কৌশল।
- ক্যানারি রিলিজ: কঠোর পর্যবেক্ষণের সাথে 1-5% সেশনে রোল আউট করুন।
- ফিডব্যাক ক্যাপচার: থাম্বস আপ/ডাউন, দ্রুত ট্যাগ (ভুল, অফ-ব্র্যান্ড, অনিরাপদ)।
- কাউন্টারফ্যাকচুয়াল লগ: পুনরুৎপাদন করার জন্য ব্যর্থ সেশনের সম্পূর্ণ ট্রেস সংরক্ষণ করুন।
গার্ডরেল ডিজাইন করা যা উৎপাদনশীলতাকে নষ্ট করে না
অতিমাত্রায় করা সহজ। লক্ষ্য হল আনুপাতিক নিয়ন্ত্রণ: যেখানে ঝুঁকি বেশি, সেখানে শক্তিশালী সুরক্ষা, যেখানে কম, সেখানে হালকা স্পর্শ।
- ঝুঁকি-স্তরের টাস্ক: প্রভাব অনুসারে টাস্কগুলিকে শ্রেণীবদ্ধ করুন (যেমন, টিয়ার 3 = সর্বজনীন কনটেন্ট; টিয়ার 1 = তহবিল স্থানান্তর)। টিয়ার বাড়ার সাথে সাথে শক্তিশালী গার্ডরেল প্রয়োগ করুন।
- প্রগতিশীল প্রকাশ: এজেন্ট নির্ভরযোগ্যতা প্রমাণ করার সাথে সাথে আরও বেশি সক্ষমতা আনলক করুন।
- অভিযোজিত থ্রেশহোল্ড: অসঙ্গতি বেড়ে গেলে ফিল্টারগুলি কঠোর করুন; স্থিতিশীল হলে শিথিল করুন।
- স্মার্ট প্রত্যাখ্যান: কঠিন "না" বলার পরিবর্তে বিকল্প দিন।
- ক্যাশিং এবং পুনরুদ্ধার: কর্তৃত্বপূর্ণ পুনরুদ্ধার এবং স্বল্প-মেয়াদী স্মৃতির মাধ্যমে হ্যালুসিনেশন হ্রাস করুন।
- খরচ-সচেতন পরিকল্পনা: ড্রাফটিংয়ের জন্য সস্তা মডেলগুলিকে উৎসাহিত করুন; চূড়ান্তকরণের জন্য উচ্চ-গুণমানের মডেল ব্যবহার করুন।
ডোমেইন অনুসারে বাস্তব উদাহরণ
- গার্ডরেল: জ্ঞান ভাণ্ডার পুনরুদ্ধারের মধ্যে সীমাবদ্ধ করুন; PII রিডাক্ট করুন; আইনি/চিকিৎসা পরামর্শ ব্লক করুন; $50-এর বেশি রিফান্ডের জন্য HITL।
- মূল্যায়ন: সমাধানের হার, প্রথম প্রতিক্রিয়ার সময়, এসকেলেশন হার, নীতি লঙ্ঘনের হার।
- গার্ডরেল: ব্র্যান্ড ভয়েস এবং সম্মতি পাঠ্য প্রয়োগ করুন; প্রেরণ থ্রটল করুন; ডোমেইন অনুমোদিত তালিকা; অপ্ট-আউট সম্মান করুন।
- মূল্যায়ন: উত্তরের হার, যোগ্য মিটিং বুক করা, স্প্যাম অভিযোগ, আনসাবস্ক্রাইব।
- গার্ডরেল: পরীক্ষা পাস না হওয়া পর্যন্ত শুধুমাত্র পড়া; স্যান্ডবক্সযুক্ত সম্পাদন; নির্ভরতা অনুমোদিত তালিকা; লাইসেন্স স্ক্যানার।
- মূল্যায়ন: পরীক্ষার পাসের হার, PR প্রতি পর্যালোচনার মন্তব্য, সুরক্ষা সন্ধান, বিল্ড টাইম।
- গার্ডরেল: প্যারামিটারাইজড কোয়েরি, সারি-স্তরের সুরক্ষা, PII মাস্কিং, সময়-সীমা ফিল্টার।
- মূল্যায়ন: কোয়েরির খরচ, গোল্ড নোটবুকের বিপরীতে সঠিকতা, আউটপুটের পুনঃব্যবহারযোগ্যতা।
প্যাটার্ন যা প্রোডাকশনে কাজ করে
- নীতি হিসাবে সিস্টেম প্রম্পট: এগুলিকে সংক্ষিপ্ত, সংখ্যাযুক্ত এবং পরীক্ষাযোগ্য রাখুন। উদাহরণ: "1) শুধুমাত্র প্রদত্ত সরঞ্জাম ব্যবহার করুন। 2) অভ্যন্তরীণ আইডি কখনই প্রকাশ করবেন না। 3) যদি প্রয়োজনীয়তা অস্পষ্ট হয় তবে একবার স্পষ্টীকরণের জন্য জিজ্ঞাসা করুন।"
- JSON-প্রথম আউটপুট: ব্যর্থ হলে অটো-রিট্রাই সহ ভ্যালিডেটর দ্বারা কঠোর স্কিমা প্রয়োগ করা হয়।
- বাজেট এনভেলপ: ব্যাকঅফ এবং সামারি-অন-এক্সহস্টশন সহ প্রতি-ধাপ এবং প্রতি-পর্বের ক্যাপ।
- ডুয়েল মডেল: দ্রুত মডেল ড্রাফট করে; নির্ভরযোগ্য মডেল যাচাই করে এবং সম্পাদনা করে।
- টুল কল সংশয়বাদ: সম্পাদন করার আগে এজেন্টকে উচ্চ-ঝুঁকির কাজগুলি স্ব-যাচাই করতে বলুন।
- রিপ্লে হার্নেস: প্রতিটি পরিবর্তনের পরে অতীতের ব্যর্থতাগুলি পুনরায় চালান; রিগ্রেশন সমাধান হলেই প্রেরণ করুন।
পুনরুদ্ধার এবং স্মৃতির জন্য গার্ডরেল
- সোর্স-অফ-ট্রুথ নির্বাচন: কাঁচা ওয়েব ফলাফলের চেয়ে কিউরেটেড কর্পোরাকে পছন্দ করুন।
- অ্যাট্রিবিউশন প্রয়োজনীয়তা: এজেন্টকে উৎস উদ্ধৃত করতে বা ট্রেসযোগ্য আইডি সরবরাহ করতে বলুন।
- ফ্রেশনেস উইন্ডো: সময়-সংবেদনশীল উত্তরের জন্য N দিনের মধ্যে আপডেট হওয়া ডকুমেন্টগুলিতে সীমাবদ্ধ করুন।
- মেমরি TTL: বাসি বা অতিরিক্ত ফিট হওয়া আচরণ রোধ করতে সেশন মেমরি অটো-এক্সপায়ার করুন।
- ইনজেকশন প্রতিরোধ: পুনরুদ্ধার করা কনটেন্ট থেকে নির্দেশাবলী সরান; কনটেন্ট সেপারেটর এবং সাইনড কনটেক্সট ব্যবহার করুন।
থামানো ছাড়াই সুরক্ষা পরিমাপ করা
- সুরক্ষা স্কোরকার্ড: সাপ্তাহিক রোলআপ—PII ঘটনা, ব্লক করা কাজ, ওভাররাইড, রিফান্ড রিভার্সাল।
- লক্ষ্য নির্ধারণ: মেট্রিক প্রতি থ্রেশহোল্ড সেট করুন (যেমন, প্রতি 1k সেশনে <0.1% PII লিক)।
- মূল-কারণ পর্যালোচনা: যে কোনও গুরুতর ঘটনার জন্য, প্রম্পট, সরঞ্জাম বা অনুমতি আপডেট করুন—তারপর পুনরায় পরীক্ষা করুন।
- একা তীব্রতার চেয়ে ফলাফলের উপর জোর দিন: বিরল বড় নিষেধাজ্ঞার চেয়ে ছোটখাটো ঘন ঘন পরিবর্তনকে পছন্দ করুন।
সরঞ্জাম পরামর্শ (তৈরি বনাম কেনা)
- কোড হিসাবে নীতি: নিয়মের জন্য কনফিগারেশন ফাইল ব্যবহার করুন যাতে আপনি সংস্করণ, পর্যালোচনা এবং রোল ব্যাক করতে পারেন।
- যাচাইকরণ স্তর: JSON স্কিমা ভ্যালিডেটর, টাইপ গার্ড এবং সরঞ্জামগুলির জন্য চুক্তি পরীক্ষা।
- সুরক্ষা শ্রেণীবদ্ধকারী: PII এবং বিষাক্ততার জন্য হালকা পাঠ্য শ্রেণীবদ্ধকারী; নিয়মের তালিকার সাথে একত্রিত করুন।
- ট্রেসিং এবং বিশ্লেষণ: স্প্যান, ত্রুটি, খরচ এবং ব্যবহারকারীর প্রতিক্রিয়া কেন্দ্রীভূত করুন।
- মূল্যায়ন হার্নেস: ড্যাশবোর্ড এবং ডিফিংসহ গোল্ডেন সেটের জন্য ব্যাচ রানার।
- HITL কনসোল: সারি, অনুমোদন এবং রুব্রিক্স সহ টীকা।
নোট করার মতো: আপনি যদি প্রোটোটাইপিং করেন এবং এজেন্টদের স্পিন আপ করার, গার্ডরেল প্রয়োগ করার এবং ট্রেস পর্যালোচনা করার জন্য একটি জায়গা চান, তাহলে Sider.AI ওয়ার্কফ্লোকে সুগম করতে পারে। প্রসঙ্গত, দলগুলি সরঞ্জাম অনুমতি কনফিগার করতে, বাজেট ক্যাপ সেট করতে, ধাপে ধাপে যুক্তির ট্রেস পরিদর্শন করতে এবং পাশাপাশি মূল্যায়ন চালাতে এটি ব্যবহার করে, যা নিরাপদ-লঞ্চের সময় কমিয়ে দেয়। এই সপ্তাহে গার্ডরেল সেট করার জন্য একটি ধাপে ধাপে টেমপ্লেট
1-2 দিন: সুযোগ এবং নীতি
- এজেন্টের মিশন এবং অ-লক্ষ্য লিখুন।
- 8-12টি গার্ডরেল নিয়ম খসড়া করুন; সরঞ্জাম এবং প্রম্পটের সাথে ম্যাপ করুন।
- ঝুঁকির স্তর এবং HITL সীমা নির্ধারণ করুন।
3-4 দিন: নিয়ন্ত্রণ প্রয়োগ করুন
- ডেটা ফিল্টারিং এবং রিডাকশন যুক্ত করুন।
- টুল ইনপুট/আউটপুটের জন্য JSON স্কিমা এনকোড করুন।
- বাজেট ক্যাপ এবং সার্কিট-ব্রেকার যুক্ত করুন।
- সুরক্ষা এবং ব্র্যান্ড স্টাইল চেক সংহত করুন।
5 দিন: পর্যবেক্ষণযোগ্যতা এবং পরীক্ষা
- ট্রেসিং এবং খরচ ড্যাশবোর্ড চালু করুন।
- প্রান্তিক কেস সহ 100-300 আইটেমের একটি গোল্ডেন সেট তৈরি করুন।
- বৈরী পরীক্ষা চালান; লঙ্ঘন সংশোধন করুন।
2 সপ্তাহ: পাইলট
- ফিডব্যাক সংগ্রহ করুন; কঠোর বনাম আলগা ফিল্টারগুলির A/B পরীক্ষা করুন।
- প্রম্পট, থ্রেশহোল্ড এবং HITL রুট টিউন করুন।
- ক্যানারি রোলআউটে প্রসারিত করুন।
এড়াতে সাধারণ অ্যান্টি-প্যাটার্ন
- অতিরিক্ত দীর্ঘ সিস্টেম প্রম্পট যা মূল নিয়মগুলিকে চাপা দেয়।
- সীমাহীন সরঞ্জাম অনুমতি ("* যে কোনও কিছু কল করতে পারে")।
- লগে কাঁচা PII সংরক্ষণ করা।
- ক্যালিব্রেশন ছাড়াই সম্পূর্ণরূপে "LLM-কে বিচারক" হিসাবে ব্যবহারের উপর নির্ভর করা।
- ঝুঁকিপূর্ণ কাজের জন্য কোনও গোল্ডেন সেট কভারেজ নেই।
- ঘটনার প্লেবুক ছাড়া প্রেরণ করা।
দ্রুত রেফারেন্স: নমুনা গার্ডরেল নীতি
উদ্দেশ্য: বিলিং প্রশ্নের জন্য গ্রাহক সমর্থন বিচ্যুতি।
অ-লক্ষ্য: আইনি, চিকিৎসা বা HR পরামর্শ।
নিয়ম:
- শুধুমাত্র KB এবং বিলিং API ব্যবহার করুন; কাঁচা ব্যবহারকারী টেবিল কখনই কোয়েরি করবেন না।
- প্রকাশ্যে অনুরোধ করা হলে অ্যাকাউন্ট আইডির শেষ 4টি সংখ্যা ব্যতীত আউটপুটে সমস্ত PII রিডাক্ট করুন।
- $50-এর বেশি রিফান্ডের জন্য মানুষের অনুমোদনের প্রয়োজন।
- অভ্যন্তরীণ টিকিট আইডি কখনই প্রকাশ করবেন না।
- যদি অনিশ্চিত হন, উত্তর দেওয়ার আগে একটি স্পষ্টীকরণ প্রশ্ন জিজ্ঞাসা করুন।
- নীতির উত্তরের জন্য KB আর্টিকেলের আইডি উল্লেখ করুন।
- 3টি সরঞ্জাম কলের পরে বন্ধ করুন; সমাধান না হলে সংক্ষিপ্তসার করুন এবং বৃদ্ধি করুন।
- যদি সুরক্ষা বা সম্মতি ফিল্টার ট্রিগার করে তবে বাতিল করুন।
মেট্রিক: সমাধানের হার ≥ 75%, নীতি লঙ্ঘন ≤ 0.1%/1k সেশন, গড় খরচ ≤ প্রতি সমাধান করা টিকিটে $0.08।
একসাথে আনা: নিয়ন্ত্রণ, আত্মবিশ্বাস এবং ক্রমাগত শিক্ষা
মহান AI এজেন্টরা শুধু স্মার্ট নয়—তারা অনুমানযোগ্য। আপনি যখন AI এজেন্টদের জন্য গার্ডরেল সেট করেন এবং পারফরম্যান্স মূল্যায়ন করেন, তখন আপনি একটি শক্ত লুপ তৈরি করেন: সীমা নির্ধারণ করুন, ফলাফল পরিমাপ করুন, শিখুন এবং পুনরায় স্থাপন করুন। আপনি দ্রুত এগিয়ে যাবেন কারণ আপনি সতর্কতামূলক টেপ নয়, আত্মবিশ্বাসের সাথে প্রেরণ করেন।
পরবর্তী পদক্ষেপ:
- আজই একটি নীতি-হিসাবে-কোড ফাইল শুরু করুন; এটিকে 200 লাইনের নিচে রাখুন।
- 30টি বৈরী প্রম্পট সহ আপনার প্রথম 150-কেসের গোল্ডেন সেট তৈরি করুন।
- আপনার পরবর্তী রিলিজের আগে বাজেট ক্যাপ এবং সরঞ্জাম স্কিমা যুক্ত করুন।
- শ্যাডো মোড এবং একটি সুস্পষ্ট A/B হাইপোথিসিসের সাথে পাইলট করুন।
- সাপ্তাহিকভাবে সুরক্ষা স্কোরকার্ড পর্যালোচনা করুন এবং মেট্রিক স্থিতিশীল হওয়ার সাথে সাথে ম্যানুয়াল চেকগুলি বন্ধ করুন।
মূল বিষয়:
- লেয়ার গার্ডরেল: নীতি → অনুমতি → ডেটা → সরঞ্জাম → ফিল্টার → HITL → পর্যবেক্ষণযোগ্যতা।
- যা গুরুত্বপূর্ণ তা পরিমাপ করুন: সাফল্য, সুরক্ষা, খরচ, লেটেন্সি এবং অভিজ্ঞতা।
- ঝুঁকির স্তর এবং প্রগতিশীল ক্ষমতার সাথে সুরক্ষা এবং গতির ভারসাম্য বজায় রাখুন।
- মূল্যায়নকে ক্রমাগত হিসাবে বিবেচনা করুন—গেট হিসাবে নয়, একটি ফিডব্যাক ইঞ্জিন হিসাবে।
FAQ
প্রশ্ন 1: AI এজেন্টদের জন্য সবচেয়ে গুরুত্বপূর্ণ গার্ডরেলগুলি কী কী?
স্পষ্ট নীতি নিয়ম, সর্বনিম্ন সুযোগের সরঞ্জাম অনুমতি, PII রিডাকশন, বাজেট ক্যাপ এবং সুরক্ষা ফিল্টার দিয়ে শুরু করুন। উচ্চ-ঝুঁকির কাজের জন্য মানুষ-ইন-দ্য-লুপ অনুমোদন এবং সমস্যাগুলি দ্রুত সনাক্ত করার জন্য সম্পূর্ণ পর্যবেক্ষণযোগ্যতা যুক্ত করুন।
প্রশ্ন 2: আপনি কিভাবে AI এজেন্টের কর্মক্ষমতা কার্যকরভাবে মূল্যায়ন করবেন?
অনলাইন A/B পরীক্ষা এবং শ্যাডো মোডের সাথে অফলাইন গোল্ডেন ডেটাসেট এবং বৈরী পরীক্ষা একত্রিত করুন। একটি সম্পূর্ণ দৃশ্যের জন্য টাস্ক সাফল্য, সুরক্ষা লঙ্ঘন, টাস্ক প্রতি খরচ, লেটেন্সি এবং ব্যবহারকারীর প্রতিক্রিয়া ট্র্যাক করুন।
প্রশ্ন 3: আমি কিভাবে AI এজেন্টদের হ্যালুসিনেট করা থেকে আটকাতে পারি?
কিউরেটেড উৎস থেকে পুনরুদ্ধার ব্যবহার করুন, উদ্ধৃতিগুলির প্রয়োজন করুন এবং স্ব-চেক বা যাচাইকারী মডেল প্রয়োগ করুন। আত্মবিশ্বাস কম হলে স্কিমা বৈধতা এবং রক্ষণশীল ডিফল্ট সেট করুন।
প্রশ্ন 4: কখন একজন মানুষের AI এজেন্টের কাজ পর্যালোচনা করা উচিত?
উচ্চ-ঝুঁকির কাজ—তহবিল স্থানান্তর, নীতি ব্যতিক্রম, সংবেদনশীল যোগাযোগ—মানুষের অনুমোদনের জন্য রুট করুন। মেট্রিক স্থিতিশীল হওয়ার সাথে সাথে আপনি সময়ের সাথে সাথে থ্রেশহোল্ড শিথিল করতে পারেন।
প্রশ্ন 5: গার্ডরেল সেট করতে এবং এজেন্টদের নিরীক্ষণ করতে কোন সরঞ্জামগুলি সাহায্য করে?
আপনার নীতি-হিসাবে-কোড কনফিগারেশন, স্কিমা ভ্যালিডেটর, সুরক্ষা শ্রেণীবদ্ধকারী এবং ট্রেসিং ড্যাশবোর্ডের প্রয়োজন হবে। Sider.AI-এর মতো প্ল্যাটফর্মগুলি নিরাপদ স্থাপনাকে দ্রুত করার জন্য অনুমতি, বাজেট ক্যাপ এবং ধাপে ধাপে ট্রেস কেন্দ্রীভূত করতে পারে।