একটি গুরুত্বপূর্ণ বাস্তবতা: AI এজেন্টরা মডেলের কারণে ব্যর্থ হয় না—তারা নির্দেশের কারণে ব্যর্থ হয়।
বেশিরভাগ এন্টারপ্রাইজ AI উদ্যোগ মডেলের নির্ভুলতার উপর ভিত্তি করে হোঁচট খায় না। তারা আপনার ব্যবসার লজিক এবং মডেলের মধ্যে অদৃশ্য স্তরের নির্দেশের উপর ভিত্তি করে হোঁচট খায়। যদি আপনার AI এজেন্ট একজন নির্ভরযোগ্য সহকর্মীর পরিবর্তে একজন বিভ্রান্ত ইন্টার্নের মতো আচরণ করে, তাহলে সাধারণত দোষ “GPT খারাপ” এমনটা নয়। প্রায় সবসময়ই অস্পষ্ট, ভঙ্গুর বা অসম্পূর্ণ নির্দেশ এর কারণ হয়।
এই নির্দেশিকা এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলী ডিজাইন করার জন্য সেরা ১০টি পদ্ধতি উল্লেখ করে। আমরা একটি বাস্তব এবং সরাসরি পদ্ধতি গ্রহণ করব: বাস্তবসম্মত প্যাটার্ন, উদাহরণ, চেকলিস্ট এবং এড়ানো উচিত এমন বিষয়। আপনি মাল্টি-এজেন্ট ওয়ার্কফ্লো বা একক টাস্ক-নির্দিষ্ট এজেন্ট পরিচালনা করুন না কেন, আপনি কীভাবে অস্পষ্ট প্রম্পটগুলোকে টেকসই, নিরীক্ষণযোগ্য এবং মাপযোগ্য নির্দেশ সিস্টেমে পরিণত করতে হয় তা শিখতে পারবেন।
আমরা মূল কীওয়ার্ড—এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলী ডিজাইন করার জন্য সেরা পদ্ধতি—ব্যবহার করব স্বাভাবিকভাবে এবং প্রায়শই, এন্টারপ্রাইজ AI এজেন্ট ডিজাইন, AI এজেন্টদের জন্য নির্দেশ ফ্রেমওয়ার্ক এবং এন্টারপ্রাইজগুলিতে প্রম্পট গভর্নেন্স-এর মতো দীর্ঘ-লেজযুক্ত ভিন্নতা সহ, যা দলগুলি আসলে কীভাবে সমাধানগুলি অনুসন্ধান করে এবং মূল্যায়ন করে তার সাথে মেলে।
এন্টারপ্রাইজ AI নির্দেশাবলীকে কী ভিন্ন করে তোলে?
ভোক্তাদের প্রম্পটগুলি হল এককালীন। এন্টারপ্রাইজ AI এজেন্ট নির্দেশাবলী হল:
- স্টেকহোল্ডার-সমৃদ্ধ: আইনি, নিরাপত্তা, ঝুঁকি, কার্যক্রম, পণ্য এবং ডেটা দলগুলির সকলেরই বলার কিছু আছে।
- উচ্চ-ঝুঁকির: আউটপুট গ্রাহক, আয় এবং সম্মতির উপর প্রভাব ফেলে।
- পুনরাবৃত্তিযোগ্য: আপনার হাজার হাজার রান এবং ব্যবহারকারীদের মধ্যে সামঞ্জস্যপূর্ণ আচরণের প্রয়োজন।
- নিরীক্ষণযোগ্য: এজেন্ট কেন কী করেছে এবং কোন সুরক্ষা ব্যবস্থার মাধ্যমে করেছে, তা আপনাকে দেখাতে হবে।
এজন্য এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলী ডিজাইন করার জন্য সেরা পদ্ধতিগুলি স্পষ্টতা, মডুলারিটি, গভর্নেন্স এবং মূল্যায়নের উপর কেন্দ্র করে—কোনও চতুর শব্দ ব্যবহারের উপর নয়।
সেরা ১০টি পদ্ধতি (উদাহরণসহ)
১) নীতিকে কাজ থেকে আলাদা করুন: আপনার নির্দেশ স্ট্যাককে মডুলারাইজ করুন
সবকিছু একটি মেগা প্রম্পটে ঠাসাঠাসি করবেন না। নির্দেশাবলীকে স্তরে বিভক্ত করুন:
- সিস্টেম নীতি (সবসময় চালু): সুর, সম্মতি, নিরাপত্তা, PII হ্যান্ডলিং, ব্র্যান্ডের কণ্ঠস্বর।
- ভূমিকা/ব্যক্তিত্ব: এজেন্টের কাজ (যেমন, “আপনি Tier-2 সমস্যাগুলির জন্য একজন এন্টারপ্রাইজ সহায়তা বিশেষজ্ঞ”)।
- টাস্ক টেমপ্লেট: ইনপুট/আউটপুট সহ নির্দিষ্ট কাজের ধরণ।
- প্রসঙ্গ/সরঞ্জাম: তথ্যভিত্তিক সম্পদ, RAG স্নিপেট, স্কিমা সহ API।
- আউটপুট চুক্তি: সঠিক বিন্যাস, ক্ষেত্র, স্কিমা এবং বৈধতা নিয়ম।
উদাহরণস্বরূপ প্যাটার্ন:
- সিস্টেম: “SOC 2 সীমাবদ্ধতা অনুসরণ করুন। অভ্যন্তরীণ URL কখনই প্রকাশ করবেন না। উৎসের উল্লেখ করুন। নিশ্চিত না হলে, ঊর্ধ্বতন কর্তৃপক্ষের কাছে জানান।”
- ভূমিকা: “আপনি একজন ভেন্ডর রিস্ক বিশ্লেষক।”
- কাজ: “সরবরাহকৃত নথি ব্যবহার করে ভেন্ডরের নিরাপত্তা অবস্থান সংক্ষেপে তুলে ধরুন।”
- সরঞ্জাম: “PDF-এর জন্য ‘DocSearch’ এবং রেড ফ্ল্যাগের জন্য ‘PolicyCheck’ ব্যবহার করুন।”
- আউটপুট: “JSON রিটার্ন করুন: {risk_level, reasons[], unresolved_questions[]}”
এটি কেন কাজ করে: আপনি টাস্ক পরিবর্তন না করে নীতি আপডেট করতে পারেন এবং গভর্নেন্স স্পর্শ না করে নতুন টাস্ক যোগ করতে পারেন। এই মডুলারিটি AI এজেন্টদের জন্য নির্দেশ ফ্রেমওয়ার্কের ভিত্তি।
২) ভাইব নয়, সীমাবদ্ধতার প্রতি মনোযোগ দিন: যাচাইযোগ্য আউটপুট নির্দিষ্ট করুন
এন্টারপ্রাইজ AI এজেন্ট ডিজাইনে, বাগ্মিতা থেকে যাচাইযোগ্যতা উত্তম। স্কিমা, উদাহরণ এবং বৈধতা প্রদান করুন:
- JSON স্কিমা বা কঠোরভাবে টাইপ করা আউটপুট সংজ্ঞায়িত করুন।
- অন্তত একটি ইতিবাচক এবং একটি নেতিবাচক উদাহরণ দেখান।
- সঠিক গ্রহণের মানদণ্ড অন্তর্ভুক্ত করুন।
ভাল: “পতাকাঙ্কিত দাবিগুলির একটি JSON অ্যারে ফেরত দিন। প্রতিটি আইটেমের মধ্যে অন্তর্ভুক্ত থাকতে হবে: {claim_text, evidence_citations[], rule_id}। Evidence_citations-এ অবশ্যই document_id এবং পৃষ্ঠার রেফারেন্স থাকতে হবে।”
খারাপ: “কঠোর এবং পুঙ্খানুপুঙ্খ হোন।”
আপনার এজেন্ট গ্রাফে একটি ভ্যালিডেটর ধাপ যুক্ত করুন। যদি স্কিমা বৈধতা ব্যর্থ হয়, তাহলে একই প্রেক্ষাপট ব্যবহার করে স্বয়ংক্রিয়ভাবে প্রতিক্রিয়াটি পুনরায় লিখুন।
৩) অনুমানের চেয়ে বাস্তব ভিত্তি উত্তম: সর্বদা নির্দেশের সাথে প্রসঙ্গ যুক্ত করুন
এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলী ডিজাইন করার জন্য সেরা পদ্ধতির জন্য প্রসঙ্গ আবদ্ধ করা প্রয়োজন:
- RAG: সবচেয়ে প্রাসঙ্গিক, নকল-মুক্ত এবং সাম্প্রতিক স্নিপেটগুলি ফিড করুন।
- সরঞ্জামের বিবরণ: ক্ষমতা এবং সীমা নথিভুক্ত করুন (“সরঞ্জাম ISO-8601 টাইমস্ট্যাম্প প্রদান করে; সর্বোচ্চ 100টি রেকর্ড”)।
- উৎস পছন্দ: “পাবলিক ওয়েব ডেটার চেয়ে অভ্যন্তরীণ নীতিকে বেশি গুরুত্ব দিন।”
একটি “কোনো হ্যালুসিনেশন নয়” ফলব্যাক অন্তর্ভুক্ত করুন: “যদি প্রসঙ্গ অপর্যাপ্ত হয়, তাহলে {'status': 'needs_more_context', 'missing': [list]} ফেরত দিন।” এটি অনিশ্চয়তাকে সুস্পষ্ট এবং নিরীক্ষণযোগ্য করে তোলে।
৪) আপস্কেলেশনকে প্রথম শ্রেণির আচরণ করুন
বাস্তব এজেন্টদের ধোঁকা দেওয়া উচিত নয়। নির্দেশের মধ্যে আপস্কেলেশন নিয়ম তৈরি করুন:
- থ্রেশহোল্ড: “যদি আত্মবিশ্বাস < 0.7 হয়, তাহলে মানুষের কাছে আপস্কেল করুন।”
- ট্রিগার: “যদি অনুমোদিত ডোমেনের বাইরে PII-এর সম্মুখীন হন, তাহলে থামুন এবং নিরাপত্তা বিভাগকে জানান।”
- চ্যানেল: টেমপ্লেট X সহ ‘CreateTicket’ সরঞ্জাম ব্যবহার করুন।”
আউটপুট চুক্তিতে আপস্কেলেশন নথিভুক্ত করুন: action: {'type': 'complete' | 'escalate', 'reason': string}-এর মতো একটি ক্ষেত্র অন্তর্ভুক্ত করুন।
৫) এজেন্টকে ধাপে ধাপে চিন্তা করতে শেখান: লিক করা ছাড়া কাঠামোবদ্ধ যুক্তি
চেইন-অফ-থট শক্তিশালী কিন্তু সংবেদনশীল। বিস্তারিত লুকানো যুক্তির পরিবর্তে, ধাপ পরিকল্পনা এবং চেকলিস্ট দিয়ে মডেলটিকে পরিচালনা করুন:
- “3টি ধাপে আপনার পদ্ধতির পরিকল্পনা করুন: ইনপুট সনাক্ত করুন → নিয়ম প্রয়োগ করুন → আউটপুট স্কিমা তৈরি করুন।”
- “অন্তর্বর্তী কাজের জন্য ‘স্ক্র্যাচপ্যাড’ ক্ষেত্র ব্যবহার করুন। চূড়ান্ত আউটপুটে স্ক্র্যাচপ্যাড অন্তর্ভুক্ত করবেন না।”
- “চূড়ান্ত করার আগে গ্রহণের মানদণ্ডের বিপরীতে একটি স্ব-চেক চালান।”
এই পদ্ধতি সংবেদনশীল অভ্যন্তরীণ বিষয়গুলি শেষ ব্যবহারকারীদের কাছে প্রকাশ না করে যুক্তিকে কাঠামোবদ্ধ রাখে।
৬) অনুস্মারক নয়, নিয়ম হিসাবে সুরক্ষা বেড়া এনকোড করুন
“গোপন প্রকাশ করবেন না” এর মতো অনুস্মারকগুলি দুর্বল। এগুলিকে প্রয়োগযোগ্য নিয়মে রূপান্তর করুন:
- রিডাকশন নিয়ম: “ইমেলগুলিকে [email] এবং অ্যাকাউন্ট নম্বরগুলিকে [acct#xxxx] হিসাবে মাস্ক করুন।”
- কালো তালিকা/সাদা তালিকা: “অনুমোদিত ডোমেন: *.company.com; সর্বজনীন পেস্ট সাইটগুলি ব্লক করুন।”
- হার/ভলিউম সীমা: “প্রতি মিনিটে সর্বোচ্চ ৩টি API কল; 429 এ বাতিল করুন।”
আপনার নির্দেশের পাঠ্য নিয়ম ঘোষণা করা উচিত; আপনার রানটাইম এটি প্রয়োগ করা উচিত। এজেন্টকে একটি নীতি ক্লায়েন্টের মতো আচরণ করুন, নীতির মতো নয়।
৭) শ্রোতা অনুসারে সুর এবং সম্মতি স্থানীয়করণ করুন
এন্টারপ্রাইজ এজেন্টরা প্রায়শই একাধিক জিও এবং ভূমিকাকে পরিষেবা দেয়। সুর, লোকেল এবং নিয়ন্ত্রণ সেট প্যারামিটারাইজ করুন:
- সুর: “অর্থের জন্য আনুষ্ঠানিক সুর ব্যবহার করুন; অভ্যন্তরীণ আইটির জন্য কথোপকথনমূলক।”
- লোকেল: “EMEA-এর জন্য UK বানান এবং £ ব্যবহার করুন; US-এর জন্য en-US এবং $ ব্যবহার করুন।”
- রেগস: “যদি অঞ্চলটি ‘EU’ হয়, তাহলে GDPR ডেটা কমানোর নিয়ম প্রয়োগ করুন।”
এই প্যারামিটারগুলিকে নির্দেশের শীর্ষকের অংশ করুন যাতে কল করার সময় সেগুলি পরিবর্তন করা যায়।
৮) প্রথম দিন থেকেই মূল্যায়নের জন্য ডিজাইন করুন
আপনি যা পরিমাপ করতে পারবেন না, তা উন্নত করতে পারবেন না। নির্দেশের মধ্যে মূল্যায়ন হুক তৈরি করুন:
- স্ব-গ্রেডিং রুব্রিক: “মানদণ্ড A–D এর বিপরীতে আপনার আউটপুটকে রেট দিন; মানদণ্ড প্রতি 0–1 স্কোর অন্তর্ভুক্ত করুন।”
- দাবি: “সমস্ত উদ্ধৃতি অবশ্যই সরবরাহকৃত উৎসের সাথে ম্যাপ করতে হবে।”
- গোল্ডেন সেট: প্রান্তিক কেস সহ টাস্ক-নির্দিষ্ট পরীক্ষার কেস বজায় রাখুন।
প্রি-ডিপ্লয়মেন্ট অফলাইন ইভাল এবং পোস্ট-ডিপ্লয়মেন্ট শ্যাডো টেস্টিং চালান। ট্র্যাক ড্রিফট: যখন একটি নতুন মডেল বা নীতি পরিবর্তন হয়, তখন ইভালগুলি পুনরায় চালান এবং তুলনা করুন।
৯) পরিবর্তন লগ এবং সংস্করণ সহ নথিভুক্ত করুন
নির্দেশ আপডেটগুলিকে কোডের মতো আচরণ করুন:
- প্রতিটি নির্দেশ মডিউল সংস্করণ করুন (নীতি v1.3, টাস্ক টেমপ্লেট v2.1)।
- পার্থক্য এবং যুক্তি রাখুন: “v2.1: PII হ্যান্ডলিং কঠোর করা হয়েছে; UK লোকেল অপশন যোগ করা হয়েছে।”
- উত্পাদনে সংস্করণ পিন করুন; শুধুমাত্র নিয়ন্ত্রিত রিলিজের মাধ্যমে রোল ফরোয়ার্ড করুন।
এটি নিরীক্ষণযোগ্যতা এবং রোলব্যাক নিরাপত্তার জন্য গুরুত্বপূর্ণ।
১০) প্রত্যাখ্যান, অনিশ্চয়তা এবং সীমানা শেখান
নম্র প্রত্যাখ্যান বিশ্বাস তৈরি করে। সুস্পষ্ট প্রত্যাখ্যান প্যাটার্ন অন্তর্ভুক্ত করুন:
- “যদি কোনও সমর্থিত নয় এমন কাজ করার জন্য বলা হয়, তাহলে একটি সংক্ষিপ্ত প্রত্যাখ্যানের সাথে প্রতিক্রিয়া জানান এবং একটি সমর্থিত বিকল্প প্রস্তাব করুন।”
- “যদি তথ্যের অভাব হয়, তাহলে একটি কাঠামোবদ্ধ ‘needs_more_context’ প্রতিক্রিয়া ফেরত দিন।”
- “যদি নৈতিক বা সম্মতির দ্বন্দ্ব দেখা দেয়, তাহলে থামুন এবং নিয়ম উল্লেখ করুন।”
এটি এজেন্টদের অতিরিক্ত প্রতিশ্রুতি এড়াতে এবং ফলাফল অনুমানযোগ্য রাখতে সাহায্য করে।
নির্দেশ প্যাটার্ন যা আপনি অনুলিপি করতে পারেন
এন্টারপ্রাইজ AI এজেন্ট ডিজাইনকে দ্রুত করার জন্য এই প্লাগ-এন্ড-প্লে প্যাটার্নগুলি ব্যবহার করুন।
নীতি ব্যানার (সবসময় চালু)
“আপনাকে অবশ্যই কোম্পানির নিরাপত্তা এবং গোপনীয়তা নীতি অনুসরণ করতে হবে। আউটপুটে কখনই গোপন, API কী বা অভ্যন্তরীণ URL অন্তর্ভুক্ত করবেন না। ইমেলগুলিকে [email] হিসাবে সংশোধন করুন। নিশ্চিত না হলে, স্পষ্টীকরণের জন্য জিজ্ঞাসা করুন। CreateTicket(severity='high') এর মাধ্যমে PII লঙ্ঘন বৃদ্ধি করুন। উৎসগুলিকে (doc_id:page) হিসাবে উল্লেখ করুন। সর্বজনীন উৎসের চেয়ে অভ্যন্তরীণ প্রসঙ্গকে পছন্দ করুন।”
আউটপুট চুক্তি
“এই স্কিমার সাথে কঠোরভাবে বৈধ JSON ফেরত দিন:
{
"summary": string,
"citations": [{"doc_id": string, "page": number}],
"risk_level": "low" | "medium" | "high",
"unresolved_questions": string[]
}
যদি বৈধতা ব্যর্থ হয়, তাহলে মেরামত করুন এবং 2 বার পর্যন্ত পুনরায় চেষ্টা করুন।”
সরঞ্জাম সনদ
“উপলব্ধ সরঞ্জাম:
- DocSearch(query): {doc_id, page, snippet} ফেরত দেয়
- PolicyCheck(text): {flags: [{rule_id, severity, excerpt}]} ফেরত দেয়
প্রয়োজনে শুধুমাত্র সরঞ্জাম কল করুন। হারের সীমা সম্মান করুন (3 কল/মিনিট)।
যুক্তি চেকলিস্ট
“উত্তর দেওয়ার আগে:
- ব্যবহারকারীর উদ্দেশ্য সনাক্ত করুন।
- প্রাসঙ্গিক নথি নির্বাচন করুন।
- তথ্য বের করুন এবং উল্লেখ করুন।
- গ্রহণের মানদণ্ডের বিপরীতে স্ব-চেক করুন।”
এন্টি-প্যাটার্ন যা এন্টারপ্রাইজ এজেন্টদের ভেঙে দেয়
- একটি বিশাল প্রম্পট যা সবকিছু করার চেষ্টা করে।
- উৎস পছন্দ বা বিশ্বাস স্তর ছাড়া সীমাহীন ব্রাউজিং।
- অ-নিয়ন্ত্রিত বিন্যাস (“আপনার নিজের ভাষায় একটি সারসংক্ষেপ”)।
- টাস্ক টেক্সটে লুকানো নীতি (নিরীক্ষণ বা আপডেট করা অসম্ভব)।
- কোনো আপস্কেলেশন বা প্রত্যাখ্যান আচরণ নেই।
- স্থানীয়করণ এবং ভূমিকা-ভিত্তিক সুর উপেক্ষা করা।
- শূন্য মূল্যায়ন জোতা; উপাখ্যানের উপর নির্ভর করা।
এগুলি এড়িয়ে চলুন এবং আপনার AI এজেন্টগুলি উত্পাদনে আরও অনুমানযোগ্য এবং নিয়ন্ত্রণযোগ্য হয়ে উঠবে।
মাল্টি-এজেন্ট বিবেচনা: যখন একজন এজেন্ট অনেক হয়ে যায়
এন্টারপ্রাইজগুলি প্রসারিত হওয়ার সাথে সাথে কাজগুলি বিশেষায়িত এজেন্টদের মধ্যে বিভক্ত হয়ে যায়:
- ইনজেকশন এজেন্ট: নথি এবং মেটাডেটা স্বাভাবিক করে।
- পুনরুদ্ধার এজেন্ট: ক্যোয়ারী অপ্টিমাইজ করে এবং ফলাফল ডি-ডুপ্লিকেট করে।
- যুক্তি এজেন্ট: সংশ্লেষণ করে এবং উল্লেখ করে।
- সম্মতি এজেন্ট: নিয়ম পরীক্ষা এবং সংশোধন চালায়।
- অর্কেস্ট্রেটর: হস্তান্তর পরিচালনা করে এবং দ্বন্দ্ব সমাধান করে।
এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলী ডিজাইন করার জন্য সেরা পদ্ধতি অর্কেস্ট্রেশনে প্রসারিত:
- সমস্ত এজেন্টের জন্য শেয়ার্ড নীতি স্তর।
- কঠোর ইনপুট/আউটপুট সহ এজেন্ট-নির্দিষ্ট টাস্ক টেমপ্লেট।
- হস্তান্তর চুক্তি: পরবর্তী এজেন্টের কাছে পাঠানোর আগে কী সত্য হতে হবে।
- দ্বন্দ্ব নিরসন: যদি সম্মতি ভেটো দেয়, অর্কেস্ট্রেটর কারণ কোড সহ আপস্কেলেশন ফেরত দেয়।
গভর্নেন্স: প্রম্পটকে একটি পরিচালিত সম্পদে পরিণত করা
নির্দেশ গভর্নেন্স মডেল গভর্নেন্সের মতোই গুরুত্বপূর্ণ।
- মালিকানা: নীতি, টাস্ক টেমপ্লেট এবং সরঞ্জামগুলির জন্য DRI নির্ধারণ করুন।
- অ্যাক্সেস কন্ট্রোল: কে উত্পাদন নির্দেশাবলী সম্পাদনা করতে পারে?
- অনুমোদন কর্মপ্রবাহ: পরিবর্তনের আগে আইনি/সুরক্ষা/সম্মতি থেকে পর্যালোচনা।
- টেলিমেট্রি: ইনপুট, আউটপুট, সরঞ্জাম কল এবং সংস্করণ লগ করুন (গোপনীয়তা এবং হ্রাস সম্মান করুন)।
উপলক্ষ্যে: এটা উল্লেখ করার মতো যে সংস্করণ, পুনরায় ব্যবহারযোগ্য ব্লক এবং মূল্যায়ন হুক সহ একটি নির্দেশ রেজিস্ট্রি গ্রহণকারী দলগুলি নাটকীয়ভাবে সমস্যা সমাধানের সময় কমিয়ে দেয়। Sider.AI-এর মতো প্ল্যাটফর্মগুলি দলগুলিকে মডুলার নির্দেশাবলী তৈরি করতে, স্কিমা ভ্যালিডেটর সংযুক্ত করতে, গোল্ডেন সেটের বিপরীতে ইভাল চালাতে এবং এজেন্ট জুড়ে নিরাপদে পরিবর্তনগুলি রোল আউট করতে সহায়তা করতে পারে। এটি “প্রম্পট স্প্রল” হ্রাস করে যা প্রায়শই এন্টারপ্রাইজ স্থাপনাগুলিকে লাইনচ্যুত করে। উদাহরণ: অস্পষ্ট থেকে উত্পাদন-গ্রেড
দৃশ্য: চালান শ্রেণীবদ্ধ করতে এবং অসঙ্গতিগুলি পতাকাঙ্কিত করতে ফিনান্স অপস এজেন্ট।
অস্পষ্ট v0:
“আপনি সহায়ক। চালান পড়ুন এবং শ্রেণীবদ্ধ করুন। যেকোনো অদ্ভুত জিনিস পতাকাঙ্কিত করুন। সংক্ষিপ্ত হোন।”
উত্পাদন-গ্রেড v1:
- নীতি: “কোম্পানির গোপনীয়তা নীতি অনুসরণ করুন। অ্যাকাউন্ট নম্বরগুলিকে [acct#xxxx] হিসাবে সংশোধন করুন। মান উদ্ভাবন করবেন না।”
- ভূমিকা: “আপনি একজন ফিনান্স অপস চালান শ্রেণীবদ্ধকারী।”
- টাস্ক: “সরবরাহকারী, তারিখ (ISO-8601), পরিমাণ (সংখ্যাসূচক), মুদ্রা (ISO 4217), line_items[] বের করুন। RuleSet v3 অনুসারে অসঙ্গতিগুলি পতাকাঙ্কিত করুন।”
- সরঞ্জাম: “OCR(image|pdf) → text; FXRates(date,currency) → rate।”
- আউটপুট: ক্ষেত্র এবং প্রকার সহ JSON স্কিমা; অসঙ্গতিগুলি অন্তর্ভুক্ত করুন: [{rule_id, description, evidence_page}]।
- আপস্কেলেশন: “যদি OCR আত্মবিশ্বাস < 0.85 বা অনুপস্থিত মুদ্রা হয়, তাহলে action='escalate', reason।”
- মূল্যায়ন: “স্ব-স্কোর কভারেজ (0–1)। যদি < 0.9 হয় তবে প্রত্যাখ্যান করুন।”
ফলাফল: পরিমাপযোগ্য নির্ভুলতা এবং স্পষ্ট আপস্কেলেশন সহ হাজার হাজার চালান জুড়ে সামঞ্জস্যপূর্ণ, নিরীক্ষণযোগ্য শ্রেণীবিভাগ।
চেকলিস্ট যা আপনি আগামীকাল ব্যবহার করতে পারেন
নির্দেশ লেখার চেকলিস্ট:
- আপনি কি নীতি, ভূমিকা, টাস্ক, সরঞ্জাম এবং আউটপুট চুক্তি আলাদা করেছেন?
- আপনার কি কমপক্ষে একটি ইতিবাচক এবং একটি নেতিবাচক উদাহরণ আছে?
- গ্রহণের মানদণ্ড কি পরিমাপযোগ্য এবং পরীক্ষামূলক?
- একটি সুস্পষ্ট আপস্কেলেশন/প্রত্যাখ্যান পথ আছে?
- লোকেল, সুর এবং অঞ্চল-নির্দিষ্ট নিয়মগুলি কি প্যারামিটারাইজড?
- একটি স্কিমা এবং একটি ভ্যালিডেটর সংযুক্ত আছে?
- সরঞ্জামের সীমা এবং অনুমানগুলি নথিভুক্ত করা হয়েছে?
ডিপ্লয়মেন্ট চেকলিস্ট:
- নির্দেশাবলী কি সংস্করণযুক্ত এবং প্রোডাকশনে পিন করা আছে?
- আপনার কি গোল্ডেন সেট এবং পোস্ট-ডিপ্লয় পর্যবেক্ষণ আছে?
- টেলিমেট্রি কি সরঞ্জাম কল, উদ্ধৃতি এবং আত্মবিশ্বাস ক্যাপচার করছে?
- নির্দেশ পরিবর্তনের জন্য একটি রোলব্যাক পরিকল্পনা আছে?
প্রায়শই উপেক্ষিত বিশদ
- প্রসঙ্গ দৈর্ঘ্যের বাজেট: কর্তন এড়াতে নীতি স্তরটিকে একটি স্থিতিশীল টোকেন বাজেটের অধীনে রাখুন।
- নেতিবাচক স্যাম্পলিং: প্রত্যাখ্যান এবং সীমানা প্রশিক্ষণের জন্য কঠিন বিপরীত উদাহরণ অন্তর্ভুক্ত করুন।
- সময় সংবেদনশীলতা: প্রাসঙ্গিক হলে (“গত 90 দিন”) নতুনত্বের মাধ্যমে উৎসগুলিকে পছন্দ করুন।
- আত্মবিশ্বাস অনুমান: মডেলের স্থানীয় অনিশ্চয়তা না থাকলে প্রক্সি সংকেত (পুনরুদ্ধার ঘনত্ব, সরঞ্জাম চুক্তি) ব্যবহার করুন।
- ডেটা হ্রাস: ঝুঁকি এবং খরচ কমাতে মডেলটিতে শুধুমাত্র প্রয়োজনীয় ক্ষেত্রগুলি প্রেরণ করুন।
কীভাবে দল জুড়ে নির্দেশ গুণমান সামাজিকীকরণ করবেন
- লাইভ রেড-টিমিং সহ ব্রাউন-ব্যাগ সেশন চালান।
- ট্যাগ করা উপাদান (নীতি, সুর, লোকেল, ভূমিকা) সহ একটি শেয়ার্ড নির্দেশ লাইব্রেরি তৈরি করুন।
- নিরাপত্তা এবং আইনি সহ একটি সাপ্তাহিক নির্দেশ পর্যালোচনা প্রতিষ্ঠা করুন।
- একটি প্লেবুকে “গটচাস” ক্যাপচার করুন: কী ভেঙেছে, কেন এবং আপনি কীভাবে এটি ঠিক করেছেন।
উল্লেখ করার মতো: সহযোগী নির্দেশ ওয়ার্কস্পেস ব্যবহার করে দলগুলি নকল প্রচেষ্টা হ্রাস করে এবং নিশ্চিত করে যে প্রতিটি নতুন এজেন্ট প্রমাণিত নীতি ব্লকগুলি উত্তরাধিকার সূত্রে পেয়েছে। Sider.AI এর সহযোগী সম্পাদক এবং মূল্যায়ন জোতা প্রোটোটাইপ থেকে সম্মতিপূর্ণ উত্পাদন পর্যন্ত পথকে সংক্ষিপ্ত করতে পারে। ভবিষ্যৎ: প্রম্পট থেকে নীতি-চালিত এজেন্ট
আমরা কারুশিল্প প্রম্পট থেকে নীতি-চালিত এজেন্ট সিস্টেমের দিকে যাচ্ছি:
- টাইপ করা ইন্টারফেস এবং শক্তিশালী ভ্যালিডেটর।
- ব্যবহারকারী, অঞ্চল এবং টাস্কের উপর ভিত্তি করে ডায়নামিক নির্দেশ সমাবেশ।
- ক্রমাগত মূল্যায়ন এবং রোলব্যাক অটোমেশন।
- মডেল, ডেটা এবং নির্দেশ সংস্করণ লিঙ্ক করে সমন্বিত গভর্নেন্স।
মডেলগুলি শক্তিশালী হওয়ার সাথে সাথে পার্থক্যকারীটি “কোন LLM?” হবে না বরং “আপনার নির্দেশাবলী আপনার ব্যবসার নিয়মগুলিকে কতটা ভালভাবে এনকোড করে, নিরাপদে এবং পুনরাবৃত্তিযোগ্যভাবে?”
মূল টেকওয়ে এবং পরবর্তী পদক্ষেপ
- নির্দেশাবলীকে পণ্যের কোডের মতো আচরণ করুন: মডুলার, সংস্করণযুক্ত, পরীক্ষিত।
- প্রসঙ্গ এবং সরঞ্জামগুলিতে সবকিছু ভিত্তি করুন; অনুমান নিষিদ্ধ করুন।
- অনুস্মারক নয়, রানটাইম ভ্যালিডেটর দিয়ে স্কিমা এবং সুরক্ষা বেড়া প্রয়োগ করুন।
- আনুষ্ঠানিক আপস্কেলেশন এবং প্রত্যাখ্যান প্যাটার্ন তৈরি করুন।
- ক্রমাগত মূল্যায়ন করুন এবং অবিরাম লগ করুন।
পরবর্তী পদক্ষেপ:
- আপনার বর্তমান এজেন্টদের তালিকা করুন। প্রতিটির জন্য, নির্দেশাবলী বের করুন এবং মডুলারাইজ করুন।
- আউটপুট স্কিমা সংজ্ঞায়িত করুন এবং ভ্যালিডেটর সেট আপ করুন।
- একটি ছোট গোল্ডেন সেট তৈরি করুন এবং বেসলাইন ইভাল চালান।
- সংস্করণ এবং পরিবর্তন লগগুলি প্রবর্তন করুন।
- দল জুড়ে সমন্বয় করার জন্য একটি নির্দেশ রেজিস্ট্রি পাইলট করুন—এমন সরঞ্জামগুলি বিবেচনা করুন যা মডুলার নির্দেশ ব্লক, মূল্যায়ন এবং গভর্নেন্স অফার করে যাতে গ্রহণকে দ্রুত করা যায়।
এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলীর জন্য সেরা পদ্ধতি ডিজাইন করা শব্দ তৈরি করার চেয়ে সিস্টেম চিন্তা সম্পর্কে বেশি। সিস্টেমটি সঠিকভাবে পান এবং আপনার এজেন্টরা অবশেষে আপনার কাঙ্ক্ষিত দলের সঙ্গীর মতো কাজ করবে—আপনার ভয়ের ইন্টার্ন নয়।
FAQ
Q1:এন্টারপ্রাইজে AI এজেন্ট নির্দেশাবলী ডিজাইন করার জন্য সেরা পদ্ধতিগুলি কী কী?
মডুলার নির্দেশাবলী (নীতি, ভূমিকা, টাস্ক, সরঞ্জাম, আউটপুট), যাচাইযোগ্য স্কিমা, গ্রাউন্ডেড প্রসঙ্গ, আপস্কেলেশন পাথ এবং ক্রমাগত মূল্যায়নের উপর ফোকাস করুন। সবকিছু সংস্করণ করুন, রানটাইমে সুরক্ষা বেড়া প্রয়োগ করুন এবং শ্রোতা অনুসারে সুর এবং সম্মতি স্থানীয়করণ করুন।
Q2:আমি কীভাবে এন্টারপ্রাইজ AI এজেন্ট ডিজাইনে হ্যালুসিনেশন প্রতিরোধ করব?
পুনরুদ্ধারের মাধ্যমে ভেটেড প্রসঙ্গের সাথে নির্দেশাবলী আবদ্ধ করুন, উৎসের পছন্দগুলি ঘোষণা করুন এবং needs_more_context-এর মতো একটি কাঠামোবদ্ধ ফলব্যাক যুক্ত করুন। আউটপুট স্কিমা প্রয়োগ করুন এবং সরবরাহকৃত নথিগুলিতে ম্যাপ করা উদ্ধৃতিগুলির প্রয়োজন করুন।
Q3:অডিটগুলির জন্য AI এজেন্ট আউটপুটগুলি কীভাবে ফর্ম্যাট করা উচিত?
প্রয়োজনীয় ক্ষেত্রগুলির সাথে কঠোর JSON বা টাইপ করা স্কিমা ব্যবহার করুন, doc_id এবং পৃষ্ঠা সহ উদ্ধৃতি অন্তর্ভুক্ত করুন এবং নির্দেশ সংস্করণ এবং সরঞ্জাম কল লগ করুন। এটি আচরণকে ব্যাখ্যাযোগ্য এবং অডিট-প্রস্তুত করে তোলে।
Q4:AI এজেন্ট নির্দেশাবলীতে আপস্কেলেশনের ভূমিকা কী?
আপস্কেলেশন ধোঁকা প্রতিরোধ করে এবং নিরাপত্তা নিশ্চিত করে। থ্রেশহোল্ড, ট্রিগার এবং চ্যানেলগুলি (যেমন টিকিট তৈরি) সংজ্ঞায়িত করুন এবং সম্পূর্ণ বা কারণ সহ আপস্কেল নির্দেশ করতে আউটপুটে একটি অ্যাকশন ক্ষেত্র অন্তর্ভুক্ত করুন।
Q5:কীভাবে Sider.AI AI এজেন্টদের জন্য নির্দেশ ফ্রেমওয়ার্কের সাথে সাহায্য করতে পারে?
Sider.AI মডুলার নির্দেশ লেখা, পুনরায় ব্যবহারযোগ্য নীতি ব্লক, স্কিমা বৈধতা, গোল্ডেন সেটের মূল্যায়ন এবং নিরাপদ সংস্করণযুক্ত রোলআউট সমর্থন করে। এটি দলগুলিকে প্রম্পট স্প্রল কমাতে এবং দ্রুত সম্মতিপূর্ণ, নির্ভরযোগ্য এজেন্ট পাঠাতে সাহায্য করে।