What does enterprise‑ready mean for AI agents on AWS?

It means secure, auditable agents that respect SSO and document permissions, provide citations, and run on compliant infrastructure. When you build AI agents with Glean and AWS, you get permission‑aware retrieval and cloud‑grade observability.

How does Glean prevent data leaks in AI answers?

Glean enforces document‑level permissions from each connected app at query time. The agent only retrieves content the user can access, which is critical when building enterprise‑ready AI agents with Glean and AWS.

Which AWS services should I use for orchestration?

Use Lambda or ECS for execution, Step Functions for multi‑step workflows, Bedrock for models and guardrails, and Secrets Manager for credentials. This stack is a proven base for building AI agents with Glean and AWS.

How do I evaluate accuracy and reduce hallucinations?

Create a gold set of questions, require citations, and use retrieval‑augmented generation. With Glean and AWS, permission‑aware retrieval plus guardrails reduces hallucinations significantly.

Can AI agents safely take actions like creating tickets or posting in Slack?

Yes—with schema‑validated tools, approvals for high‑impact actions, and full audit logging. This is a core pattern when you build enterprise‑ready AI agents with Glean and AWS.

چگونه با Glean و AWS، عامل‌های هوش مصنوعی آمادهٔ سازمانی بسازیم

چرا عوامل هوش مصنوعی سازمانی با شکست مواجه می‌شوند — و چگونه با استفاده از Glean و AWS آن‌ها را برای محیط عملیاتی آماده کنیم

این ادعای جسورانه‌ای است: بیشتر "عوامل هوش مصنوعی" که در اتاق‌های هیئت مدیره نمایش داده می‌شوند، واقعاً برای سازمان آماده نیستند. آن‌ها تحت فشار دچار توهم می‌شوند، روی داده‌های واقعی از کار می‌افتند و نمی‌توانند ممیزی SOC 2 را بگذرانند. اگر هوش مصنوعی‌ای می‌خواهید که تیم‌های حقوقی، امنیتی و فناوری اطلاعات شما واقعاً آن را تأیید کنند—و کارمندان شما واقعاً از آن استفاده کنند—به ساختاری نیاز دارید که بازیابی (Glean) در سطح سازمانی، عناصر اولیه ابری قوی (AWS) و معماری منظمی را با هم ترکیب کند که در مقیاس بزرگ نیز دوام بیاورد.

این راهنما گام به گام شما را در نحوه ساخت عوامل هوش مصنوعی آماده برای سازمان با Glean و AWS راهنمایی می‌کند—از بازیابی آگاه از هویت گرفته تا استفاده امن از ابزارها، از بودجه‌های تأخیر گرفته تا قابلیت مشاهده و از مرحله آزمایشی تا تولید.

ما از یک ساختار مبتنی بر سوال استفاده خواهیم کرد تا بتوانید مستقیماً به مهم‌ترین موارد بپردازید: دسترسی به داده‌ها، امنیت، معماری و راه‌اندازی.

منظور ما از عوامل هوش مصنوعی آماده برای سازمان چیست؟

یک عامل هوش مصنوعی آماده برای سازمان فقط یک رابط چت نیست. این یک سیستم امن و قابل ممیزی است که می‌تواند:

با استفاده از دانش شرکت و با محدودیت‌های دسترسی دقیق، به سؤالات پاسخ دهد

از طریق ابزارهای تأیید شده (به عنوان مثال، تیکت‌های ServiceNow، issues های Jira، پست‌های Slack) اقداماتی را انجام دهد

منابع را مشخص و استدلال را توضیح دهد

تحت کنترل‌های SSO، SCIM و DLP سازمانی عمل کند

با الزامات محل نگهداری داده‌ها، ثبت وقایع و نگهداری مطابقت داشته باشد

با تأخیر و هزینه قابل پیش‌بینی، به هزاران کاربر مقیاس یابد

اینجاست که ساخت عوامل هوش مصنوعی با Glean و AWS می‌درخشد: Glean جستجو و بازیابی آگاه از هویت در سطح سازمانی را در سراسر برنامه‌ها فراهم می‌کند، در حالی که AWS زیرساخت محاسباتی، سازماندهی، شبکه‌سازی و حکمرانی مورد نیاز شما را در محیط عملیاتی ارائه می‌دهد.

نمای کلی معماری: Glean + AWS

این سیستم را به عنوان چهار لایه در نظر بگیرید:

لایه هویت و دسترسی (SSO، SCIM، مجوزها)

SSO از طریق Okta/Azure AD؛ SCIM برای provision کردن؛ نقشه‌برداری نقش‌ها

Glean مجوزهای سطح سند را در زمان پرس و جو اعمال می‌کند

AWS Cognito یا SAML/OIDC مستقیم برای انتقال توکن‌ها به سرویس‌ها

لایه بازیابی سازمانی (Glean)

فهرست یکپارچه در سراسر Google Drive، Slack، Confluence، Jira، GitHub، Box، Notion و غیره

بازیابی و رتبه‌بندی آگاه از مجوز

بازنویسی پرس و جو، جستجوی ترکیبی، رتبه‌بندی مجدد معنایی

لایه استدلال و سازماندهی (AWS + مدل‌ها)

AWS Lambda یا ECS برای مراحل عامل بدون حالت

Amazon Bedrock برای دسترسی مدیریت‌شده به مدل‌های پیشرفته

Step Functions برای گردش‌های کاری چند ابزاری و تلاش‌های مجدد

Secrets Manager/Parameter Store برای کلیدها و اعتبارات ابزار

لایه اقدام و ابزار (ادغام‌های سازمانی)

عملیات خواندن و نوشتن در سیستم‌های ثبت (ServiceNow، Salesforce، Jira، Slack)

حفاظت‌ها، تأییدیه‌ها و مشاهده برای هر فراخوانی ابزار

ثبت وقایع ممیزی در CloudWatch/OpenSearch برای توضیح‌پذیری

ساخت هسته: چگونه عوامل هوش مصنوعی آماده برای سازمان را با Glean و AWS بسازیم

در زیر یک مسیر عملی و سرتاسری ارائه شده است. آن را با پشته فناوری خود تطبیق دهید، اما اصول را حفظ کنید.

1) ابتدا هویت و حکمرانی را تنظیم کنید

SSO را از طریق Okta/Azure AD برقرار کنید. گروه‌ها/نقش‌ها را به مجوزهای برنامه نگاشت کنید.

از SCIM برای چرخه عمر خودکار کاربر (پیوستن/انتقال/ترک) استفاده کنید. لغو provision باید به عامل نیز انتقال یابد.

حساب‌های AWS را با نقش‌های IAM با حداقل امتیاز پیکربندی کنید. محیط‌های توسعه، staging و تولید را جدا کنید. نقاط پایانی VPC را برای Bedrock و کنترل‌های خروج داده در صورت نیاز اعمال کنید.

مدت نگهداری داده را مشخص کنید: چه مدت prompts، پاسخ‌ها و vector embeddings را ذخیره کنید. از S3 buckets رمزگذاری شده با KMS برای ثبت وقایع و مصنوعات استفاده کنید.

نکته: با هویت به عنوان یک سیگنال runtime رفتار کنید. عامل باید هویت کاربر نهایی را از طریق Glean و ابزارها منتقل کند تا بررسی‌های مجوز دست نخورده باقی بمانند.

2) منابع را در Glean متصل کنید و بازیابی آگاه از مجوز را فعال کنید

Slack، Drive، Confluence، Notion، GitHub، Jira، Box و ایمیل را مطابق با ردپای خود متصل کنید.

به Glean اجازه دهید با حداقل امتیاز بخزد و فهرست‌بندی کند؛ دامنه‌ها را با امنیت تأیید کنید.

اعتبارسنجی انتشار مجوز: یک کاربر فقط باید بتواند آنچه را که در برنامه منبع می‌تواند ببیند، بازیابی کند.

پیکربندی پرس و جوی Glean را تنظیم کنید: بازنویسی پرس و جو، بازیابی ترکیبی و رتبه‌بندی مجدد معنایی را برای دقت بهتر فعال کنید.

چرا مهم است: در بیشتر سازمان‌ها، 70 تا 90 درصد مشکل "توهم" در واقع یک مشکل بازیابی است. با Glean، عامل هوش مصنوعی اسناد صحیح را با در نظر گرفتن مجوزهای کاربر بازیابی می‌کند و به طور چشمگیری خطر و پاسخ‌های نامربوط را کاهش می‌دهد.

3) مدل‌ها را از طریق Amazon Bedrock انتخاب کنید و محافظ‌ها را تنظیم کنید

با یک مدل عمومی (به عنوان مثال، Claude، Llama یا Mistral از طریق Bedrock) شروع کنید و آن را در برابر prompts های دامنه A/B آزمایش کنید.

از Bedrock Guardrails برای فیلترهای ایمنی، بررسی‌های تزریق prompt و سیاست‌های محتوا استفاده کنید.

پاسخ‌ها را محدود کنید: استناد به شناسه سند/URL را الزامی کنید، طرحواره‌های JSON را برای خروجی‌های ابزار اعمال کنید و حداکثر tokens را برای هر مرحله تنظیم کنید.

یک بودجه تأخیر در نظر بگیرید: هدف P95 سرتاسری < 2.5 ثانیه برای پرسش و پاسخ و < 6 ثانیه برای گردش‌های کاری استفاده از ابزار باشد.

4) عامل را روی AWS سازماندهی کنید

الگو: برنامه‌ریزی به سبک ReAct + استفاده از ابزار + پاسخگویی مبتنی بر شواهد.

از Step Functions برای هماهنگی مراحل استفاده کنید: بازیابی ← برنامه‌ریزی ← ابزار ← اعتبارسنجی ← پاسخ.

فراخوانی‌های استدلال در Lambda یا ECS اجرا می‌شوند؛ Lambda را برای ترافیک ناگهانی و ECS را برای توان عملیاتی پایدار انتخاب کنید.

آداپتورهای ابزار (Jira، Slack، ServiceNow) Lambdas های بدون حالت با secrets های دارای دامنه IAM در AWS Secrets Manager هستند.

وضعیت مکالمه کوتاه‌مدت را در DynamoDB با TTL ذخیره کنید؛ تجزیه و تحلیل بلندمدت را در S3/Glue/Athena.

5) پیاده‌سازی تولید تقویت‌شده با بازیابی (RAG) با Glean

با توکن هویت کاربر و سؤال کاربر، از Glean پرس و جو کنید.

نتایج top-k را بازیابی کنید (به عنوان مثال، ترکیبی: k=10 معنایی + 10 کلمه کلیدی) با رعایت مجوزها.

با ارتباط Glean دوباره رتبه‌بندی کنید؛ فقط تکه‌های برتر و بدون تکرار را به مدل منتقل کنید.

از عامل بخواهید منابع را ذکر کند و یک امتیاز اطمینان را درج کند.

ساختار کلی Prompt:

سیستم: "شما یک دستیار سازمانی مبتنی بر شواهد هستید. فقط از زمینه ارائه شده استفاده کنید. اگر نامربوط است، یک پیگیری بپرسید. همیشه منابع را با عنوان و لینک ذکر کنید."

ابزارها: "شما می‌توانید Jira_CreateIssue، Slack_PostMessage، ServiceNow_CreateIncident را فراخوانی کنید. فقط پس از تأیید با کاربر عمل کنید، مگر اینکه یک runbook اتوماسیون را مجاز کند."

6) استفاده امن از ابزار و تأییدیه‌ها را اضافه کنید

هر ابزار را با اعتبارسنجی پارامتر و محدود کردن نرخ بپوشانید.

تأیید انسانی یا تأیید مدیر را برای اقدامات مهم (به عنوان مثال، provision کردن دسترسی، بستن P1s) الزامی کنید.

هر فراخوانی ابزار (چه کسی، چه چیزی، چه زمانی، طرحواره ورودی، خروجی) را در CloudWatch و S3 برای ممیزی ثبت کنید.

برای پست‌های Slack/Teams، از "حالت پیش نویس" برای پیش نمایش قبل از ارسال پشتیبانی کنید.

7) قابلیت مشاهده، ارزیابی و کنترل انحراف

Prompts، قطعه‌های زمینه، استنادها و پاسخ‌ها را با ویرایش در صورت نیاز ضبط کنید.

از داشبوردهای OpenSearch برای نظارت بر precision@k، groundedness و نرخ انحراف استفاده کنید.

ارزیابی‌های آفلاین را اجرا کنید: یک مجموعه طلایی از 100 تا 300 سؤال خاص سازمان با پاسخ‌های مورد انتظار و منابع مورد نیاز ایجاد کنید.

Canaries را برای تشخیص کانکتور یا انحراف مجوز زمان‌بندی کنید (به عنوان مثال، کانال‌های Slack تغییر یافته، انتقال‌های درایو).

8) تنظیم عملکرد و هزینه

پرس و جوهای Glean را برای هر کاربر برای موضوعات داغ (به عنوان مثال، خط مشی HR) با TTL های کوتاه ذخیره کنید.

از مدل‌های کوچکتر برای مسیریابی و مدل‌های بزرگتر فقط برای پرس و جوهای دشوار یا برنامه‌های چند ابزاری استفاده کنید.

در صورت امکان، رتبه‌بندی مجدد را دسته‌ای انجام دهید؛ زمینه را فشرده کنید؛ از حذف تکراری تکه‌ها استفاده کنید.

هزینه هر کار حل شده را پیگیری کنید؛ سهمیه‌ها را برای هر سازمان و هر گروه کاربری تعیین کنید.

مثال: یک دستیار فناوری اطلاعات سازمانی که با Glean و AWS ساخته شده است

بیایید یک سناریوی مشخص را بررسی کنیم که نشان می‌دهد چگونه عوامل هوش مصنوعی آماده برای سازمان را با Glean و AWS بسازیم.

مورد استفاده: تریاژ و حل مشکلات پشتیبانی فناوری اطلاعات.

کاربر می‌پرسد: "VPN در macOS 14 پس از به‌روزرسانی با مشکل مواجه می‌شود—آیا راه حلی وجود دارد؟"

عامل به مسیر runbook فناوری اطلاعات هدایت می‌شود.

بازیابی: با هویت کاربر از Glean پرس و جو می‌کند و runbook VPN (Confluence)، یک رشته Slack از #it-support و یک سند خط مشی Jamf را واکشی می‌کند. فقط منابعی که کاربر می‌تواند به آنها دسترسی داشته باشد در نظر گرفته می‌شوند.

برنامه‌ریزی: عامل مراحلی را پیشنهاد می‌کند: راه حل را به اشتراک بگذارید، انطباق دستگاه را از طریق Jamf بررسی کنید و در صورت عدم حل مشکل، یک حادثه ServiceNow باز کنید.

فراخوانی‌های ابزار: وضعیت Jamf را می‌خواند (فقط خواندنی)، یک پیام راه حل را پیش نویس می‌کند و از کاربر می‌خواهد که تشدید را تأیید کند. با تأیید، یک حادثه با الگوی مناسب ایجاد می‌کند.

پاسخ: یک خلاصه راه حل مختصر با استناد به runbook و رشته Slack، همه در محدوده مجوز کاربر ارائه می‌دهد.

چرا کار می‌کند: عامل در بازیابی آگاه از مجوز از Glean مبتنی بر شواهد است و AWS اجرا، تأییدیه‌ها و ثبت وقایع را مدیریت می‌کند.

لیست بررسی امنیت و انطباق (از این مورد صرف نظر نکنید)

مرزهای داده

زمینه بازیابی را در سمت سرور نگه دارید؛ محتوای سند خام را در معرض کلاینت قرار ندهید.

در حالت استراحت با KMS رمزگذاری کنید؛ TLS 1.2+ را در انتقال اعمال کنید.

هویت

هویت کاربر را به Glean و ابزارها منتقل کنید؛ هرگز از هویت ربات مشترک برای بازیابی استفاده نکنید.

RBAC را از گروه‌های IdP به دامنه‌های ابزار نگاشت کنید.

حکمرانی مدل

Bedrock Guardrails را فعال کنید؛ secrets را در prompts مجاز ندانید.

PII را در صورت نیاز ویرایش کنید و پنجره‌های نگهداری سند را ثبت کنید.

ممیزی

وقایع تغییرناپذیر را در S3 با Object Lock ثبت کنید؛ به SIEM خود صادر کنید.

یک runbook برای پاسخ به حادثه و rollback مدل نگه دارید.

طرح پیاده‌سازی: 10 مرحله تا تولید

3 مورد استفاده اصلی عامل (فناوری اطلاعات، منابع انسانی، عملیات فروش) و معیارهای موفقیت (نرخ انحراف، CSAT، زمان حل مشکل) را تعریف کنید.

حساب‌های AWS، VPC، خطوط پایه IAM و دسترسی Bedrock را برپا کنید.

SSO/SCIM را ادغام کنید؛ نقش‌ها و گردش‌های تأیید را نگاشت کنید.

منابع اصلی را در Glean متصل کنید و بازیابی آگاه از مجوز را اعتبارسنجی کنید.

یک سرویس ارکستراسیون حداقلی (Lambda + API Gateway) با Step Functions بسازید.

قرارداد prompt RAG، استنادها و فیلتر کردن منبع را پیاده‌سازی کنید.

دو ابزار سرتاسری اضافه کنید (ابتدا فقط خواندنی، سپس نوشتن با تأیید).

وقایع‌نگاری، ارزیابی‌ها و داشبوردها را ابزاربندی کنید؛ یک مجموعه طلایی 150 سؤالی ایجاد کنید.

یک نسخه بتا بسته با 50 تا 100 کاربر اجرا کنید؛ مشکلات اصلی را برطرف کنید؛ SLO ها را تنظیم کنید.

به طور گسترده راه اندازی کنید؛ یک بررسی تغییر هفتگی و ارزیابی مدل ماهانه ایجاد کنید.

سوالات متداول هنگام ساخت عوامل هوش مصنوعی با Glean و AWS

چگونه توهمات را در عوامل سازمانی کاهش دهم؟

مدل را با بازیابی از Glean مبتنی بر شواهد کنید و یک prompt سختگیرانه را اعمال کنید: فقط از زمینه ارائه شده استفاده کنید و همیشه منابع را ذکر کنید. پاسخ‌ها را با اطمینان پایین رد کنید و سؤالات واضح کننده بپرسید. بیشتر توهمات زمانی از بین می‌روند که به بازیابی آگاه از مجوز تکیه کنید.

آیا عامل می‌تواند به مجوزهای سطح سند در سراسر برنامه‌ها احترام بگذارد؟

بله. هنگامی که عوامل هوش مصنوعی را با Glean و AWS می‌سازید، Glean مجوزهای برنامه‌های متصل را در زمان پرس و جو اعمال می‌کند، بنابراین عامل فقط آنچه را که کاربر می‌تواند به آن دسترسی داشته باشد می‌بیند. همیشه توکن هویت کاربر را برای حفظ زنجیره نگهداری منتقل کنید.

با چه مدل‌هایی باید در AWS شروع کنم؟

از Amazon Bedrock برای دسترسی به مدل‌های متعدد استفاده کنید. با یک مدل عمومی قوی برای استدلال و یک مدل کوچکتر و سریعتر برای مسیریابی شروع کنید. تأخیر، هزینه و دقت را در برابر مجموعه طلایی تنظیم شده خود ارزیابی کنید.

چگونه به طور ایمن به عوامل اجازه دهم در سیستم‌هایی مانند Jira یا ServiceNow اقداماتی انجام دهند؟

هر ابزار را با طرحواره‌های سختگیرانه، اعتبارسنجی ورودی و گردش‌های کار تأیید بپوشانید. هر فراخوانی ابزار را ثبت کنید و خروجی‌ها را برای ممیزی ذخیره کنید. برای اقدامات مهم، یک مرحله تأیید انسانی را الزامی کنید.

چه معیارهایی ثابت می‌کند که یک عامل برای تولید آماده است؟

Groundedness (نرخ استناد)، دقت پاسخ، تأخیر P95، نرخ حل/انحراف و هزینه هر کار حل شده را پیگیری کنید. داشبوردها را بسازید و بررسی‌های رگرسیون هفتگی را روی مجموعه طلایی خود اجرا کنید.

به هر حال: تسریع حلقه ساخت

شایان ذکر است: اگر تیم شما اغلب نمونه‌سازی می‌کند، یک کمک‌خلبان برای تحقیق و پیش‌نویس می‌تواند اسناد طراحی، runbooks و تکرارهای prompt را سرعت بخشد. ابزارهایی مانند Sider.AI به تیم‌ها کمک می‌کنند تا رشته‌های طولانی را خلاصه کنند، prompts های ارزیابی را پیش نویس کنند و خروجی‌های مدل را در کنار هم مقایسه کنند—که هنگام تنظیم نحوه ساخت عوامل هوش مصنوعی آماده برای سازمان با Glean و AWS مفید است.

نکات کلیدی و مراحل بعدی

ساخت عوامل هوش مصنوعی با Glean و AWS به شما بازیابی آگاه از هویت و ارکستراسیون درجه سازمانی می‌دهد.

قبل از منطق برنامه‌ریزی فانتزی، با هویت، حکمرانی و بازیابی آگاه از مجوز شروع کنید.

از Bedrock guardrails، طرحواره‌های ابزار دقیق و تأییدیه‌های human-in-the-loop استفاده کنید.

همه چیز را ابزاربندی کنید: ارزیابی‌ها، ممیزی‌ها و کنترل‌های هزینه.

مراحل بعدی این هفته:

سه مورد استفاده اصلی و معیارهای موفقیت خود را پیش نویس کنید.

دو منبع اصلی را در Glean متصل کنید؛ یک ارزیابی 150 سؤالی اجرا کنید.

یک ارکستراتور Lambda + Step Functions حداقلی با یک ابزار فقط خواندنی برپا کنید.

قبل از گسترش آزمایشی، بودجه‌های تأخیر و هزینه خود را تنظیم کنید.

سوالات متداول

Q1:منظور از آماده برای سازمان برای عوامل هوش مصنوعی در AWS چیست؟ منظور عوامل امن و قابل ممیزی است که به SSO و مجوزهای سند احترام می‌گذارند، استناد ارائه می‌دهند و روی زیرساخت منطبق اجرا می‌شوند. هنگامی که عوامل هوش مصنوعی را با Glean و AWS می‌سازید، بازیابی آگاه از مجوز و قابلیت مشاهده درجه ابری را دریافت می‌کنید.

Q2:Glean چگونه از نشت داده‌ها در پاسخ‌های هوش مصنوعی جلوگیری می‌کند؟ Glean مجوزهای سطح سند را از هر برنامه متصل در زمان پرس و جو اعمال می‌کند. عامل فقط محتوایی را که کاربر می‌تواند به آن دسترسی داشته باشد بازیابی می‌کند، که هنگام ساخت عوامل هوش مصنوعی آماده برای سازمان با Glean و AWS بسیار مهم است.

Q3:از کدام سرویس‌های AWS باید برای ارکستراسیون استفاده کنم؟ از Lambda یا ECS برای اجرا، Step Functions برای گردش‌های کاری چند مرحله‌ای، Bedrock برای مدل‌ها و محافظ‌ها و Secrets Manager برای اعتبارات استفاده کنید. این پشته یک پایه ثابت شده برای ساخت عوامل هوش مصنوعی با Glean و AWS است.

Q4:چگونه دقت را ارزیابی کنم و توهمات را کاهش دهم؟ یک مجموعه طلایی از سؤالات ایجاد کنید، استناد را الزامی کنید و از تولید تقویت‌شده با بازیابی استفاده کنید. با Glean و AWS، بازیابی آگاه از مجوز به همراه محافظ‌ها به طور قابل توجهی توهمات را کاهش می‌دهد.

Q5:آیا عوامل هوش مصنوعی می‌توانند به طور ایمن اقداماتی مانند ایجاد تیکت یا ارسال در Slack انجام دهند؟ بله—با ابزارهای اعتبارسنجی شده طرحواره، تأییدیه‌ها برای اقدامات با تأثیر بالا و ثبت وقایع ممیزی کامل. این یک الگوی اصلی هنگام ساخت عوامل هوش مصنوعی آماده برای سازمان با Glean و AWS است.