What does enterprise‑ready mean for AI agents on AWS?

It means secure, auditable agents that respect SSO and document permissions, provide citations, and run on compliant infrastructure. When you build AI agents with Glean and AWS, you get permission‑aware retrieval and cloud‑grade observability.

How does Glean prevent data leaks in AI answers?

Glean enforces document‑level permissions from each connected app at query time. The agent only retrieves content the user can access, which is critical when building enterprise‑ready AI agents with Glean and AWS.

Which AWS services should I use for orchestration?

Use Lambda or ECS for execution, Step Functions for multi‑step workflows, Bedrock for models and guardrails, and Secrets Manager for credentials. This stack is a proven base for building AI agents with Glean and AWS.

How do I evaluate accuracy and reduce hallucinations?

Create a gold set of questions, require citations, and use retrieval‑augmented generation. With Glean and AWS, permission‑aware retrieval plus guardrails reduces hallucinations significantly.

Can AI agents safely take actions like creating tickets or posting in Slack?

Yes—with schema‑validated tools, approvals for high‑impact actions, and full audit logging. This is a core pattern when you build enterprise‑ready AI agents with Glean and AWS.

如何使用 Glean 和 AWS 構建企業級 AI 代理

為何企業級 AI 代理會失敗 — 以及如何透過 Glean 和 AWS 使其達到可生產狀態

以下是一個大膽的聲明：在會議室演示的大多數「AI 代理」並非真正具備企業級水準。它們在高壓下會產生幻覺、在真實數據上會崩潰，並且無法通過 SOC 2 稽核。如果您想要您的法律、安全和 IT 團隊實際上會批准，並且您的員工實際上會使用的 AI，您需要一個結合了企業級檢索 (Glean)、穩健的雲端基礎元件 (AWS) 以及能夠經受擴展考驗的嚴謹架構的建構方案。

本指南將逐步引導您如何使用 Glean 和 AWS 構建企業級 AI 代理 — 從身分感知檢索到安全工具使用，從延遲預算到可觀察性，以及從試點到生產。

我們將使用以問題為導向的結構，以便您可以跳到最重要的部分：資料存取、安全性、架構和推出。

我們所說的企業級 AI 代理是什麼意思？

企業級 AI 代理不僅僅是一個聊天介面。它是一個安全、可稽核的系統，可以：

使用公司知識回答問題，並具有嚴格的權限邊界

透過批准的工具執行操作（例如，ServiceNow 工單、Jira 問題、Slack 貼文）

歸屬來源並解釋推理

在企業 SSO、SCIM 和 DLP 控制下運作

符合資料落地、記錄和保留要求

以可預測的延遲和成本擴展到數千名用戶

這正是使用 Glean 和 AWS 構建 AI 代理的優勢所在：Glean 提供跨應用程式的身分感知企業搜尋和檢索，而 AWS 帶來您在生產環境中所需的計算、協調、網路和治理基礎。

架構概覽：Glean + AWS

將系統視為四個層：

身分與存取層（SSO、SCIM、權限）

透過 Okta/Azure AD 進行 SSO；SCIM 用於配置；角色映射

Glean 在查詢時強制執行文件層級權限

AWS Cognito 或直接 SAML/OIDC 將 Token 轉移到服務

企業檢索層 (Glean)

跨 Google Drive、Slack、Confluence、Jira、GitHub、Box、Notion 等的統一索引

權限感知檢索和排名

查詢重寫、混合搜尋、語義重新排序

推理與協調層 (AWS + 模型)

AWS Lambda 或 ECS 用於無狀態代理步驟

Amazon Bedrock 用於管理對前沿模型的存取

Step Functions 用於多工具工作流程和重試

Secrets Manager/Parameter Store 用於金鑰和工具憑證

操作與工具層（企業整合）

對記錄系統（ServiceNow、Salesforce、Jira、Slack）的讀取和寫入操作

每個工具呼叫的防護措施、批准和觀察

CloudWatch/OpenSearch 中的稽核日誌，以實現可解釋性

核心建構：如何使用 Glean 和 AWS 構建企業級 AI 代理

以下是一個實用、端到端的路徑。請根據您的堆疊進行調整，但請記住這些原則。

1) 首先設定身分和治理

透過 Okta/Azure AD 建立 SSO。將群組/角色映射到應用程式權限。

使用 SCIM 進行自動化的使用者生命週期管理（加入/調動/離職）。取消配置必須級聯到代理。

使用最小權限 IAM 角色配置 AWS 帳戶。分離開發、測試和生產環境。在需要時，對 Bedrock 實施 VPC 端點和資料輸出控制。

定義資料保留：提示、回應和向量嵌入的儲存時間。對日誌和工件使用 KMS 加密的 S3 儲存桶。

提示：將身分視為運行時訊號。代理必須將最終使用者的身分傳遞到 Glean 和工具，以使權限檢查保持完整。

2) 在 Glean 中連接來源並啟用權限感知檢索

根據您的足跡連接 Slack、Drive、Confluence、Notion、GitHub、Jira、Box 和電子郵件。

讓 Glean 以最小權限爬取和建立索引；與安全性確認範圍。

驗證權限傳播：使用者應僅檢索他們可以在來源應用程式中查看的內容。

調整 Glean 查詢配置：啟用查詢重寫、混合檢索和語義重新排序以獲得更高的精確度。

重要原因：在大多數企業中，70–90% 的「幻覺」問題實際上是一個檢索問題。透過 Glean，AI 代理會根據使用者的權限檢索正確的文件，從而大幅降低風險和無關的回覆。

3) 透過 Amazon Bedrock 選擇模型並設定防護措施

從通用模型開始（例如，透過 Bedrock 的 Claude、Llama 或 Mistral），並根據領域提示進行 A/B 測試。

使用 Bedrock Guardrails 進行安全過濾、提示注入檢查和內容策略。

約束回應：要求按文件 ID/URL 引用，對工具輸出強制執行 JSON 結構描述，並設定每個步驟的最大 Token 數。

保持延遲預算：目標是 Q&A 的 P95 端到端 < 2.5 秒，工具使用流程的 P95 端到端 < 6 秒。

4) 在 AWS 上協調代理

模式：ReAct 風格的規劃 + 工具使用 + 基於事實的回答。

使用 Step Functions 協調步驟：檢索 → 規劃 → 工具 → 驗證 → 回答。

推理呼叫在 Lambda 或 ECS 中執行；對於突發流量，選擇 Lambda；對於持續的輸送量，選擇 ECS。

工具轉接器（Jira、Slack、ServiceNow）是無狀態 Lambda，在 AWS Secrets Manager 中具有 IAM 範圍的密碼。

將短期對話狀態儲存在具有 TTL 的 DynamoDB 中；將長期分析儲存在 S3/Glue/Athena 中。

5) 使用 Glean 實作檢索增強生成 (RAG)

使用使用者的身分 Token 和使用者的問題查詢 Glean。

檢索前 k 個結果（例如，混合：k=10 語義 + 10 個關鍵字），並遵守權限。

使用 Glean 的相關性重新排序；僅將頂部、去重的區塊傳遞給模型。

要求代理引用來源並包含信心分數。

提示框架：

系統：「您是一位基於事實的企業助理。僅使用提供的上下文。如果無關，請提出後續問題。始終按標題和連結引用來源。」

工具：「您可以呼叫 Jira_CreateIssue、Slack_PostMessage、ServiceNow_CreateIncident。除非運行手冊授權自動化，否則僅在與使用者確認後才採取行動。」

6) 新增安全工具使用和批准

使用參數驗證和速率限制包裝每個工具。

對於有影響的行動（例如，配置存取權限、關閉 P1），需要人工確認或經理批准。

將每個工具呼叫（誰、什麼、何時、輸入結構描述、輸出）記錄到 CloudWatch 和 S3 以進行稽核。

對於 Slack/Teams 貼文，支援「草稿模式」以在傳送前預覽。

7) 可觀察性、評估和漂移控制

捕獲提示、上下文程式碼片段、引用和回應，並在需要時進行編輯。

使用 OpenSearch 儀表板監控 precision@k、基於事實的程度和偏轉率。

執行離線評估：策劃一組包含預期答案和所需來源的 100–300 個特定於組織的問題。

排程 Canary 以檢測連接器或權限漂移（例如，已更改的 Slack 頻道、磁碟機遷移）。

8) 效能和成本調整

為熱門主題（例如，HR 政策）快取每個使用者的 Glean 查詢，並使用較短的 TTL。

對路由使用較小的模型，僅對難以處理的查詢或多工具計畫使用較大的模型。

盡可能批量重新排序；壓縮上下文；使用區塊重複資料刪除。

追蹤每個已解決任務的成本；設定每個組織和每個使用者群組的配額。

範例：使用 Glean 和 AWS 建構的企業 IT 助理

讓我們來看一個具體的場景，展示如何使用 Glean 和 AWS 構建企業級 AI 代理。

使用案例：IT 支援分流和解決。

使用者詢問：「更新後 macOS 14 上的 VPN 失敗 — 有沒有解決方法？」

代理將路由到 IT 運行手冊追蹤。

檢索：使用使用者的身分查詢 Glean，並獲取 VPN 運行手冊 (Confluence)、來自 #it‑support 的 Slack 執行緒和 Jamf 策略文件。僅考慮使用者可以存取的資源。

規劃：代理建議步驟：分享修復程式、透過 Jamf 檢查裝置合規性，如果問題未解決，則開啟 ServiceNow 事件。

工具呼叫：讀取 Jamf 狀態（唯讀）、起草修復訊息，並要求使用者確認升級。在確認後，使用正確的範本建立事件。

回答：提供簡明的修復摘要，其中包含對運行手冊和 Slack 執行緒的引用，所有內容都在使用者的權限範圍內。

有效的原因：代理基於 Glean 的權限感知檢索，而 AWS 處理執行、批准和記錄。

安全性和合規性檢查表（請勿跳過此步驟）

資料邊界

將檢索上下文保留在伺服器端；不要將原始文件內容暴露給用戶端。

使用 KMS 靜態加密；在傳輸中強制執行 TLS 1.2+。

身分

將使用者身分傳遞給 Glean 和工具；切勿使用共用 Bot 身分進行檢索。

將 RBAC 從 IdP 群組映射到工具範圍。

模型治理

啟用 Bedrock Guardrails；不允許在提示中使用密碼。

在需要時編輯 PII 並記錄保留期限。

稽核

使用物件鎖定的 S3 不可變日誌；匯出到您的 SIEM。

保留事件回應和模型回滾的運行手冊。

實作藍圖：實現生產的 10 個步驟

定義前 3 個代理使用案例（IT、HR、銷售運營）和成功指標（偏轉率、CSAT、解決時間）。

啟動 AWS 帳戶、VPC、IAM 基準和 Bedrock 存取。

整合 SSO/SCIM；映射角色和批准流程。

在 Glean 中連接核心來源並驗證權限感知檢索。

使用 Step Functions 建立最小的協調服務（Lambda + API Gateway）。

實作 RAG 提示合約、引用和來源篩選。

端到端新增兩個工具（先唯讀，然後寫入並獲得批准）。

檢測記錄、評估和儀表板；建立一個包含 150 個問題的黃金集。

執行包含 50–100 個使用者的封閉 Beta 版；修復主要問題；設定 SLO。

廣泛推出；建立每週變更審查和每月模型評估。

使用 Glean 和 AWS 構建 AI 代理時的常見問題

如何減少企業代理中的幻覺？

透過從 Glean 檢索來建立模型，並強制執行嚴格的提示：僅使用提供的上下文並始終引用來源。拒絕信心不足的答案並提出澄清問題。當您依賴權限感知檢索時，大多數幻覺都會消失。

代理是否可以尊重跨應用程式的文件層級權限？

是的。當您使用 Glean 和 AWS 構建 AI 代理時，Glean 會在查詢時強制執行來自已連接應用程式的權限，因此代理只會看到使用者可以存取的內容。始終傳遞使用者的身分 Token 以維護監管鏈。

我應該從 AWS 上的哪些模型開始？

使用 Amazon Bedrock 存取多個模型。從一個強大的通用模型開始進行推理，並使用一個較小、更快的模型進行路由。根據您策劃的黃金集評估延遲、成本和準確性。

如何安全地讓代理在 Jira 或 ServiceNow 等系統中執行操作？

使用嚴格的結構描述、輸入驗證和批准工作流程包裝每個工具。記錄每個工具呼叫並儲存輸出以進行稽核。對於有影響的行動，需要人工確認步驟。

哪些指標證明代理已準備好投入生產？

追蹤基於事實的程度（引用率）、答案準確性、P95 延遲、解決/偏轉率以及每個已解決任務的成本。建立儀表板並每週對您的黃金集執行回歸檢查。

順便說一句：加速建構迴圈

值得注意的是：如果您的團隊經常進行原型設計，則用於研究和起草的 Copilot 可以加快設計文件、運行手冊和提示迭代的速度。諸如 Sider.AI 之類的工具可幫助團隊總結長篇執行緒、起草評估提示以及並排比較模型輸出 — 在調整如何使用 Glean 和 AWS 構建企業級 AI 代理時非常有用。

主要要點和後續步驟

使用 Glean 和 AWS 構建 AI 代理可為您提供身分感知檢索和企業級協調。

在進行花哨的規劃邏輯之前，請先從身分、治理和權限感知檢索開始。

使用 Bedrock 防護措施、嚴格的工具結構描述和人工參與的批准。

檢測所有內容：評估、稽核和成本控制。

本週的後續步驟：

起草您的前三個使用案例和成功指標。

在 Glean 中連接兩個核心來源；執行包含 150 個問題的評估。

使用一個唯讀工具啟動一個最小的 Lambda + Step Functions 協調器。

在試點擴展之前設定您的延遲和成本預算。

常見問題

Q1:企業級對 AWS 上的 AI 代理意味著什麼？它意味著安全、可稽核的代理，這些代理尊重 SSO 和文件權限、提供引用並在符合規範的基礎架構上運行。當您使用 Glean 和 AWS 構建 AI 代理時，您可以獲得權限感知檢索和雲端級別的可觀察性。

Q2:Glean 如何防止 AI 答案中的資料洩漏？ Glean 在查詢時強制執行來自每個已連接應用程式的文件層級權限。代理僅檢索使用者可以存取的內容，這在使用 Glean 和 AWS 構建企業級 AI 代理時至關重要。

Q3:我應該使用哪些 AWS 服務進行協調？使用 Lambda 或 ECS 進行執行、Step Functions 進行多步驟工作流程、Bedrock 進行模型和防護措施，以及 Secrets Manager 進行憑證管理。此堆疊是使用 Glean 和 AWS 構建 AI 代理的可靠基礎。

Q4:如何評估準確性並減少幻覺？建立問題的黃金集、要求引用並使用檢索增強生成。透過 Glean 和 AWS，權限感知檢索加上防護措施可顯著減少幻覺。

Q5:AI 代理可以安全地執行諸如建立工單或在 Slack 中發佈之類的操作嗎？可以 — 使用結構描述驗證的工具、對高影響行動的批准以及完整的稽核記錄。這是使用 Glean 和 AWS 構建企業級 AI 代理時的核心模式。