Sider.ai
  • 聊天
  • Wisebase
  • 工具
  • 瀏覽器插件
  • 客户端
  • 定價
立即下載
登入

透過 Sider 更快學習、更深入思考、更聰明成長。

產品
應用程式
  • 擴充功能
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
工具
  • 網站產生器New
  • AI 投影片New
  • AI 論文寫作
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI 圖像生成器
  • 意大利腦洞
  • 背景移除器
  • 背景更換器
  • 照片橡皮擦
  • 文字移除器
  • 修補
  • 圖像升級器
  • 創建
  • AI 翻譯器
  • 圖像翻譯器
  • PDF 翻譯器
Sider
  • 聯絡我們
  • 幫助中心
  • 下載
  • 定價
  • 教育優惠
  • 最新消息
  • 部落格
  • 社群
  • 合作夥伴
  • 聯盟
  • 邀請
©2026 版權所有
使用條款
隱私政策
  • 首頁
  • 部落格
  • AI 工具
  • 如何使用 Glean 和 AWS 構建企業級 AI 代理

如何使用 Glean 和 AWS 構建企業級 AI 代理

更新於 2025年10月23日

10 分鐘


為何企業級 AI 代理會失敗 — 以及如何透過 Glean 和 AWS 使其達到可生產狀態

以下是一個大膽的聲明:在會議室演示的大多數「AI 代理」並非真正具備企業級水準。它們在高壓下會產生幻覺、在真實數據上會崩潰,並且無法通過 SOC 2 稽核。如果您想要您的法律、安全和 IT 團隊實際上會批准,並且您的員工實際上會使用的 AI,您需要一個結合了企業級檢索 (Glean)、穩健的雲端基礎元件 (AWS) 以及能夠經受擴展考驗的嚴謹架構的建構方案。
本指南將逐步引導您如何使用 Glean 和 AWS 構建企業級 AI 代理 — 從身分感知檢索到安全工具使用,從延遲預算到可觀察性,以及從試點到生產。
我們將使用以問題為導向的結構,以便您可以跳到最重要的部分:資料存取、安全性、架構和推出。

我們所說的企業級 AI 代理是什麼意思?

企業級 AI 代理不僅僅是一個聊天介面。它是一個安全、可稽核的系統,可以:
  • 使用公司知識回答問題,並具有嚴格的權限邊界
  • 透過批准的工具執行操作(例如,ServiceNow 工單、Jira 問題、Slack 貼文)
  • 歸屬來源並解釋推理
  • 在企業 SSO、SCIM 和 DLP 控制下運作
  • 符合資料落地、記錄和保留要求
  • 以可預測的延遲和成本擴展到數千名用戶
這正是使用 Glean 和 AWS 構建 AI 代理的優勢所在:Glean 提供跨應用程式的身分感知企業搜尋和檢索,而 AWS 帶來您在生產環境中所需的計算、協調、網路和治理基礎。

架構概覽:Glean + AWS

將系統視為四個層:
  1. 身分與存取層(SSO、SCIM、權限)
  • 透過 Okta/Azure AD 進行 SSO;SCIM 用於配置;角色映射
  • Glean 在查詢時強制執行文件層級權限
  • AWS Cognito 或直接 SAML/OIDC 將 Token 轉移到服務
  1. 企業檢索層 (Glean)
  • 跨 Google Drive、Slack、Confluence、Jira、GitHub、Box、Notion 等的統一索引
  • 權限感知檢索和排名
  • 查詢重寫、混合搜尋、語義重新排序
  1. 推理與協調層 (AWS + 模型)
  • AWS Lambda 或 ECS 用於無狀態代理步驟
  • Amazon Bedrock 用於管理對前沿模型的存取
  • Step Functions 用於多工具工作流程和重試
  • Secrets Manager/Parameter Store 用於金鑰和工具憑證
  1. 操作與工具層(企業整合)
  • 對記錄系統(ServiceNow、Salesforce、Jira、Slack)的讀取和寫入操作
  • 每個工具呼叫的防護措施、批准和觀察
  • CloudWatch/OpenSearch 中的稽核日誌,以實現可解釋性

核心建構:如何使用 Glean 和 AWS 構建企業級 AI 代理

以下是一個實用、端到端的路徑。請根據您的堆疊進行調整,但請記住這些原則。

1) 首先設定身分和治理

  • 透過 Okta/Azure AD 建立 SSO。將群組/角色映射到應用程式權限。
  • 使用 SCIM 進行自動化的使用者生命週期管理(加入/調動/離職)。取消配置必須級聯到代理。
  • 使用最小權限 IAM 角色配置 AWS 帳戶。分離開發、測試和生產環境。在需要時,對 Bedrock 實施 VPC 端點和資料輸出控制。
  • 定義資料保留:提示、回應和向量嵌入的儲存時間。對日誌和工件使用 KMS 加密的 S3 儲存桶。
提示:將身分視為運行時訊號。代理必須將最終使用者的身分傳遞到 Glean 和工具,以使權限檢查保持完整。

2) 在 Glean 中連接來源並啟用權限感知檢索

  • 根據您的足跡連接 Slack、Drive、Confluence、Notion、GitHub、Jira、Box 和電子郵件。
  • 讓 Glean 以最小權限爬取和建立索引;與安全性確認範圍。
  • 驗證權限傳播:使用者應僅檢索他們可以在來源應用程式中查看的內容。
  • 調整 Glean 查詢配置:啟用查詢重寫、混合檢索和語義重新排序以獲得更高的精確度。
重要原因:在大多數企業中,70–90% 的「幻覺」問題實際上是一個檢索問題。透過 Glean,AI 代理會根據使用者的權限檢索正確的文件,從而大幅降低風險和無關的回覆。

3) 透過 Amazon Bedrock 選擇模型並設定防護措施

  • 從通用模型開始(例如,透過 Bedrock 的 Claude、Llama 或 Mistral),並根據領域提示進行 A/B 測試。
  • 使用 Bedrock Guardrails 進行安全過濾、提示注入檢查和內容策略。
  • 約束回應:要求按文件 ID/URL 引用,對工具輸出強制執行 JSON 結構描述,並設定每個步驟的最大 Token 數。
  • 保持延遲預算:目標是 Q&A 的 P95 端到端 < 2.5 秒,工具使用流程的 P95 端到端 < 6 秒。

4) 在 AWS 上協調代理

模式:ReAct 風格的規劃 + 工具使用 + 基於事實的回答。
  • 使用 Step Functions 協調步驟:檢索 → 規劃 → 工具 → 驗證 → 回答。
  • 推理呼叫在 Lambda 或 ECS 中執行;對於突發流量,選擇 Lambda;對於持續的輸送量,選擇 ECS。
  • 工具轉接器(Jira、Slack、ServiceNow)是無狀態 Lambda,在 AWS Secrets Manager 中具有 IAM 範圍的密碼。
  • 將短期對話狀態儲存在具有 TTL 的 DynamoDB 中;將長期分析儲存在 S3/Glue/Athena 中。

5) 使用 Glean 實作檢索增強生成 (RAG)

  • 使用使用者的身分 Token 和使用者的問題查詢 Glean。
  • 檢索前 k 個結果(例如,混合:k=10 語義 + 10 個關鍵字),並遵守權限。
  • 使用 Glean 的相關性重新排序;僅將頂部、去重的區塊傳遞給模型。
  • 要求代理引用來源並包含信心分數。
提示框架:
  • 系統:「您是一位基於事實的企業助理。僅使用提供的上下文。如果無關,請提出後續問題。始終按標題和連結引用來源。」
  • 工具:「您可以呼叫 Jira_CreateIssue、Slack_PostMessage、ServiceNow_CreateIncident。除非運行手冊授權自動化,否則僅在與使用者確認後才採取行動。」

6) 新增安全工具使用和批准

  • 使用參數驗證和速率限制包裝每個工具。
  • 對於有影響的行動(例如,配置存取權限、關閉 P1),需要人工確認或經理批准。
  • 將每個工具呼叫(誰、什麼、何時、輸入結構描述、輸出)記錄到 CloudWatch 和 S3 以進行稽核。
  • 對於 Slack/Teams 貼文,支援「草稿模式」以在傳送前預覽。

7) 可觀察性、評估和漂移控制

  • 捕獲提示、上下文程式碼片段、引用和回應,並在需要時進行編輯。
  • 使用 OpenSearch 儀表板監控 precision@k、基於事實的程度和偏轉率。
  • 執行離線評估:策劃一組包含預期答案和所需來源的 100–300 個特定於組織的問題。
  • 排程 Canary 以檢測連接器或權限漂移(例如,已更改的 Slack 頻道、磁碟機遷移)。

8) 效能和成本調整

  • 為熱門主題(例如,HR 政策)快取每個使用者的 Glean 查詢,並使用較短的 TTL。
  • 對路由使用較小的模型,僅對難以處理的查詢或多工具計畫使用較大的模型。
  • 盡可能批量重新排序;壓縮上下文;使用區塊重複資料刪除。
  • 追蹤每個已解決任務的成本;設定每個組織和每個使用者群組的配額。

範例:使用 Glean 和 AWS 建構的企業 IT 助理

讓我們來看一個具體的場景,展示如何使用 Glean 和 AWS 構建企業級 AI 代理。
使用案例:IT 支援分流和解決。
  • 使用者詢問:「更新後 macOS 14 上的 VPN 失敗 — 有沒有解決方法?」
  • 代理將路由到 IT 運行手冊追蹤。
  • 檢索:使用使用者的身分查詢 Glean,並獲取 VPN 運行手冊 (Confluence)、來自 #it‑support 的 Slack 執行緒和 Jamf 策略文件。僅考慮使用者可以存取的資源。
  • 規劃:代理建議步驟:分享修復程式、透過 Jamf 檢查裝置合規性,如果問題未解決,則開啟 ServiceNow 事件。
  • 工具呼叫:讀取 Jamf 狀態(唯讀)、起草修復訊息,並要求使用者確認升級。在確認後,使用正確的範本建立事件。
  • 回答:提供簡明的修復摘要,其中包含對運行手冊和 Slack 執行緒的引用,所有內容都在使用者的權限範圍內。
有效的原因:代理基於 Glean 的權限感知檢索,而 AWS 處理執行、批准和記錄。

安全性和合規性檢查表(請勿跳過此步驟)

  • 資料邊界
  • 將檢索上下文保留在伺服器端;不要將原始文件內容暴露給用戶端。
  • 使用 KMS 靜態加密;在傳輸中強制執行 TLS 1.2+。
  • 身分
  • 將使用者身分傳遞給 Glean 和工具;切勿使用共用 Bot 身分進行檢索。
  • 將 RBAC 從 IdP 群組映射到工具範圍。
  • 模型治理
  • 啟用 Bedrock Guardrails;不允許在提示中使用密碼。
  • 在需要時編輯 PII 並記錄保留期限。
  • 稽核
  • 使用物件鎖定的 S3 不可變日誌;匯出到您的 SIEM。
  • 保留事件回應和模型回滾的運行手冊。

實作藍圖:實現生產的 10 個步驟

  1. 定義前 3 個代理使用案例(IT、HR、銷售運營)和成功指標(偏轉率、CSAT、解決時間)。
  1. 啟動 AWS 帳戶、VPC、IAM 基準和 Bedrock 存取。
  1. 整合 SSO/SCIM;映射角色和批准流程。
  1. 在 Glean 中連接核心來源並驗證權限感知檢索。
  1. 使用 Step Functions 建立最小的協調服務(Lambda + API Gateway)。
  1. 實作 RAG 提示合約、引用和來源篩選。
  1. 端到端新增兩個工具(先唯讀,然後寫入並獲得批准)。
  1. 檢測記錄、評估和儀表板;建立一個包含 150 個問題的黃金集。
  1. 執行包含 50–100 個使用者的封閉 Beta 版;修復主要問題;設定 SLO。
  1. 廣泛推出;建立每週變更審查和每月模型評估。

使用 Glean 和 AWS 構建 AI 代理時的常見問題

如何減少企業代理中的幻覺?

透過從 Glean 檢索來建立模型,並強制執行嚴格的提示:僅使用提供的上下文並始終引用來源。拒絕信心不足的答案並提出澄清問題。當您依賴權限感知檢索時,大多數幻覺都會消失。

代理是否可以尊重跨應用程式的文件層級權限?

是的。當您使用 Glean 和 AWS 構建 AI 代理時,Glean 會在查詢時強制執行來自已連接應用程式的權限,因此代理只會看到使用者可以存取的內容。始終傳遞使用者的身分 Token 以維護監管鏈。

我應該從 AWS 上的哪些模型開始?

使用 Amazon Bedrock 存取多個模型。從一個強大的通用模型開始進行推理,並使用一個較小、更快的模型進行路由。根據您策劃的黃金集評估延遲、成本和準確性。

如何安全地讓代理在 Jira 或 ServiceNow 等系統中執行操作?

使用嚴格的結構描述、輸入驗證和批准工作流程包裝每個工具。記錄每個工具呼叫並儲存輸出以進行稽核。對於有影響的行動,需要人工確認步驟。

哪些指標證明代理已準備好投入生產?

追蹤基於事實的程度(引用率)、答案準確性、P95 延遲、解決/偏轉率以及每個已解決任務的成本。建立儀表板並每週對您的黃金集執行回歸檢查。

順便說一句:加速建構迴圈

值得注意的是:如果您的團隊經常進行原型設計,則用於研究和起草的 Copilot 可以加快設計文件、運行手冊和提示迭代的速度。諸如 Sider.AI 之類的工具可幫助團隊總結長篇執行緒、起草評估提示以及並排比較模型輸出 — 在調整如何使用 Glean 和 AWS 構建企業級 AI 代理時非常有用。

主要要點和後續步驟

  • 使用 Glean 和 AWS 構建 AI 代理可為您提供身分感知檢索和企業級協調。
  • 在進行花哨的規劃邏輯之前,請先從身分、治理和權限感知檢索開始。
  • 使用 Bedrock 防護措施、嚴格的工具結構描述和人工參與的批准。
  • 檢測所有內容:評估、稽核和成本控制。
本週的後續步驟:
  • 起草您的前三個使用案例和成功指標。
  • 在 Glean 中連接兩個核心來源;執行包含 150 個問題的評估。
  • 使用一個唯讀工具啟動一個最小的 Lambda + Step Functions 協調器。
  • 在試點擴展之前設定您的延遲和成本預算。

常見問題

Q1:企業級對 AWS 上的 AI 代理意味著什麼? 它意味著安全、可稽核的代理,這些代理尊重 SSO 和文件權限、提供引用並在符合規範的基礎架構上運行。當您使用 Glean 和 AWS 構建 AI 代理時,您可以獲得權限感知檢索和雲端級別的可觀察性。
Q2:Glean 如何防止 AI 答案中的資料洩漏? Glean 在查詢時強制執行來自每個已連接應用程式的文件層級權限。代理僅檢索使用者可以存取的內容,這在使用 Glean 和 AWS 構建企業級 AI 代理時至關重要。
Q3:我應該使用哪些 AWS 服務進行協調? 使用 Lambda 或 ECS 進行執行、Step Functions 進行多步驟工作流程、Bedrock 進行模型和防護措施,以及 Secrets Manager 進行憑證管理。此堆疊是使用 Glean 和 AWS 構建 AI 代理的可靠基礎。
Q4:如何評估準確性並減少幻覺? 建立問題的黃金集、要求引用並使用檢索增強生成。透過 Glean 和 AWS,權限感知檢索加上防護措施可顯著減少幻覺。
Q5:AI 代理可以安全地執行諸如建立工單或在 Slack 中發佈之類的操作嗎? 可以 — 使用結構描述驗證的工具、對高影響行動的批准以及完整的稽核記錄。這是使用 Glean 和 AWS 構建企業級 AI 代理時的核心模式。

最新文章
如何精通 ChatPDF:從密集文件中更快獲取洞見

如何精通 ChatPDF:從密集文件中更快獲取洞見

快速且準確文件的最佳 X 自動翻譯替代方案

快速且準確文件的最佳 X 自動翻譯替代方案

三星 AI 翻譯在伊朗無法使用?實用解決方法

三星 AI 翻譯在伊朗無法使用?實用解決方法

波斯語翻譯工具:加速且精準工作的實用指南

波斯語翻譯工具:加速且精準工作的實用指南

深度且具引用的研究最佳Grok替代方案

深度且具引用的研究最佳Grok替代方案

您真正會用到的 AI 圖像生成器 15 大功能

您真正會用到的 AI 圖像生成器 15 大功能