What does enterprise‑ready mean for AI agents on AWS?

It means secure, auditable agents that respect SSO and document permissions, provide citations, and run on compliant infrastructure. When you build AI agents with Glean and AWS, you get permission‑aware retrieval and cloud‑grade observability.

How does Glean prevent data leaks in AI answers?

Glean enforces document‑level permissions from each connected app at query time. The agent only retrieves content the user can access, which is critical when building enterprise‑ready AI agents with Glean and AWS.

Which AWS services should I use for orchestration?

Use Lambda or ECS for execution, Step Functions for multi‑step workflows, Bedrock for models and guardrails, and Secrets Manager for credentials. This stack is a proven base for building AI agents with Glean and AWS.

How do I evaluate accuracy and reduce hallucinations?

Create a gold set of questions, require citations, and use retrieval‑augmented generation. With Glean and AWS, permission‑aware retrieval plus guardrails reduces hallucinations significantly.

Can AI agents safely take actions like creating tickets or posting in Slack?

Yes—with schema‑validated tools, approvals for high‑impact actions, and full audit logging. This is a core pattern when you build enterprise‑ready AI agents with Glean and AWS.

Jak vytvořit AI agenty připravené pro podnikové nasazení s Glean a AWS

Proč selhávají podnikoví AI agenti – a jak je díky Glean a AWS připravit pro produkční nasazení

Zde je odvážné tvrzení: většina „AI agentů“ předváděných v zasedacích místnostech není skutečně připravena pro podnikové nasazení. Pod tlakem halucinují, s reálnými daty se lámou a nemohou projít auditem SOC 2. Pokud chcete AI, kterou vaše právní, bezpečnostní a IT týmy skutečně schválí – a kterou vaši zaměstnanci skutečně budou používat – potřebujete sestavení, které kombinuje podnikové vyhledávání (Glean), robustní cloudové primitivy (AWS) a disciplinovanou architekturu, která přežije škálování.

Tento průvodce vás krok za krokem provede tím, jak vytvářet AI agenty připravené pro podnikové nasazení s Glean a AWS – od vyhledávání s ohledem na identitu po bezpečné používání nástrojů, od rozpočtů latence po pozorovatelnost a od pilotního projektu po produkční nasazení.

Použijeme strukturu řízenou otázkami, abyste mohli přeskočit k tomu, co je nejdůležitější: přístup k datům, zabezpečení, architektura a zavádění.

Co myslíme AI agenty připravenými pro podnikové nasazení?

AI agent připravený pro podnikové nasazení není jen chatovací rozhraní. Je to zabezpečený, auditovatelný systém, který dokáže:

Odpovídat na otázky s využitím firemních znalostí s přísnými hranicemi oprávnění

Provádět akce prostřednictvím schválených nástrojů (např. tickety ServiceNow, problémy Jira, příspěvky Slack)

Přisuzovat zdroje a vysvětlovat zdůvodnění

Fungovat pod podnikovými kontrolami SSO, SCIM a DLP

Dodržovat požadavky na umístění dat, protokolování a uchovávání

Škálovat na tisíce uživatelů s předvídatelnou latencí a náklady

Zde se projevuje síla vytváření AI agentů s Glean a AWS: Glean poskytuje podnikové vyhledávání s ohledem na identitu a vyhledávání napříč aplikacemi, zatímco AWS přináší výpočetní, orchestraci, síťové a správní základy, které budete potřebovat v produkci.

Architektura v kostce: Glean + AWS

Představte si systém jako čtyři vrstvy:

Vrstva identity a přístupu (SSO, SCIM, oprávnění)

SSO přes Okta/Azure AD; SCIM pro provisioning; mapování rolí

Glean vynucuje oprávnění na úrovni dokumentů v době dotazu

AWS Cognito nebo přímé SAML/OIDC pro zprostředkování tokenů do služeb

Vrstva podnikového vyhledávání (Glean)

Jednotný index napříč Google Drive, Slack, Confluence, Jira, GitHub, Box, Notion a dalšími

Vyhledávání a hodnocení s ohledem na oprávnění

Přepisování dotazů, hybridní vyhledávání, sémantické přeřazování

Vrstva usuzování a orchestrace (AWS + modely)

AWS Lambda nebo ECS pro bezstavové kroky agenta

Amazon Bedrock pro spravovaný přístup k nejmodernějším modelům

Step Functions pro pracovní postupy s více nástroji a opakování

Secrets Manager/Parameter Store pro klíče a přihlašovací údaje nástrojů

Vrstva akcí a nástrojů (podnikové integrace)

Operace čtení a zápisu do systémů evidence (ServiceNow, Salesforce, Jira, Slack)

Ochranné prvky, schválení a pozorování pro každé volání nástroje

Auditní protokoly v CloudWatch/OpenSearch pro vysvětlitelnost

Základní sestavení: Jak vytvářet AI agenty připravené pro podnikové nasazení s Glean & AWS

Níže je uveden praktický, komplexní postup. Přizpůsobte jej svému stacku, ale zachovejte principy.

1) Nejprve nastavte identitu a správu

Zřiďte SSO přes Okta/Azure AD. Mapujte skupiny/role na oprávnění aplikací.

Použijte SCIM pro automatizovaný životní cyklus uživatelů (připojení/přesun/opuštění). Zrušení provisioningu se musí kaskádovitě šířit do agenta.

Konfigurujte AWS účty s rolemi IAM s nejnižšími potřebnými oprávněními. Oddělte dev, staging, prod. Vynucujte koncové body VPC pro Bedrock a tam, kde je to nutné, kontrolujte odchozí data.

Definujte uchovávání dat: jak dlouho uchovávat podněty, odpovědi a vektorové embeddingy. Používejte S3 buckety šifrované pomocí KMS pro protokoly a artefakty.

Tip: Berte identitu jako runtime signál. Agent musí předávat identitu koncového uživatele prostřednictvím Glean a nástrojů, aby kontroly oprávnění zůstaly neporušené.

2) Připojte zdroje v Glean a povolte vyhledávání s ohledem na oprávnění

Připojte Slack, Drive, Confluence, Notion, GitHub, Jira, Box a e-mail podle vašeho prostředí.

Nechte Glean procházet a indexovat s nejnižšími potřebnými oprávněními; potvrďte rozsahy zabezpečením.

Ověřte šíření oprávnění: uživatel by měl získat pouze to, co může zobrazit ve zdrojové aplikaci.

Vylaďte konfiguraci dotazů Glean: povolte přepisování dotazů, hybridní vyhledávání a sémantické přeřazování pro lepší přesnost.

Proč na tom záleží: Ve většině podniků je 70–90 % problému „halucinací“ ve skutečnosti problémem vyhledávání. S Glean AI agent načítá správné dokumenty na základě oprávnění uživatele, což masivně snižuje riziko a irelevantní odpovědi.

3) Vyberte modely přes Amazon Bedrock a nastavte ochranné prvky

Začněte s modelem pro všeobecné použití (např. Claude, Llama nebo Mistral přes Bedrock) a A/B testujte s doménovými podněty.

Použijte Bedrock Guardrails pro bezpečnostní filtry, kontroly injektáže podnětů a zásady obsahu.

Omezte odpovědi: vyžadujte citace podle ID/URL dokumentu, vynucujte schémata JSON pro výstupy nástrojů a nastavte maximální počet tokenů na krok.

Dodržujte rozpočet latence: cílová hodnota P95 end-to-end < 2,5 s pro Q&A a < 6 s pro pracovní postupy s použitím nástrojů.

4) Orchestrujte agenta na AWS

Vzor: Plánování ve stylu ReAct + používání nástrojů + uzemněné odpovídání.

Použijte Step Functions ke koordinaci kroků: vyhledávání → plánování → nástroj → validace → odpověď.

Volání usuzování běží v Lambda nebo ECS; vyberte Lambda pro nárazovou návštěvnost, ECS pro trvalou propustnost.

Adaptéry nástrojů (Jira, Slack, ServiceNow) jsou bezstavové Lambdy s tajemstvími v rozsahu IAM v AWS Secrets Manager.

Ukládejte krátkodobý stav konverzace v DynamoDB s TTL; dlouhodobé analýzy v S3/Glue/Athena.

5) Implementujte generování rozšířené o vyhledávání (RAG) s Glean

Dotazujte Glean s tokenem identity uživatele a otázkou uživatele.

Získejte top-k výsledků (např. hybridní: k=10 sémantických + 10 klíčových slov) s ohledem na oprávnění.

Přeřaďte s relevancí Glean; předejte modelu pouze nejlepší, deduplikované části.

Vyžadujte, aby agent citoval zdroje a zahrnoval skóre spolehlivosti.

Kostra podnětu:

Systém: „Jste uzemněný podnikový asistent. Používejte pouze poskytnutý kontext. Pokud je irelevantní, zeptejte se na doplňující otázky. Vždy citujte zdroje podle názvu a odkazu.“

Nástroje: „Můžete volat Jira_CreateIssue, Slack_PostMessage, ServiceNow_CreateIncident. Jednejte až po potvrzení s uživatelem, pokud runbook nepovoluje automatizaci.“

6) Přidejte bezpečné používání nástrojů a schválení

Zabalte každý nástroj validací parametrů a omezením rychlosti.

Vyžadujte lidské potvrzení nebo schválení manažerem pro akce s dopadem (např. zajištění přístupu, uzavření P1s).

Protokolujte každé volání nástroje (kdo, co, kdy, vstupní schéma, výstup) do CloudWatch a S3 pro audity.

Pro příspěvky Slack/Teams podporujte „režim konceptu“ pro náhled před odesláním.

7) Pozorovatelnost, vyhodnocování a kontrola driftu

Zachyťte podněty, úryvky kontextu, citace a odpovědi s redakcí tam, kde je to potřeba.

Použijte panely OpenSearch ke sledování precision@k, uzemnění a míry odklonu.

Spouštějte offline vyhodnocení: sestavte zlatý soubor 100–300 otázek specifických pro organizaci s očekávanými odpověďmi a požadovanými zdroji.

Naplánujte kanárky pro detekci driftu konektoru nebo oprávnění (např. změněné kanály Slack, migrace disku).

8) Ladění výkonu a nákladů

Ukládejte dotazy Glean do mezipaměti pro uživatele pro horká témata (např. zásady HR) s krátkými TTL.

Používejte menší modely pro směrování, větší modely pouze pro obtížné dotazy nebo plány s více nástroji.

Hromadné přeřazování, když je to možné; komprimujte kontext; používejte deduplikaci chunků.

Sledujte náklady na vyřešený úkol; nastavte kvóty na organizaci a na skupinu uživatelů.

Příklad: Podnikový IT asistent vytvořený pomocí Glean a AWS

Projděme si konkrétní scénář, který ukazuje, jak vytvářet AI agenty připravené pro podnikové nasazení s Glean a AWS.

Případ použití: Třídění a řešení IT podpory.

Uživatel se ptá: „VPN selhává na macOS 14 po aktualizaci – existuje nějaká oprava?“

Agent směruje na stopu runbooku IT.

Vyhledávání: Dotazuje Glean s identitou uživatele a načítá runbook VPN (Confluence), vlákno Slack z #it-support a dokument zásad Jamf. Zvažují se pouze zdroje, ke kterým má uživatel přístup.

Plánování: Agent navrhuje kroky: sdílet opravu, zkontrolovat shodu zařízení prostřednictvím Jamf, a pokud se problém nevyřeší, otevřít incident ServiceNow.

Volání nástrojů: Čte stav Jamf (pouze pro čtení), navrhuje zprávu s opravou a požádá uživatele o potvrzení eskalace. S potvrzením vytvoří incident se správnou šablonou.

Odpověď: Poskytuje stručné shrnutí opravy s citacemi runbooku a vlákna Slack, vše v rámci rozsahu oprávnění uživatele.

Proč to funguje: Agent je uzemněn v kontextu vyhledávání s ohledem na oprávnění z Glean a AWS zajišťuje provádění, schválení a protokolování.

Kontrolní seznam zabezpečení a dodržování předpisů (nepřeskakujte)

Hranice dat

Uchovávejte kontext vyhledávání na straně serveru; nevystavujte nezpracovaný obsah dokumentu klientovi.

Šifrujte v klidovém stavu pomocí KMS; vynucujte TLS 1.2+ při přenosu.

Identita

Předávejte identitu uživatele do Glean a nástrojů; nikdy nepoužívejte sdílenou identitu robota pro vyhledávání.

Mapujte RBAC ze skupin IdP na rozsahy nástrojů.

Správa modelu

Povolte Bedrock Guardrails; nepovolujte tajemství v podnětech.

Redigujte PII tam, kde je to nutné, a dokumentujte okna uchovávání.

Auditování

Neměnné protokoly do S3 s Object Lock; exportujte do svého SIEM.

Uchovávejte runbook pro reakci na incidenty a vrácení modelu.

Plán implementace: 10 kroků do produkce

Definujte 3 nejlepší případy použití agenta (IT, HR, Sales ops) a metriky úspěchu (míra odklonu, CSAT, doba do vyřešení).

Postavte AWS účty, VPC, IAM baseline a přístup k Bedrock.

Integrujte SSO/SCIM; mapujte role a schvalovací postupy.

Připojte základní zdroje v Glean a ověřte vyhledávání s ohledem na oprávnění.

Vytvořte minimální orchestraci službu (Lambda + API Gateway) s Step Functions.

Implementujte kontrakt podnětu RAG, citace a filtrování zdrojů.

Přidejte dva nástroje end-to-end (nejprve pouze pro čtení, poté zápis se schválením).

Nástroj pro protokolování, vyhodnocování a panely; vytvořte zlatý soubor se 150 otázkami.

Spusťte uzavřenou beta verzi s 50–100 uživateli; opravte hlavní problémy; nastavte SLO.

Zaveďte obecně; zaveďte týdenní kontrolu změn a měsíční vyhodnocování modelu.

Často kladené otázky při vytváření AI agentů s Glean a AWS

Jak snížím halucinace v podnikových agentech?

Uzemněte model vyhledáváním z Glean a vynucujte striktní podnět: používejte pouze poskytnutý kontext a vždy citujte zdroje. Odmítněte odpovědi s nízkou spolehlivostí a ptejte se na objasňující otázky. Většina halucinací zmizí, když se spolehnete na vyhledávání s ohledem na oprávnění.

Může agent respektovat oprávnění na úrovni dokumentu napříč aplikacemi?

Ano. Když vytváříte AI agenty s Glean a AWS, Glean vynucuje oprávnění z připojených aplikací v době dotazu, takže agent vidí pouze to, k čemu má uživatel přístup. Vždy předejte token identity uživatele, abyste zachovali řetězec odpovědnosti.

S jakými modely bych měl začít na AWS?

Použijte Amazon Bedrock pro přístup k více modelům. Začněte se silným obecným modelem pro usuzování a menším, rychlejším modelem pro směrování. Vyhodnoťte latenci, náklady a přesnost oproti svému zlatému souboru.

Jak mohu bezpečně nechat agenty provádět akce v systémech, jako je Jira nebo ServiceNow?

Zabalte každý nástroj striktními schématy, ověřováním vstupu a schvalovacími pracovními postupy. Protokolujte každé volání nástroje a ukládejte výstupy pro audit. Pro akce s dopadem vyžadujte krok lidského potvrzení.

Jaké metriky prokazují, že je agent připraven pro produkční nasazení?

Sledujte uzemnění (míra citací), přesnost odpovědí, latenci P95, míru vyřešení/odklonu a náklady na vyřešený úkol. Vytvořte panely a spouštějte týdenní regresní kontroly na svém zlatém souboru.

Mimochodem: urychlení smyčky sestavení

Stojí za zmínku: pokud váš tým často vytváří prototypy, může kopilot pro výzkum a vytváření urychlit návrh dokumentů, runbooků a iterací podnětů. Nástroje jako Sider.AI pomáhají týmům shrnovat dlouhé vlákna, navrhovat podněty pro vyhodnocení a porovnávat výstupy modelů vedle sebe – užitečné, když ladíte, jak vytvářet AI agenty připravené pro podnikové nasazení s Glean a AWS.

Klíčové poznatky a další kroky

Vytváření AI agentů s Glean a AWS vám poskytuje vyhledávání s ohledem na identitu a orchestraci na podnikové úrovni.

Začněte s identitou, správou a vyhledáváním s ohledem na oprávnění před složitou logikou plánování.

Používejte ochranné prvky Bedrock, striktní schémata nástrojů a schválení s lidmi v cyklu.

Instrumentujte vše: vyhodnocování, audity a kontroly nákladů.

Další kroky tento týden:

Navrhněte své tři nejlepší případy použití a metriky úspěchu.

Připojte dva základní zdroje v Glean; spusťte vyhodnocení se 150 otázkami.

Postavte minimální orchestrátor Lambda + Step Functions s jedním nástrojem pouze pro čtení.

Nastavte si rozpočty latence a nákladů před rozšířením pilotního projektu.

FAQ

Q1: Co znamená připraveno pro podnik pro AI agenty na AWS? Znamená to zabezpečené, auditovatelné agenty, kteří respektují SSO a oprávnění k dokumentům, poskytují citace a běží na infrastruktuře, která splňuje požadavky na dodržování předpisů. Když vytváříte AI agenty s Glean a AWS, získáte vyhledávání s ohledem na oprávnění a pozorovatelnost na cloudové úrovni.

Q2: Jak Glean zabraňuje únikům dat v odpovědích AI? Glean vynucuje oprávnění na úrovni dokumentu z každé připojené aplikace v době dotazu. Agent načítá pouze obsah, ke kterému má uživatel přístup, což je kritické při vytváření AI agentů připravených pro podnikové nasazení s Glean a AWS.

Q3: Jaké služby AWS bych měl použít pro orchestraci? Použijte Lambda nebo ECS pro provádění, Step Functions pro pracovní postupy s více kroky, Bedrock pro modely a ochranné prvky a Secrets Manager pro přihlašovací údaje. Tento stack je osvědčeným základem pro vytváření AI agentů s Glean a AWS.

Q4: Jak vyhodnotím přesnost a snížím halucinace? Vytvořte zlatý soubor otázek, vyžadujte citace a používejte generování rozšířené o vyhledávání. S Glean a AWS snižuje vyhledávání s ohledem na oprávnění plus ochranné prvky halucinace významně.

Q5: Mohou AI agenti bezpečně provádět akce, jako je vytváření ticketů nebo zveřejňování příspěvků ve Slacku? Ano – s nástroji s ověřeným schématem, schváleními pro akce s vysokým dopadem a úplným protokolováním auditu. Toto je základní vzor, když vytváříte AI agenty připravené pro podnikové nasazení s Glean a AWS.