Proč selhávají podnikoví AI agenti – a jak je díky Glean a AWS připravit pro produkční nasazení
Zde je odvážné tvrzení: většina „AI agentů“ předváděných v zasedacích místnostech není skutečně připravena pro podnikové nasazení. Pod tlakem halucinují, s reálnými daty se lámou a nemohou projít auditem SOC 2. Pokud chcete AI, kterou vaše právní, bezpečnostní a IT týmy skutečně schválí – a kterou vaši zaměstnanci skutečně budou používat – potřebujete sestavení, které kombinuje podnikové vyhledávání (Glean), robustní cloudové primitivy (AWS) a disciplinovanou architekturu, která přežije škálování.
Tento průvodce vás krok za krokem provede tím, jak vytvářet AI agenty připravené pro podnikové nasazení s Glean a AWS – od vyhledávání s ohledem na identitu po bezpečné používání nástrojů, od rozpočtů latence po pozorovatelnost a od pilotního projektu po produkční nasazení.
Použijeme strukturu řízenou otázkami, abyste mohli přeskočit k tomu, co je nejdůležitější: přístup k datům, zabezpečení, architektura a zavádění.
Co myslíme AI agenty připravenými pro podnikové nasazení?
AI agent připravený pro podnikové nasazení není jen chatovací rozhraní. Je to zabezpečený, auditovatelný systém, který dokáže:
- Odpovídat na otázky s využitím firemních znalostí s přísnými hranicemi oprávnění
- Provádět akce prostřednictvím schválených nástrojů (např. tickety ServiceNow, problémy Jira, příspěvky Slack)
- Přisuzovat zdroje a vysvětlovat zdůvodnění
- Fungovat pod podnikovými kontrolami SSO, SCIM a DLP
- Dodržovat požadavky na umístění dat, protokolování a uchovávání
- Škálovat na tisíce uživatelů s předvídatelnou latencí a náklady
Zde se projevuje síla vytváření AI agentů s Glean a AWS: Glean poskytuje podnikové vyhledávání s ohledem na identitu a vyhledávání napříč aplikacemi, zatímco AWS přináší výpočetní, orchestraci, síťové a správní základy, které budete potřebovat v produkci.
Architektura v kostce: Glean + AWS
Představte si systém jako čtyři vrstvy:
- Vrstva identity a přístupu (SSO, SCIM, oprávnění)
- SSO přes Okta/Azure AD; SCIM pro provisioning; mapování rolí
- Glean vynucuje oprávnění na úrovni dokumentů v době dotazu
- AWS Cognito nebo přímé SAML/OIDC pro zprostředkování tokenů do služeb
- Vrstva podnikového vyhledávání (Glean)
- Jednotný index napříč Google Drive, Slack, Confluence, Jira, GitHub, Box, Notion a dalšími
- Vyhledávání a hodnocení s ohledem na oprávnění
- Přepisování dotazů, hybridní vyhledávání, sémantické přeřazování
- Vrstva usuzování a orchestrace (AWS + modely)
- AWS Lambda nebo ECS pro bezstavové kroky agenta
- Amazon Bedrock pro spravovaný přístup k nejmodernějším modelům
- Step Functions pro pracovní postupy s více nástroji a opakování
- Secrets Manager/Parameter Store pro klíče a přihlašovací údaje nástrojů
- Vrstva akcí a nástrojů (podnikové integrace)
- Operace čtení a zápisu do systémů evidence (ServiceNow, Salesforce, Jira, Slack)
- Ochranné prvky, schválení a pozorování pro každé volání nástroje
- Auditní protokoly v CloudWatch/OpenSearch pro vysvětlitelnost
Základní sestavení: Jak vytvářet AI agenty připravené pro podnikové nasazení s Glean & AWS
Níže je uveden praktický, komplexní postup. Přizpůsobte jej svému stacku, ale zachovejte principy.
1) Nejprve nastavte identitu a správu
- Zřiďte SSO přes Okta/Azure AD. Mapujte skupiny/role na oprávnění aplikací.
- Použijte SCIM pro automatizovaný životní cyklus uživatelů (připojení/přesun/opuštění). Zrušení provisioningu se musí kaskádovitě šířit do agenta.
- Konfigurujte AWS účty s rolemi IAM s nejnižšími potřebnými oprávněními. Oddělte dev, staging, prod. Vynucujte koncové body VPC pro Bedrock a tam, kde je to nutné, kontrolujte odchozí data.
- Definujte uchovávání dat: jak dlouho uchovávat podněty, odpovědi a vektorové embeddingy. Používejte S3 buckety šifrované pomocí KMS pro protokoly a artefakty.
Tip: Berte identitu jako runtime signál. Agent musí předávat identitu koncového uživatele prostřednictvím Glean a nástrojů, aby kontroly oprávnění zůstaly neporušené.
2) Připojte zdroje v Glean a povolte vyhledávání s ohledem na oprávnění
- Připojte Slack, Drive, Confluence, Notion, GitHub, Jira, Box a e-mail podle vašeho prostředí.
- Nechte Glean procházet a indexovat s nejnižšími potřebnými oprávněními; potvrďte rozsahy zabezpečením.
- Ověřte šíření oprávnění: uživatel by měl získat pouze to, co může zobrazit ve zdrojové aplikaci.
- Vylaďte konfiguraci dotazů Glean: povolte přepisování dotazů, hybridní vyhledávání a sémantické přeřazování pro lepší přesnost.
Proč na tom záleží: Ve většině podniků je 70–90 % problému „halucinací“ ve skutečnosti problémem vyhledávání. S Glean AI agent načítá správné dokumenty na základě oprávnění uživatele, což masivně snižuje riziko a irelevantní odpovědi.
3) Vyberte modely přes Amazon Bedrock a nastavte ochranné prvky
- Začněte s modelem pro všeobecné použití (např. Claude, Llama nebo Mistral přes Bedrock) a A/B testujte s doménovými podněty.
- Použijte Bedrock Guardrails pro bezpečnostní filtry, kontroly injektáže podnětů a zásady obsahu.
- Omezte odpovědi: vyžadujte citace podle ID/URL dokumentu, vynucujte schémata JSON pro výstupy nástrojů a nastavte maximální počet tokenů na krok.
- Dodržujte rozpočet latence: cílová hodnota P95 end-to-end < 2,5 s pro Q&A a < 6 s pro pracovní postupy s použitím nástrojů.
4) Orchestrujte agenta na AWS
Vzor: Plánování ve stylu ReAct + používání nástrojů + uzemněné odpovídání.
- Použijte Step Functions ke koordinaci kroků: vyhledávání → plánování → nástroj → validace → odpověď.
- Volání usuzování běží v Lambda nebo ECS; vyberte Lambda pro nárazovou návštěvnost, ECS pro trvalou propustnost.
- Adaptéry nástrojů (Jira, Slack, ServiceNow) jsou bezstavové Lambdy s tajemstvími v rozsahu IAM v AWS Secrets Manager.
- Ukládejte krátkodobý stav konverzace v DynamoDB s TTL; dlouhodobé analýzy v S3/Glue/Athena.
5) Implementujte generování rozšířené o vyhledávání (RAG) s Glean
- Dotazujte Glean s tokenem identity uživatele a otázkou uživatele.
- Získejte top-k výsledků (např. hybridní: k=10 sémantických + 10 klíčových slov) s ohledem na oprávnění.
- Přeřaďte s relevancí Glean; předejte modelu pouze nejlepší, deduplikované části.
- Vyžadujte, aby agent citoval zdroje a zahrnoval skóre spolehlivosti.
Kostra podnětu:
- Systém: „Jste uzemněný podnikový asistent. Používejte pouze poskytnutý kontext. Pokud je irelevantní, zeptejte se na doplňující otázky. Vždy citujte zdroje podle názvu a odkazu.“
- Nástroje: „Můžete volat Jira_CreateIssue, Slack_PostMessage, ServiceNow_CreateIncident. Jednejte až po potvrzení s uživatelem, pokud runbook nepovoluje automatizaci.“
6) Přidejte bezpečné používání nástrojů a schválení
- Zabalte každý nástroj validací parametrů a omezením rychlosti.
- Vyžadujte lidské potvrzení nebo schválení manažerem pro akce s dopadem (např. zajištění přístupu, uzavření P1s).
- Protokolujte každé volání nástroje (kdo, co, kdy, vstupní schéma, výstup) do CloudWatch a S3 pro audity.
- Pro příspěvky Slack/Teams podporujte „režim konceptu“ pro náhled před odesláním.
7) Pozorovatelnost, vyhodnocování a kontrola driftu
- Zachyťte podněty, úryvky kontextu, citace a odpovědi s redakcí tam, kde je to potřeba.
- Použijte panely OpenSearch ke sledování precision@k, uzemnění a míry odklonu.
- Spouštějte offline vyhodnocení: sestavte zlatý soubor 100–300 otázek specifických pro organizaci s očekávanými odpověďmi a požadovanými zdroji.
- Naplánujte kanárky pro detekci driftu konektoru nebo oprávnění (např. změněné kanály Slack, migrace disku).
8) Ladění výkonu a nákladů
- Ukládejte dotazy Glean do mezipaměti pro uživatele pro horká témata (např. zásady HR) s krátkými TTL.
- Používejte menší modely pro směrování, větší modely pouze pro obtížné dotazy nebo plány s více nástroji.
- Hromadné přeřazování, když je to možné; komprimujte kontext; používejte deduplikaci chunků.
- Sledujte náklady na vyřešený úkol; nastavte kvóty na organizaci a na skupinu uživatelů.
Příklad: Podnikový IT asistent vytvořený pomocí Glean a AWS
Projděme si konkrétní scénář, který ukazuje, jak vytvářet AI agenty připravené pro podnikové nasazení s Glean a AWS.
Případ použití: Třídění a řešení IT podpory.
- Uživatel se ptá: „VPN selhává na macOS 14 po aktualizaci – existuje nějaká oprava?“
- Agent směruje na stopu runbooku IT.
- Vyhledávání: Dotazuje Glean s identitou uživatele a načítá runbook VPN (Confluence), vlákno Slack z #it-support a dokument zásad Jamf. Zvažují se pouze zdroje, ke kterým má uživatel přístup.
- Plánování: Agent navrhuje kroky: sdílet opravu, zkontrolovat shodu zařízení prostřednictvím Jamf, a pokud se problém nevyřeší, otevřít incident ServiceNow.
- Volání nástrojů: Čte stav Jamf (pouze pro čtení), navrhuje zprávu s opravou a požádá uživatele o potvrzení eskalace. S potvrzením vytvoří incident se správnou šablonou.
- Odpověď: Poskytuje stručné shrnutí opravy s citacemi runbooku a vlákna Slack, vše v rámci rozsahu oprávnění uživatele.
Proč to funguje: Agent je uzemněn v kontextu vyhledávání s ohledem na oprávnění z Glean a AWS zajišťuje provádění, schválení a protokolování.
Kontrolní seznam zabezpečení a dodržování předpisů (nepřeskakujte)
- Uchovávejte kontext vyhledávání na straně serveru; nevystavujte nezpracovaný obsah dokumentu klientovi.
- Šifrujte v klidovém stavu pomocí KMS; vynucujte TLS 1.2+ při přenosu.
- Předávejte identitu uživatele do Glean a nástrojů; nikdy nepoužívejte sdílenou identitu robota pro vyhledávání.
- Mapujte RBAC ze skupin IdP na rozsahy nástrojů.
- Povolte Bedrock Guardrails; nepovolujte tajemství v podnětech.
- Redigujte PII tam, kde je to nutné, a dokumentujte okna uchovávání.
- Neměnné protokoly do S3 s Object Lock; exportujte do svého SIEM.
- Uchovávejte runbook pro reakci na incidenty a vrácení modelu.
Plán implementace: 10 kroků do produkce
- Definujte 3 nejlepší případy použití agenta (IT, HR, Sales ops) a metriky úspěchu (míra odklonu, CSAT, doba do vyřešení).
- Postavte AWS účty, VPC, IAM baseline a přístup k Bedrock.
- Integrujte SSO/SCIM; mapujte role a schvalovací postupy.
- Připojte základní zdroje v Glean a ověřte vyhledávání s ohledem na oprávnění.
- Vytvořte minimální orchestraci službu (Lambda + API Gateway) s Step Functions.
- Implementujte kontrakt podnětu RAG, citace a filtrování zdrojů.
- Přidejte dva nástroje end-to-end (nejprve pouze pro čtení, poté zápis se schválením).
- Nástroj pro protokolování, vyhodnocování a panely; vytvořte zlatý soubor se 150 otázkami.
- Spusťte uzavřenou beta verzi s 50–100 uživateli; opravte hlavní problémy; nastavte SLO.
- Zaveďte obecně; zaveďte týdenní kontrolu změn a měsíční vyhodnocování modelu.
Často kladené otázky při vytváření AI agentů s Glean a AWS
Jak snížím halucinace v podnikových agentech?
Uzemněte model vyhledáváním z Glean a vynucujte striktní podnět: používejte pouze poskytnutý kontext a vždy citujte zdroje. Odmítněte odpovědi s nízkou spolehlivostí a ptejte se na objasňující otázky. Většina halucinací zmizí, když se spolehnete na vyhledávání s ohledem na oprávnění.
Může agent respektovat oprávnění na úrovni dokumentu napříč aplikacemi?
Ano. Když vytváříte AI agenty s Glean a AWS, Glean vynucuje oprávnění z připojených aplikací v době dotazu, takže agent vidí pouze to, k čemu má uživatel přístup. Vždy předejte token identity uživatele, abyste zachovali řetězec odpovědnosti.
S jakými modely bych měl začít na AWS?
Použijte Amazon Bedrock pro přístup k více modelům. Začněte se silným obecným modelem pro usuzování a menším, rychlejším modelem pro směrování. Vyhodnoťte latenci, náklady a přesnost oproti svému zlatému souboru.
Jak mohu bezpečně nechat agenty provádět akce v systémech, jako je Jira nebo ServiceNow?
Zabalte každý nástroj striktními schématy, ověřováním vstupu a schvalovacími pracovními postupy. Protokolujte každé volání nástroje a ukládejte výstupy pro audit. Pro akce s dopadem vyžadujte krok lidského potvrzení.
Jaké metriky prokazují, že je agent připraven pro produkční nasazení?
Sledujte uzemnění (míra citací), přesnost odpovědí, latenci P95, míru vyřešení/odklonu a náklady na vyřešený úkol. Vytvořte panely a spouštějte týdenní regresní kontroly na svém zlatém souboru.
Mimochodem: urychlení smyčky sestavení
Stojí za zmínku: pokud váš tým často vytváří prototypy, může kopilot pro výzkum a vytváření urychlit návrh dokumentů, runbooků a iterací podnětů. Nástroje jako Sider.AI pomáhají týmům shrnovat dlouhé vlákna, navrhovat podněty pro vyhodnocení a porovnávat výstupy modelů vedle sebe – užitečné, když ladíte, jak vytvářet AI agenty připravené pro podnikové nasazení s Glean a AWS. Klíčové poznatky a další kroky
- Vytváření AI agentů s Glean a AWS vám poskytuje vyhledávání s ohledem na identitu a orchestraci na podnikové úrovni.
- Začněte s identitou, správou a vyhledáváním s ohledem na oprávnění před složitou logikou plánování.
- Používejte ochranné prvky Bedrock, striktní schémata nástrojů a schválení s lidmi v cyklu.
- Instrumentujte vše: vyhodnocování, audity a kontroly nákladů.
Další kroky tento týden:
- Navrhněte své tři nejlepší případy použití a metriky úspěchu.
- Připojte dva základní zdroje v Glean; spusťte vyhodnocení se 150 otázkami.
- Postavte minimální orchestrátor Lambda + Step Functions s jedním nástrojem pouze pro čtení.
- Nastavte si rozpočty latence a nákladů před rozšířením pilotního projektu.
FAQ
Q1: Co znamená připraveno pro podnik pro AI agenty na AWS?
Znamená to zabezpečené, auditovatelné agenty, kteří respektují SSO a oprávnění k dokumentům, poskytují citace a běží na infrastruktuře, která splňuje požadavky na dodržování předpisů. Když vytváříte AI agenty s Glean a AWS, získáte vyhledávání s ohledem na oprávnění a pozorovatelnost na cloudové úrovni.
Q2: Jak Glean zabraňuje únikům dat v odpovědích AI?
Glean vynucuje oprávnění na úrovni dokumentu z každé připojené aplikace v době dotazu. Agent načítá pouze obsah, ke kterému má uživatel přístup, což je kritické při vytváření AI agentů připravených pro podnikové nasazení s Glean a AWS.
Q3: Jaké služby AWS bych měl použít pro orchestraci?
Použijte Lambda nebo ECS pro provádění, Step Functions pro pracovní postupy s více kroky, Bedrock pro modely a ochranné prvky a Secrets Manager pro přihlašovací údaje. Tento stack je osvědčeným základem pro vytváření AI agentů s Glean a AWS.
Q4: Jak vyhodnotím přesnost a snížím halucinace?
Vytvořte zlatý soubor otázek, vyžadujte citace a používejte generování rozšířené o vyhledávání. S Glean a AWS snižuje vyhledávání s ohledem na oprávnění plus ochranné prvky halucinace významně.
Q5: Mohou AI agenti bezpečně provádět akce, jako je vytváření ticketů nebo zveřejňování příspěvků ve Slacku?
Ano – s nástroji s ověřeným schématem, schváleními pro akce s vysokým dopadem a úplným protokolováním auditu. Toto je základní vzor, když vytváříte AI agenty připravené pro podnikové nasazení s Glean a AWS.