What does enterprise‑ready mean for AI agents on AWS?

It means secure, auditable agents that respect SSO and document permissions, provide citations, and run on compliant infrastructure. When you build AI agents with Glean and AWS, you get permission‑aware retrieval and cloud‑grade observability.

How does Glean prevent data leaks in AI answers?

Glean enforces document‑level permissions from each connected app at query time. The agent only retrieves content the user can access, which is critical when building enterprise‑ready AI agents with Glean and AWS.

Which AWS services should I use for orchestration?

Use Lambda or ECS for execution, Step Functions for multi‑step workflows, Bedrock for models and guardrails, and Secrets Manager for credentials. This stack is a proven base for building AI agents with Glean and AWS.

How do I evaluate accuracy and reduce hallucinations?

Create a gold set of questions, require citations, and use retrieval‑augmented generation. With Glean and AWS, permission‑aware retrieval plus guardrails reduces hallucinations significantly.

Can AI agents safely take actions like creating tickets or posting in Slack?

Yes—with schema‑validated tools, approvals for high‑impact actions, and full audit logging. This is a core pattern when you build enterprise‑ready AI agents with Glean and AWS.

Kako izraditi AI agente spremne za upotrebu u poduzećima s Gleanom i AWS-om

Zašto AI agenti za poduzeća ne uspijevaju — i kako ih uz pomoć <Glean> i <AWS> učiniti spremnima za produkciju

Evo smjele tvrdnje: većina "AI agenata" demonstriranih u upravnim odborima nisu istinski spremni za poduzeća. Haluciniraju pod pritiskom, kvare se na stvarnim podacima i ne mogu proći <SOC 2> reviziju. Ako želite <AI> koji će vaši pravni, sigurnosni i <IT> timovi zapravo odobriti — i koji će vaši zaposlenici zapravo koristiti — trebate izgradnju koja kombinira dohvat podataka razine poduzeća (<Glean>), robusne primitivne oblake (<AWS>) i discipliniranu arhitekturu koja preživi razmjer.

Ovaj vodič vas korak po korak vodi kroz izgradnju <AI> agenata spremnih za poduzeća s pomoću <Glean> i <AWS> — od dohvaćanja podataka svjesnog identiteta do sigurne upotrebe alata, od proračuna latencije do promatranja te od pilot projekta do produkcije.

Koristit ćemo strukturu vođenu pitanjima kako biste mogli preskočiti na ono što je najvažnije: pristup podacima, sigurnost, arhitektura i uvođenje.

Što podrazumijevamo pod <AI> agentima spremnima za poduzeća?

<AI> agent spreman za poduzeća nije samo sučelje za razgovor. To je siguran sustav koji se može revidirati i koji može:

Odgovarati na pitanja koristeći znanje tvrtke uz stroge granice dopuštenja

Poduzimati radnje putem odobrenih alata (npr. <ServiceNow> tiketi, <Jira> problemi, <Slack> objave)

Pripisivati izvore i objašnjavati obrazloženje

Raditi pod kontrolama <SSO>, <SCIM> i <DLP> za poduzeća

Poštivati zahtjeve za rezidentnost podataka, bilježenje i zadržavanje

Skalirati na tisuće korisnika s predvidljivom latencijom i troškovima

Ovdje izgradnja <AI> agenata s pomoću <Glean> i <AWS> dolazi do izražaja: <Glean> pruža pretraživanje i dohvaćanje podataka za poduzeća svjesno identiteta u svim aplikacijama, dok <AWS> donosi računalnu, orkestracijsku, mrežnu i upravljačku osnovu koja će vam trebati u produkciji.

Arhitektura na prvi pogled: <Glean> + <AWS>

Zamislite sustav kao četiri sloja:

Sloj identiteta i pristupa (<SSO>, <SCIM>, dopuštenja)

<SSO> putem <Okta/Azure AD>; <SCIM> za dodjelu resursa; mapiranja uloga

<Glean> provodi dopuštenja na razini dokumenta u vrijeme upita

<AWS Cognito> ili izravni <SAML/OIDC> za posredovanje tokena u usluge

Sloj dohvaćanja podataka za poduzeća (<Glean>)

Objedinjeni indeks u <Google Drive>, <Slack>, <Confluence>, <Jira>, <GitHub>, <Box>, <Notion> i još mnogo toga

Dohvaćanje i rangiranje svjesno dopuštenja

Ponovno pisanje upita, hibridno pretraživanje, semantičko preuređivanje

Sloj obrazloženja i orkestracije (<AWS> + modeli)

<AWS Lambda> ili <ECS> za korake agenta bez stanja

<Amazon Bedrock> za upravljani pristup vrhunskim modelima

Funkcije koraka za tijekove rada s više alata i ponovne pokušaje

Upravitelj tajni/Spremište parametara za ključeve i vjerodajnice alata

Sloj radnji i alata (integracije za poduzeća)

Operacije čitanja i pisanja u sustave zapisa (<ServiceNow>, <Salesforce>, <Jira>, <Slack>)

Zaštitne ograde, odobrenja i promatranje za svaki poziv alata

Zapisi revizije u <CloudWatch/OpenSearch> za objašnjivost

Osnovna izgradnja: Kako izgraditi <AI> agente spremne za poduzeća s pomoću <Glean> & <AWS>

U nastavku je praktičan put od početka do kraja. Prilagodite ga svom stogu, ali zadržite načela.

1) Prvo postavite identitet i upravljanje

Uspostavite <SSO> putem <Okta/Azure AD>. Mapirajte grupe/uloge u dopuštenja aplikacije.

Koristite <SCIM> za automatizirani životni ciklus korisnika (pridruživanje/premještanje/odlazak). Ukidanje resursa mora se prenijeti na agenta.

Konfigurirajte <AWS> račune s <IAM> ulogama s najmanjim privilegijama. Odvojite razvoj, postavljanje, produkciju. Prisilite <VPC> krajnje točke za <Bedrock> i kontrole izlaza podataka gdje je potrebno.

Definirajte zadržavanje podataka: koliko dugo pohranjivati upite, odgovore i vektorske ugradnje. Koristite <S3> spremnike šifrirane <KMS>-om za zapise i artefakte.

Savjet: Tretirajte identitet kao signal vremena izvođenja. Agent mora proslijediti identitet krajnjeg korisnika putem <Glean> i alata kako bi provjere dopuštenja ostale netaknute.

2) Povežite izvore u <Glean> i omogućite dohvaćanje podataka svjesno dopuštenja

Povežite <Slack>, <Drive>, <Confluence>, <Notion>, <GitHub>, <Jira>, <Box> i e-poštu prema svom otisku.

Dopustite <Glean> da pretražuje i indeksira s najmanjim privilegijama; potvrdite opsege sa sigurnošću.

Potvrdite širenje dopuštenja: korisnik bi trebao dohvatiti samo ono što može vidjeti u izvornoj aplikaciji.

Podesite konfiguraciju upita <Glean>: omogućite ponovno pisanje upita, hibridno dohvaćanje i semantičko preuređivanje za bolju preciznost.

Zašto je to važno: U većini poduzeća, 70–90% problema "halucinacija" zapravo je problem dohvaćanja podataka. S <Glean>, <AI> agent dohvaća prave dokumente uvjetovane dopuštenjima korisnika, masovno smanjujući rizik i irelevantne odgovore.

3) Odaberite modele putem <Amazon Bedrock> i postavite zaštitne ograde

Počnite s generalističkim modelom (npr. <Claude>, <Llama>, ili <Mistral> putem <Bedrock>) i <A/B> testirajte u odnosu na domenske upite.

Koristite <Bedrock Guardrails> za sigurnosne filtre, provjere ubrizgavanja upita i pravila o sadržaju.

Ograničite odgovore: zahtijevajte citate po <ID>-u dokumenta/<URL>-u, prisilite <JSON> sheme za izlaze alata i postavite maksimalni broj tokena po koraku.

Zadržite proračun latencije: ciljajte <P95> od kraja do kraja < 2,5 s za <Q&A> i < 6 s za tijekove upotrebe alata.

4) Orkestrirajte agenta na <AWS>

Uzorak: <ReAct>-stil planiranja + upotreba alata + utemeljeno odgovaranje.

Koristite funkcije koraka za koordinaciju koraka: dohvaćanje → planiranje → alat → provjera valjanosti → odgovor.

Pozivi za obrazloženje izvode se u <Lambda> ili <ECS>; odaberite <Lambda> za iznenadni promet, <ECS> za održivu propusnost.

Adapteri alata (<Jira>, <Slack>, <ServiceNow>) su <Lambdas> bez stanja s tajnama u <AWS Secrets Manageru> unutar opsega <IAM>.

Pohranite kratkotrajno stanje razgovora u <DynamoDB> s <TTL>; dugoročnu analitiku u <S3/Glue/Athena>.

5) Implementirajte generiranje obogaćeno dohvaćanjem (<RAG>) s pomoću <Glean>

Upitajte <Glean> s tokenom identiteta korisnika i pitanjem korisnika.

Dohvatite top-<k> rezultate (npr. hibridni: k=10 semantički + 10 ključnih riječi) poštujući dopuštenja.

Preuredite s relevantnošću <Glean>; proslijedite samo gornje, deduplicirane dijelove modelu.

Zahtijevajte od agenta da citira izvore i uključi ocjenu povjerenja.

Okvir upita:

Sustav: “Vi ste utemeljeni pomoćnik za poduzeća. Koristite samo navedeni kontekst. Ako je irelevantno, postavite dodatno pitanje. Uvijek citirajte izvore po naslovu i poveznici.”

Alati: “Možete pozvati <Jira_CreateIssue>, <Slack_PostMessage>, <ServiceNow_CreateIncident>. Djelujte tek nakon potvrde s korisnikom, osim ako radna knjiga ne odobrava automatizaciju.”

6) Dodajte sigurnu upotrebu alata i odobrenja

Omotajte svaki alat validacijom parametara i ograničenjem brzine.

Zahtijevajte potvrdu čovjeka ili odobrenje upravitelja za radnje s velikim utjecajem (npr. dodjeljivanje pristupa, zatvaranje <P1s>).

Zabilježite svaki poziv alata (tko, što, kada, ulazna shema, izlaz) u <CloudWatch> i <S3> za revizije.

Za objave na <Slack/Teams>, podržite “nacrtni način rada” za pregled prije slanja.

7) Promatranje, evaluacija i kontrola odstupanja

Snimite upite, isječke konteksta, citate i odgovore s redakcijom gdje je potrebno.

Koristite nadzorne ploče <OpenSearch> za praćenje preciznosti@k, utemeljenosti i stope odbijanja.

Izvodite izvanmrežne evaluacije: kurirajte zlatni skup od 100–300 pitanja specifičnih za organizaciju s očekivanim odgovorima i potrebnim izvorima.

Zakažite kanarince za otkrivanje konektora ili odstupanja dopuštenja (npr. promijenjeni <Slack> kanali, migracije pogona).

8) Podešavanje performansi i troškova

Spremite <Glean> upite u predmemoriju po korisniku za vruće teme (npr. <HR> politika) s kratkim <TTL>-ovima.

Koristite manje modele za usmjeravanje, veće modele samo za teške upite ili planove s više alata.

Grupno preuređivanje kada je moguće; komprimirajte kontekst; koristite deduplikaciju dijelova.

Pratite troškove po riješenom zadatku; postavite kvote po organizaciji i po korisničkoj grupi.

Primjer: <IT> pomoćnik za poduzeća izgrađen s <Glean> i <AWS>

Prođimo kroz konkretan scenarij koji pokazuje kako izgraditi <AI> agente spremne za poduzeća s pomoću <Glean> i <AWS>.

Slučaj upotrebe: <IT> podrška za trijažu i rješavanje.

Korisnik pita: “<VPN> ne radi na <macOS 14> nakon ažuriranja — postoji li popravak?”

Agent usmjerava na stazu <IT> radne knjige.

Dohvaćanje podataka: Upiti <Glean> s identitetom korisnika i dohvaća <VPN> radnu knjigu (<Confluence>), <Slack> nit iz <#it-support> i <Jamf> dokument o pravilima. Razmatraju se samo resursi kojima korisnik može pristupiti.

Planiranje: Agent predlaže korake: podijelite popravak, provjerite usklađenost uređaja putem <Jamf>, i ako se ne riješi, otvorite <ServiceNow> incident.

Pozivi alata: Čita <Jamf> status (samo za čitanje), izrađuje poruku za popravak i traži od korisnika da potvrdi eskalaciju. Uz potvrdu, stvara incident s pravim predloškom.

Odgovor: Pruža sažeti sažetak popravka s citatima na radnu knjigu i <Slack> nit, sve unutar opsega dopuštenja korisnika.

Zašto radi: Agent je utemeljen u dohvaćanju podataka svjesnom dopuštenja iz <Glean>, a <AWS> upravlja izvršavanjem, odobrenjima i bilježenjem.

Sigurnosna lista i lista usklađenosti (nemojte ovo preskočiti)

Granice podataka

Zadržite kontekst dohvaćanja na strani poslužitelja; nemojte izlagati sirovi sadržaj dokumenta klijentu.

Šifrirajte u mirovanju s <KMS>; prisilite <TLS 1.2+> u prijenosu.

Identitet

Proslijedite identitet korisnika <Glean> i alatima; nikada ne koristite zajednički identitet bota za dohvaćanje podataka.

Mapirajte <RBAC> iz <IdP> grupa u opsege alata.

Upravljanje modelom

Omogućite <Bedrock Guardrails>; ne dopustite tajne u upitima.

Redigirajte <PII> gdje je potrebno i dokumentirajte prozore zadržavanja.

Revizija

Nepromjenjivi zapisi u <S3> s zaključavanjem objekata; izvezite u svoj <SIEM>.

Zadržite radnu knjigu za odgovor na incidente i vraćanje modela.

Nacrt implementacije: 10 koraka do produkcije

Definirajte top 3 slučaja upotrebe agenta (<IT>, <HR>, prodajne operacije) i mjerne podatke uspjeha (stopa odbijanja, <CSAT>, vrijeme do rješenja).

Postavite <AWS> račune, <VPC>, <IAM> osnovne linije i pristup <Bedrock>.

Integrirajte <SSO/SCIM>; mapirajte uloge i tijekove odobrenja.

Povežite osnovne izvore u <Glean> i potvrdite dohvaćanje podataka svjesno dopuštenja.

Izgradite minimalnu uslugu orkestracije (<Lambda> + <API Gateway>) s funkcijama koraka.

Implementirajte <RAG> ugovor o upitu, citate i filtriranje izvora.

Dodajte dva alata od kraja do kraja (prvo samo za čitanje, zatim pisanje s odobrenjem).

Instrumentirajte bilježenje, evaluacije i nadzorne ploče; stvorite zlatni skup od 150 pitanja.

Pokrenite zatvorenu beta verziju s 50–100 korisnika; riješite glavne probleme; postavite <SLO>.

Široko se uvedite; uspostavite tjedni pregled promjena i mjesečnu evaluaciju modela.

Često postavljana pitanja pri izgradnji <AI> agenata s <Glean> i <AWS>

Kako smanjiti halucinacije u agentima za poduzeća?

Utemeljite model dohvaćanjem podataka iz <Glean> i prisilite strogi upit: koristite samo navedeni kontekst i uvijek citirajte izvore. Odbijte odgovore s niskim povjerenjem i postavite pitanja za pojašnjenje. Većina halucinacija pada kada se oslanjate na dohvaćanje podataka svjesno dopuštenja.

Može li agent poštivati dopuštenja na razini dokumenta u svim aplikacijama?

Da. Kada gradite <AI> agente s <Glean> i <AWS>, <Glean> provodi dopuštenja iz povezanih aplikacija u vrijeme upita, tako da agent vidi samo ono čemu korisnik može pristupiti. Uvijek proslijedite token identiteta korisnika kako biste održali lanac skrbništva.

S kojim modelima bih trebao početi na <AWS>?

Koristite <Amazon Bedrock> za pristup više modela. Počnite s jakim općim modelom za obrazloženje i manjim, bržim modelom za usmjeravanje. Procijenite latenciju, troškove i točnost u odnosu na svoj kurirani zlatni skup.

Kako sigurno dopustiti agentima da poduzimaju radnje u sustavima kao što su <Jira> ili <ServiceNow>?

Omotajte svaki alat strogim shemama, validacijom ulaza i tijekovima rada odobrenja. Zabilježite svaki poziv alata i pohranite izlaze za reviziju. Za radnje s velikim utjecajem, zahtijevajte korak potvrde čovjeka.

Koji metrički podaci dokazuju da je agent spreman za produkciju?

Pratite utemeljenost (stopa citiranja), točnost odgovora, <P95> latenciju, stopu rješenja/odbijanja i troškove po riješenom zadatku. Izgradite nadzorne ploče i izvodite tjedne provjere regresije na svom zlatnom skupu.

Usput: ubrzavanje petlje izgradnje

Vrijedi napomenuti: ako vaš tim često izrađuje prototipove, kopilot za istraživanje i izradu nacrta može ubrzati dokumente dizajna, radne knjige i ponavljanja upita. Alati kao što je {Sider.AI} pomažu timovima da sažmu duge niti, izrade nacrte upita za evaluaciju i uspoređuju izlaze modela jedan pored drugog—korisno kada ugađate kako izgraditi <AI> agente spremne za poduzeća s pomoću <Glean> i <AWS>.

Ključni zaključci i sljedeći koraci

Izgradnja <AI> agenata s <Glean> i <AWS> daje vam dohvaćanje podataka svjesno identiteta i orkestraciju razine poduzeća.

Počnite s identitetom, upravljanjem i dohvaćanjem podataka svjesnim dopuštenja prije logike složenog planiranja.

Koristite <Bedrock> zaštitne ograde, stroge sheme alata i odobrenja s ljudskim sudjelovanjem.

Instrumentirajte sve: evaluacije, revizije i kontrole troškova.

Sljedeći koraci ovaj tjedan:

Izradite nacrt svoja tri glavna slučaja upotrebe i mjerne podatke uspjeha.

Povežite dva osnovna izvora u <Glean>; pokrenite evaluaciju od 150 pitanja.

Postavite minimalni orkestrator <Lambda> + funkcije koraka s jednim alatom samo za čitanje.

Postavite proračune latencije i troškova prije nego što se pilot proširi.

Često postavljana pitanja

P1: Što znači spreman za poduzeća za <AI> agente na <AWS>? To znači sigurne agente koji se mogu revidirati i koji poštuju <SSO> i dopuštenja dokumenta, pružaju citate i rade na infrastrukturi koja je usklađena. Kada gradite <AI> agente s <Glean> i <AWS>, dobivate dohvaćanje podataka svjesno dopuštenja i vidljivost razine oblaka.

P2: Kako <Glean> sprječava curenje podataka u <AI> odgovorima? <Glean> provodi dopuštenja na razini dokumenta iz svake povezane aplikacije u vrijeme upita. Agent dohvaća samo sadržaj kojem korisnik može pristupiti, što je kritično pri izgradnji <AI> agenata spremnih za poduzeća s <Glean> i <AWS>.

P3: Koje <AWS> usluge trebam koristiti za orkestraciju? Koristite <Lambda> ili <ECS> za izvršavanje, funkcije koraka za tijekove rada s više koraka, <Bedrock> za modele i zaštitne ograde i upravitelj tajni za vjerodajnice. Ovaj stog je provjerena osnova za izgradnju <AI> agenata s <Glean> i <AWS>.

P4: Kako procijeniti točnost i smanjiti halucinacije? Stvorite zlatni skup pitanja, zahtijevajte citate i koristite generiranje obogaćeno dohvaćanjem. S <Glean> i <AWS>, dohvaćanje podataka svjesno dopuštenja plus zaštitne ograde značajno smanjuju halucinacije.

P5: Mogu li <AI> agenti sigurno poduzimati radnje poput stvaranja tiketa ili objavljivanja u <Slack>? Da—s alatima validiranim shemom, odobrenjima za radnje s velikim utjecajem i potpunim bilježenjem revizije. Ovo je osnovni uzorak kada gradite <AI> agente spremne za poduzeća s <Glean> i <AWS>.