Hvorfor AI-agenter i bedrifter mislykkes – og hvordan du gjør dem klare for produksjon med Glean og AWS
Her er en dristig påstand: De fleste «AI-agenter» som demonstreres i styrerom, er ikke virkelig klare for bedrifter. De hallusinerer under press, bryter sammen med reelle data og kan ikke bestå en SOC 2-revisjon. Hvis du vil ha AI som dine juridiske, sikkerhets- og IT-team faktisk vil godkjenne – og dine ansatte faktisk vil bruke – trenger du en konstruksjon som kombinerer henting av bedriftskvalitet (Glean), robuste skyprimitiver (AWS) og en disiplinert arkitektur som overlever skala.
Denne veiledningen går deg trinn for trinn gjennom hvordan du bygger bedriftsklare AI-agenter med Glean og AWS – fra identitetsbevisst henting til sikker bruk av verktøy, fra latensbudsjetter til observerbarhet, og fra pilot til produksjon.
Vi vil bruke en spørsmålsledet struktur slik at du kan hoppe til det som betyr mest: datatilgang, sikkerhet, arkitektur og utrulling.
Hva mener vi med bedriftsklare AI-agenter?
En bedriftsklar AI-agent er ikke bare et chat-grensesnitt. Det er et sikkert, reviderbart system som kan:
- Svare på spørsmål ved hjelp av bedriftens kunnskap med strenge tillatelsesgrenser
- Utfør handlinger gjennom godkjente verktøy (f.eks. ServiceNow-billetter, Jira-saker, Slack-innlegg)
- Attribuer kilder og forklare resonnement
- Fungere under bedriftens SSO-, SCIM- og DLP-kontroller
- Overholde krav til dataresidens, logging og oppbevaring
- Skalere til tusenvis av brukere med forutsigbar latens og kostnad
Det er her bygging av AI-agenter med Glean og AWS skinner: Glean gir identitetsbevisst bedriftssøk og henting på tvers av apper, mens AWS gir databehandlings-, orkestrerings-, nettverks- og styringsfundamentet du trenger i produksjon.
Arkitektur i et nøtteskall: Glean + AWS
Tenk på systemet som fire lag:
- Identitets- og tilgangslag (SSO, SCIM, tillatelser)
- SSO via Okta/Azure AD; SCIM for klargjøring; rolletilordninger
- Glean håndhever tillatelser på dokumentnivå ved spørretidspunkt
- AWS Cognito eller direkte SAML/OIDC for å formidle tokens til tjenester
- Bedriftshentingslag (Glean)
- Unified indeks på tvers av Google Drive, Slack, Confluence, Jira, GitHub, Box, Notion og mer
- Tillatelsesbevisst henting og rangering
- Omskriving av spørringer, hybridsøk, semantisk omrangering
- Resonnement- og orkestreringslag (AWS + modeller)
- AWS Lambda eller ECS for statsløse agenttrinn
- Amazon Bedrock for administrert tilgang til frontlinjemodeller
- Step Functions for arbeidsflyter med flere verktøy og forsøk
- Secrets Manager/Parameter Store for nøkler og verktøyopplysninger
- Handlings- og verktøylag (bedriftsintegrasjoner)
- Lese- og skriveoperasjoner til systemer (ServiceNow, Salesforce, Jira, Slack)
- Sikkerhetstiltak, godkjenninger og observasjon for hvert verktøykall
- Revisjonslogger i CloudWatch/OpenSearch for forklarbarhet
Kjernebygg: Hvordan bygge bedriftsklare AI-agenter med Glean & AWS
Nedenfor er en praktisk, ende-til-ende-sti. Tilpass for din stack, men behold prinsippene.
1) Sett opp identitet og styring først
- Etabler SSO via Okta/Azure AD. Kartlegg grupper/roller til apptillatelser.
- Bruk SCIM for automatisert brukerlivssyklus (nykommer/flytter/avslutter). Avklargjøring må kaskadere til agenten.
- Konfigurer AWS-kontoer med IAM-roller med minst mulig privilegium. Skill mellom utvikling, mellomtrinn, produksjon. Håndhev VPC-endepunkter for Bedrock og datakontroller der det er nødvendig.
- Definer dataoppbevaring: hvor lenge meldinger, svar og vektorinnbygginger skal lagres. Bruk KMS-krypterte S3-bøtter for logger og artefakter.
Tips: Behandle identitet som et kjøretidssignal. Agenten må sende sluttbrukerens identitet gjennom Glean og verktøy slik at tillatelseskontroller forblir intakte.
2) Koble til kilder i Glean og aktiver tillatelsesbevisst henting
- Koble til Slack, Drive, Confluence, Notion, GitHub, Jira, Box og e-post per ditt fotavtrykk.
- La Glean crawle og indeksere med minst mulig privilegium; bekreft omfang med sikkerhet.
- Valider tillatelsesoverføring: en bruker skal bare hente det de kan se i kildeappen.
- Juster Glean-spørringskonfigurasjon: aktiver omskriving av spørringer, hybridhenting og semantisk omrangering for bedre presisjon.
Hvorfor det er viktig: I de fleste bedrifter er 70–90 % av «hallusinasjonsproblemet» faktisk et hentingsproblem. Med Glean henter AI-agenten de riktige dokumentene betinget av brukerens tillatelser, noe som reduserer risiko og irrelevante svar betydelig.
3) Velg modeller via Amazon Bedrock og sett sikkerhetstiltak
- Start med en generalistmodell (f.eks. Claude, Llama eller Mistral via Bedrock) og A/B mot domenemeldinger.
- Bruk Bedrock Guardrails for sikkerhetsfiltre, meldingsinjeksjonskontroller og innholdspolicyer.
- Begrens svar: krev siteringer etter dokument-ID/URL, håndhev JSON-skjemaer for verktøyutdata og sett maks antall tokens per trinn.
- Hold et latensbudsjett: mål P95 ende-til-ende < 2,5 s for spørsmål og svar og < 6 s for arbeidsflyter med verktøybruk.
4) Orkestrer agenten på AWS
Mønster: ReAct-stil planlegging + verktøybruk + begrunnet besvarelse.
- Bruk Step Functions til å koordinere trinn: hent → planlegg → verktøy → valider → svar.
- Resonnementkall kjøres i Lambda eller ECS; velg Lambda for bursty trafikk, ECS for vedvarende gjennomstrømning.
- Verktøyadaptere (Jira, Slack, ServiceNow) er statsløse Lambdaer med IAM-omfattende hemmeligheter i AWS Secrets Manager.
- Lagre kortvarig samtale tilstand i DynamoDB med TTL; langsiktig analyse i S3/Glue/Athena.
5) Implementer hentingsutvidet generering (RAG) med Glean
- Spør Glean med brukerens identitetstoken og brukerens spørsmål.
- Hent topp-k resultater (f.eks. hybrid: k=10 semantisk + 10 søkeord) som respekterer tillatelser.
- Omranger med Gleans relevans; send bare de øverste, dupliserte bitene til modellen.
- Krev at agenten siterer kilder og inkluderer en konfidensscore.
Melding skjelett:
- System: «Du er en begrunnet bedriftsassistent. Bruk bare den oppgitte konteksten. Hvis irrelevant, still et oppfølgingsspørsmål. Siter alltid kilder etter tittel og lenke.»
- Verktøy: «Du kan kalle Jira_CreateIssue, Slack_PostMessage, ServiceNow_CreateIncident. Bare handle etter å ha bekreftet med brukeren med mindre en runbook autoriserer automatisering.»
6) Legg til sikker verktøybruk og godkjenninger
- Pakk hvert verktøy med parametervalidering og hastighetsbegrensning.
- Krev menneskelig bekreftelse eller ledergodkjenning for virkningsfulle handlinger (f.eks. klargjøring av tilgang, lukking av P1-er).
- Logg hvert verktøykall (hvem, hva, når, inndataskjema, utdata) til CloudWatch og S3 for revisjoner.
- For Slack/Teams-innlegg, støtt «utkastmodus» for forhåndsvisning før sending.
7) Observerbarhet, evaluering og kontroll av avvik
- Fang meldinger, kontekstutdrag, siteringer og svar med redigering der det er nødvendig.
- Bruk OpenSearch-dashbord for å overvåke presisjon@k, begrunnelse og avbøyningsfrekvens.
- Kjør offline evalueringer: kurater et gullsett med 100–300 organisasjonsspesifikke spørsmål med forventede svar og nødvendige kilder.
- Planlegg kanarifugler for å oppdage kontakt- eller tillatelsesavvik (f.eks. endrede Slack-kanaler, stasjonsmigreringer).
8) Ytelses- og kostnadsjustering
- Cache Glean-spørringer per bruker for populære emner (f.eks. HR-policy) med korte TTL-er.
- Bruk mindre modeller for ruting, større modeller bare for vanskelige spørringer eller planer med flere verktøy.
- Batch omrangering når det er mulig; komprimer kontekst; bruk bitreduplisering.
- Spor kostnad per løst oppgave; sett kvoter per organisasjon og per brukergruppe.
Eksempel: En IT-assistent for bedrifter bygget med Glean og AWS
La oss gå gjennom et konkret scenario som viser hvordan du bygger bedriftsklare AI-agenter med Glean og AWS.
Bruksområde: IT-support triage og løsning.
- Brukeren spør: «VPN mislykkes på macOS 14 etter oppdatering – noen løsning?»
- Agenten ruter til IT-runbook-sporet.
- Henting: Spør Glean med brukerens identitet og henter VPN-runbooken (Confluence), en Slack-tråd fra #it-support og et Jamf-policydokument. Bare ressurser brukeren har tilgang til vurderes.
- Planlegging: Agenten foreslår trinn: del løsningen, sjekk enhetsoverholdelse via Jamf, og hvis uløst, åpne en ServiceNow-sak.
- Verktøykall: Leser Jamf-status (skrivebeskyttet), utarbeider en fiks melding og ber brukeren bekrefte eskalering. Med bekreftelse oppretter du en hendelse med riktig mal.
- Svar: Gir et kort fiks sammendrag med siteringer til runbooken og Slack-tråden, alt innenfor brukerens tillatelsesomfang.
Hvorfor det fungerer: Agenten er forankret i tillatelsesbevisst henting fra Glean, og AWS håndterer utførelse, godkjenninger og logging.
Sikkerhets- og samsvars sjekkliste (ikke hopp over dette)
- Hold hentingskonteksten på serversiden; ikke utsett rått dokumentinnhold for klienten.
- Krypter i ro med KMS; håndhev TLS 1.2+ i transitt.
- Send brukeridentitet til Glean og verktøy; bruk aldri en delt botidentitet for henting.
- Kartlegg RBAC fra IdP-grupper til verktøyomfang.
- Aktiver Bedrock Guardrails; ikke tillat hemmeligheter i meldinger.
- Rediger PII der det er nødvendig og dokumenter oppbevaringsvinduer.
- Uforanderlige logger til S3 med Object Lock; eksporter til din SIEM.
- Hold en runbook for hendelsesrespons og modelltilbakerulling.
Implementeringsplan: 10 trinn til produksjon
- Definer de 3 viktigste agentbruksområdene (IT, HR, salgsoperasjoner) og suksessmålinger (avbøyningsfrekvens, CSAT, tid til løsning).
- Sett opp AWS-kontoer, VPC, IAM-baselinjer og Bedrock-tilgang.
- Integrer SSO/SCIM; kartlegg roller og godkjenningsflyter.
- Koble til kjernekilder i Glean og valider tillatelsesbevisst henting.
- Bygg en minimal orkestreringstjeneste (Lambda + API Gateway) med Step Functions.
- Implementer RAG-meldingskontrakten, siteringer og kildefiltrering.
- Legg til to verktøy ende-til-ende (skrivebeskyttet først, deretter skriv med godkjenning).
- Instrument loggføring, evalueringer og dashbord; opprett et gullsett med 150 spørsmål.
- Kjør en lukket beta med 50–100 brukere; fiks de største problemene; sett SLOer.
- Rull ut bredt; etabler en ukentlig endringsgjennomgang og månedlig modellevaluering.
Ofte stilte spørsmål når du bygger AI-agenter med Glean og AWS
Hvordan reduserer jeg hallusinasjoner i bedriftsagenter?
Grunn modellen med henting fra Glean og håndhev en streng melding: bruk bare oppgitt kontekst og siter alltid kilder. Avvis svar med lav sikkerhet og still avklarende spørsmål. De fleste hallusinasjoner faller bort når du stoler på tillatelsesbevisst henting.
Kan agenten respektere tillatelser på dokumentnivå på tvers av apper?
Ja. Når du bygger AI-agenter med Glean og AWS, håndhever Glean tillatelser fra tilkoblede apper ved spørretidspunkt, slik at agenten bare ser det brukeren har tilgang til. Send alltid brukerens identitetstoken for å opprettholde varetektskjeden.
Hvilke modeller bør jeg starte med på AWS?
Bruk Amazon Bedrock for tilgang til flere modeller. Start med en sterk generell modell for resonnement og en mindre, raskere modell for ruting. Evaluer latens, kostnad og nøyaktighet mot ditt kuraterte gullsett.
Hvordan kan jeg trygt la agenter utføre handlinger i systemer som Jira eller ServiceNow?
Pakk hvert verktøy med strenge skjemaer, inndatavalidering og godkjenningsarbeidsflyter. Logg hvert verktøykall og lagre utdata for revisjon. For virkningsfulle handlinger, krev et menneskelig bekreftelsestrinn.
Hvilke målinger beviser at en agent er klar for produksjon?
Spor begrunnelse (siteringsfrekvens), svarnøyaktighet, P95-latens, løsnings-/avbøyningsfrekvens og kostnad per løst oppgave. Bygg dashbord og kjør ukentlige regresjonskontroller på gullsettet ditt.
Forresten: akselerere bygge sløyfen
Verdt å merke seg: hvis teamet ditt prototyper ofte, kan en copilot for forskning og utarbeidelse fremskynde designdokumenter, runbooks og meldingsiterasjoner. Verktøy som Sider.AI hjelper team med å oppsummere lange tråder, utarbeide evalueringsmeldinger og sammenligne modellutdata side om side – nyttig når du justerer hvordan du bygger bedriftsklare AI-agenter med Glean og AWS. Viktige takeaways og neste trinn
- Bygging av AI-agenter med Glean og AWS gir deg identitetsbevisst henting og orkestrering av bedriftskvalitet.
- Start med identitet, styring og tillatelsesbevisst henting før fancy planleggingslogikk.
- Bruk Bedrock-sikkerhetstiltak, strenge verktøyskjemaer og menneskelig godkjenning.
- Instrumenter alt: evalueringer, revisjoner og kostnadskontroller.
Neste trinn denne uken:
- Utarbeid dine tre viktigste bruksområder og suksessmålinger.
- Koble til to kjernekilder i Glean; kjør en 150-spørsmåls evaluering.
- Sett opp en minimal Lambda + Step Functions-orkestrator med ett skrivebeskyttet verktøy.
- Sett latens- og kostnadsbudsjettene dine før piloten utvides.
FAQ
Q1: Hva betyr bedriftsklar for AI-agenter på AWS?
Det betyr sikre, reviderbare agenter som respekterer SSO- og dokumenttillatelser, gir siteringer og kjører på kompatibel infrastruktur. Når du bygger AI-agenter med Glean og AWS, får du tillatelsesbevisst henting og observerbarhet av skykvalitet.
Q2: Hvordan forhindrer Glean datalekkasjer i AI-svar?
Glean håndhever tillatelser på dokumentnivå fra hver tilkoblede app ved spørretidspunkt. Agenten henter bare innhold brukeren har tilgang til, noe som er kritisk når du bygger bedriftsklare AI-agenter med Glean og AWS.
Q3: Hvilke AWS-tjenester bør jeg bruke for orkestrering?
Bruk Lambda eller ECS for utførelse, Step Functions for arbeidsflyter med flere trinn, Bedrock for modeller og sikkerhetstiltak og Secrets Manager for legitimasjon. Denne stacken er et bevist grunnlag for å bygge AI-agenter med Glean og AWS.
Q4: Hvordan evaluerer jeg nøyaktighet og reduserer hallusinasjoner?
Opprett et gullsett med spørsmål, krev siteringer og bruk hentingsutvidet generering. Med Glean og AWS reduserer tillatelsesbevisst henting pluss sikkerhetstiltak hallusinasjoner betydelig.
Q5: Kan AI-agenter trygt utføre handlinger som å opprette billetter eller legge ut i Slack?
Ja – med skjema-validerte verktøy, godkjenninger for handlinger med høy innvirkning og full revisjonslogging. Dette er et kjernemønster når du bygger bedriftsklare AI-agenter med Glean og AWS.