What does enterprise‑ready mean for AI agents on AWS?

It means secure, auditable agents that respect SSO and document permissions, provide citations, and run on compliant infrastructure. When you build AI agents with Glean and AWS, you get permission‑aware retrieval and cloud‑grade observability.

How does Glean prevent data leaks in AI answers?

Glean enforces document‑level permissions from each connected app at query time. The agent only retrieves content the user can access, which is critical when building enterprise‑ready AI agents with Glean and AWS.

Which AWS services should I use for orchestration?

Use Lambda or ECS for execution, Step Functions for multi‑step workflows, Bedrock for models and guardrails, and Secrets Manager for credentials. This stack is a proven base for building AI agents with Glean and AWS.

How do I evaluate accuracy and reduce hallucinations?

Create a gold set of questions, require citations, and use retrieval‑augmented generation. With Glean and AWS, permission‑aware retrieval plus guardrails reduces hallucinations significantly.

Can AI agents safely take actions like creating tickets or posting in Slack?

Yes—with schema‑validated tools, approvals for high‑impact actions, and full audit logging. This is a core pattern when you build enterprise‑ready AI agents with Glean and AWS.

Как создать AI-агентов корпоративного уровня с использованием Glean и AWS

Почему корпоративные AI-агенты терпят неудачу — и как сделать их готовыми к работе с Glean и AWS

Вот смелое заявление: большинство «AI-агентов», демонстрируемых в залах заседаний, на самом деле не готовы к корпоративному использованию. Они выдают галлюцинации под давлением, ломаются на реальных данных и не могут пройти аудит SOC 2. Если вам нужен AI, который ваши юридические, службы безопасности и ИТ-команды действительно одобрят, и который ваши сотрудники действительно будут использовать, вам нужна сборка, сочетающая в себе поиск корпоративного уровня (Glean), надежные облачные примитивы (AWS) и дисциплинированную архитектуру, выдерживающую масштабирование.

Это руководство шаг за шагом проведет вас через процесс создания корпоративных AI-агентов с помощью Glean и AWS — от поиска с учетом идентификации до безопасного использования инструментов, от бюджетов задержек до наблюдаемости и от пилотного проекта до производства.

Мы будем использовать структуру, основанную на вопросах, чтобы вы могли перейти к самому важному: доступу к данным, безопасности, архитектуре и развертыванию.

Что мы подразумеваем под корпоративными AI-агентами?

Корпоративный AI-агент — это не просто интерфейс чата. Это безопасная, поддающаяся аудиту система, которая может:

Отвечать на вопросы, используя корпоративные знания, со строгими границами разрешений

Выполнять действия с помощью утвержденных инструментов (например, тикеты ServiceNow, задачи Jira, сообщения Slack)

Указывать источники и объяснять логику рассуждений

Работать под управлением корпоративных SSO, SCIM и DLP

Соответствовать требованиям к местонахождению данных, ведению журналов и хранению

Масштабироваться до тысяч пользователей с предсказуемой задержкой и стоимостью

Именно здесь проявляется преимущество создания AI-агентов с помощью Glean и AWS: Glean обеспечивает корпоративный поиск и извлечение информации с учетом идентификации во всех приложениях, а AWS предоставляет вычислительную, оркестрационную, сетевую и управленческую основу, необходимую в производственной среде.

Архитектура вкратце: Glean + AWS

Рассматривайте систему как четыре уровня:

Уровень идентификации и доступа (SSO, SCIM, разрешения)

SSO через Okta/Azure AD; SCIM для подготовки; сопоставления ролей

Glean обеспечивает соблюдение разрешений на уровне документов во время запроса

AWS Cognito или прямой SAML/OIDC для передачи токенов в сервисы

Уровень корпоративного поиска (Glean)

Унифицированный индекс для Google Drive, Slack, Confluence, Jira, GitHub, Box, Notion и других

Поиск и ранжирование с учетом разрешений

Перефразирование запросов, гибридный поиск, семантическое переранжирование

Уровень рассуждений и оркестрации (AWS + модели)

AWS Lambda или ECS для бессерверных шагов агента

Amazon Bedrock для управляемого доступа к передовым моделям

Step Functions для рабочих процессов с несколькими инструментами и повторных попыток

Secrets Manager/Parameter Store для ключей и учетных данных инструментов

Уровень действий и инструментов (корпоративные интеграции)

Операции чтения и записи в системы учета (ServiceNow, Salesforce, Jira, Slack)

Защитные ограждения, утверждения и наблюдение за каждым вызовом инструмента

Журналы аудита в CloudWatch/OpenSearch для объяснимости

Основная сборка: Как создать корпоративных AI-агентов с помощью Glean и AWS

Ниже представлен практический, сквозной путь. Адаптируйте его для своего стека, но придерживайтесь принципов.

1) Сначала настройте идентификацию и управление

Установите SSO через Okta/Azure AD. Сопоставьте группы/роли с разрешениями приложений.

Используйте SCIM для автоматизированного жизненного цикла пользователей (присоединение/перемещение/увольнение). Отмена подготовки должна каскадироваться на агента.

Настройте учетные записи AWS с ролями IAM с наименьшими привилегиями. Разделите разработку, промежуточную среду, продакшн. При необходимости обеспечьте соблюдение конечных точек VPC для Bedrock и контроля исходящего трафика данных.

Определите срок хранения данных: как долго хранить подсказки, ответы и векторные вложения. Используйте S3-корзины, зашифрованные KMS, для журналов и артефактов.

Совет: Рассматривайте идентификацию как сигнал времени выполнения. Агент должен передавать идентификацию конечного пользователя через Glean и инструменты, чтобы проверки разрешений оставались нетронутыми.

2) Подключите источники в Glean и включите поиск с учетом разрешений

Подключите Slack, Drive, Confluence, Notion, GitHub, Jira, Box и электронную почту в соответствии с вашим объемом.

Позвольте Glean выполнять обход и индексацию с наименьшими привилегиями; подтвердите области действия с помощью безопасности.

Проверьте распространение разрешений: пользователь должен получать только то, что он может просматривать в исходном приложении.

Настройте конфигурацию запросов Glean: включите перефразирование запросов, гибридный поиск и семантическое переранжирование для повышения точности.

Почему это важно: В большинстве предприятий 70–90% проблемы «галлюцинаций» на самом деле является проблемой поиска. С помощью Glean AI-агент извлекает правильные документы с учетом разрешений пользователя, что значительно снижает риск и количество нерелевантных ответов.

3) Выберите модели через Amazon Bedrock и установите защитные ограждения

Начните с модели общего назначения (например, Claude, Llama или Mistral через Bedrock) и выполните A/B-тестирование по отношению к подсказкам домена.

Используйте Bedrock Guardrails для фильтров безопасности, проверок внедрения подсказок и политик контента.

Ограничьте ответы: требуйте цитирования по идентификатору/URL-адресу документа, применяйте JSON-схемы для выходных данных инструментов и установите максимальное количество токенов на шаг.

Соблюдайте бюджет задержки: целевой показатель P95 end-to-end < 2,5 с для вопросов и ответов и < 6 с для потоков использования инструментов.

4) Организуйте агента на AWS

Шаблон: Планирование в стиле ReAct + использование инструментов + обоснованный ответ.

Используйте Step Functions для координации шагов: извлечение → планирование → инструмент → проверка → ответ.

Вызовы рассуждений выполняются в Lambda или ECS; выберите Lambda для скачкообразного трафика, ECS — для устойчивой пропускной способности.

Адаптеры инструментов (Jira, Slack, ServiceNow) — это бессерверные Lambda с секретами, определенными IAM, в AWS Secrets Manager.

Храните кратковременное состояние разговора в DynamoDB с TTL; долгосрочную аналитику — в S3/Glue/Athena.

5) Внедрите генерацию, расширенную извлечением (RAG), с помощью Glean

Запрашивайте Glean с помощью токена идентификации пользователя и вопроса пользователя.

Получите лучшие результаты top-k (например, гибридный: k=10 семантический + 10 ключевых слов) с соблюдением разрешений.

Переранжируйте с помощью релевантности Glean; передайте модели только верхние, дедуплицированные фрагменты.

Потребуйте от агента цитировать источники и включать оценку достоверности.

Структура подсказки:

Система: «Вы — обоснованный корпоративный помощник. Используйте только предоставленный контекст. Если это нерелевантно, задайте уточняющий вопрос. Всегда указывайте источники по названию и ссылке».

Инструменты: «Вы можете вызывать Jira_CreateIssue, Slack_PostMessage, ServiceNow_CreateIncident. Действуйте только после подтверждения пользователем, если только в служебной инструкции не разрешена автоматизация».

6) Добавьте безопасное использование инструментов и утверждения

Оберните каждый инструмент проверкой параметров и ограничением скорости.

Требуйте подтверждения человека или утверждения менеджера для важных действий (например, предоставление доступа, закрытие P1).

Регистрируйте каждый вызов инструмента (кто, что, когда, входная схема, выходные данные) в CloudWatch и S3 для аудитов.

Для сообщений Slack/Teams поддерживайте «режим черновика» для предварительного просмотра перед отправкой.

7) Наблюдаемость, оценка и контроль отклонений

Собирайте подсказки, фрагменты контекста, цитаты и ответы с редактированием, где это необходимо.

Используйте панели мониторинга OpenSearch для мониторинга precision@k, обоснованности и коэффициента отклонения.

Выполняйте автономные оценки: создайте золотой набор из 100–300 вопросов, специфичных для организации, с ожидаемыми ответами и необходимыми источниками.

Запланируйте канарейки для обнаружения дрейфа соединителя или разрешений (например, измененные каналы Slack, миграции дисков).

8) Настройка производительности и стоимости

Кэшируйте запросы Glean для каждого пользователя по горячим темам (например, политика отдела кадров) с коротким TTL.

Используйте более мелкие модели для маршрутизации, более крупные модели — только для сложных запросов или планов с несколькими инструментами.

Выполняйте переранжирование пакетами, когда это возможно; сжимайте контекст; используйте дедупликацию фрагментов.

Отслеживайте стоимость каждой решенной задачи; установите квоты для каждой организации и каждой группы пользователей.

Пример: Корпоративный ИТ-помощник, созданный с помощью Glean и AWS

Давайте рассмотрим конкретный сценарий, который показывает, как создать корпоративных AI-агентов с помощью Glean и AWS.

Вариант использования: Triage и разрешение ИТ-поддержки.

Пользователь спрашивает: «VPN не работает на macOS 14 после обновления — есть ли исправление?»

Агент направляет к треку служебной инструкции ИТ.

Извлечение: Запрашивает Glean с идентификацией пользователя и получает служебную инструкцию VPN (Confluence), ветку Slack из #it-support и документ политики Jamf. Учитываются только ресурсы, к которым пользователь имеет доступ.

Планирование: Агент предлагает шаги: поделиться исправлением, проверить соответствие устройства через Jamf и, если проблема не решена, открыть инцидент ServiceNow.

Вызовы инструментов: Считывает статус Jamf (только для чтения), составляет сообщение об исправлении и просит пользователя подтвердить эскалацию. После подтверждения создает инцидент с правильным шаблоном.

Ответ: Предоставляет краткое изложение исправления со ссылками на служебную инструкцию и ветку Slack, и все это в рамках области разрешений пользователя.

Почему это работает: Агент основан на поиске с учетом разрешений от Glean, а AWS обрабатывает выполнение, утверждения и ведение журналов.

Контрольный список безопасности и соответствия требованиям (не пропускайте это)

Границы данных

Храните контекст извлечения на стороне сервера; не предоставляйте необработанное содержимое документа клиенту.

Шифруйте в состоянии покоя с помощью KMS; обеспечьте соблюдение TLS 1.2+ при передаче.

Идентификация

Передавайте идентификацию пользователя в Glean и инструменты; никогда не используйте общую идентификацию бота для извлечения.

Сопоставьте RBAC из групп IdP с областями инструментов.

Управление моделями

Включите Bedrock Guardrails; запретите секреты в подсказках.

Редактируйте PII, где это необходимо, и документируйте окна хранения.

Аудит

Неизменяемые журналы в S3 с блокировкой объектов; экспортируйте в SIEM.

Храните служебную инструкцию для реагирования на инциденты и отката модели.

План реализации: 10 шагов к производству

Определите 3 основных варианта использования агента (ИТ, кадры, операции продаж) и показатели успеха (коэффициент отклонения, CSAT, время решения).

Поднимите учетные записи AWS, VPC, базовые уровни IAM и доступ к Bedrock.

Интегрируйте SSO/SCIM; сопоставьте роли и потоки утверждения.

Подключите основные источники в Glean и проверьте поиск с учетом разрешений.

Создайте минимальную службу оркестрации (Lambda + API Gateway) с Step Functions.

Реализуйте контракт подсказки RAG, цитаты и фильтрацию источников.

Добавьте два инструмента end-to-end (сначала только для чтения, затем для записи с утверждением).

Инструментируйте ведение журналов, оценки и панели мониторинга; создайте золотой набор из 150 вопросов.

Запустите закрытую бета-версию с 50–100 пользователями; исправьте основные проблемы; установите SLO.

Широко разверните; установите еженедельный обзор изменений и ежемесячную оценку модели.

Часто задаваемые вопросы при создании AI-агентов с помощью Glean и AWS

Как уменьшить количество галлюцинаций у корпоративных агентов?

Обоснуйте модель с помощью поиска из Glean и обеспечьте соблюдение строгой подсказки: используйте только предоставленный контекст и всегда указывайте источники. Отклоняйте ответы с низкой достоверностью и задавайте уточняющие вопросы. Большинство галлюцинаций исчезают, когда вы полагаетесь на поиск с учетом разрешений.

Может ли агент соблюдать разрешения на уровне документов во всех приложениях?

Да. Когда вы создаете AI-агентов с помощью Glean и AWS, Glean обеспечивает соблюдение разрешений из подключенных приложений во время запроса, поэтому агент видит только то, к чему пользователь имеет доступ. Всегда передавайте токен идентификации пользователя, чтобы поддерживать цепочку хранения.

С каких моделей мне следует начать работу на AWS?

Используйте Amazon Bedrock для доступа к нескольким моделям. Начните с надежной общей модели для рассуждений и более мелкой, более быстрой модели для маршрутизации. Оцените задержку, стоимость и точность по отношению к вашему курируемому золотому набору.

Как мне безопасно позволить агентам выполнять действия в таких системах, как Jira или ServiceNow?

Оберните каждый инструмент строгими схемами, проверкой входных данных и рабочими процессами утверждения. Регистрируйте каждый вызов инструмента и сохраняйте выходные данные для аудита. Для важных действий требуется шаг подтверждения человеком.

Какие показатели доказывают, что агент готов к работе?

Отслеживайте обоснованность (частота цитирования), точность ответов, задержку P95, коэффициент решения/отклонения и стоимость каждой решенной задачи. Создавайте панели мониторинга и выполняйте еженедельные проверки регрессии в своем золотом наборе.

Кстати: ускорение цикла сборки

Стоит отметить: если ваша команда часто создает прототипы, сопрограмма для исследований и составления черновиков может ускорить создание проектной документации, служебных инструкций и итерации подсказок. Такие инструменты, как Sider.AI, помогают командам обобщать длинные ветки, составлять подсказки для оценки и сравнивать выходные данные моделей бок о бок — это полезно, когда вы настраиваете способ создания корпоративных AI-агентов с помощью Glean и AWS.

Основные выводы и следующие шаги

Создание AI-агентов с помощью Glean и AWS обеспечивает поиск с учетом идентификации и оркестрацию корпоративного уровня.

Начните с идентификации, управления и поиска с учетом разрешений, прежде чем приступать к сложной логике планирования.

Используйте защитные ограждения Bedrock, строгие схемы инструментов и утверждения с участием человека.

Инструментируйте все: оценки, аудиты и элементы управления затратами.

Следующие шаги на этой неделе:

Составьте черновик трех основных вариантов использования и показателей успеха.

Подключите два основных источника в Glean; выполните оценку по 150 вопросам.

Поднимите минимальный оркестратор Lambda + Step Functions с одним инструментом только для чтения.

Установите бюджеты задержек и затрат до расширения пилотного проекта.

FAQ

Q1: Что означает «готовность к корпоративному использованию» для AI-агентов на AWS? Это означает безопасных, поддающихся аудиту агентов, которые соблюдают SSO и разрешения на документы, предоставляют цитаты и работают на совместимой инфраструктуре. Когда вы создаете AI-агентов с помощью Glean и AWS, вы получаете поиск с учетом разрешений и наблюдаемость облачного уровня.

Q2: Как Glean предотвращает утечку данных в ответах AI? Glean обеспечивает соблюдение разрешений на уровне документов из каждого подключенного приложения во время запроса. Агент извлекает только контент, к которому пользователь имеет доступ, что имеет решающее значение при создании корпоративных AI-агентов с помощью Glean и AWS.

Q3: Какие сервисы AWS следует использовать для оркестрации? Используйте Lambda или ECS для выполнения, Step Functions для многоэтапных рабочих процессов, Bedrock для моделей и защитных ограждений и Secrets Manager для учетных данных. Этот стек является проверенной основой для создания AI-агентов с помощью Glean и AWS.

Q4: Как оценить точность и уменьшить количество галлюцинаций? Создайте золотой набор вопросов, требуйте цитаты и используйте генерацию, расширенную извлечением. С Glean и AWS поиск с учетом разрешений плюс защитные ограждения значительно снижают количество галлюцинаций.

Q5: Могут ли AI-агенты безопасно выполнять такие действия, как создание тикетов или публикация в Slack? Да — с инструментами с проверенной схемой, утверждениями для действий с высоким воздействием и полным ведением журналов аудита. Это основная модель при создании корпоративных AI-агентов с помощью Glean и AWS.