શા માટે એન્ટરપ્રાઇઝ AI એજન્ટ નિષ્ફળ જાય છે — અને Glean અને AWS સાથે તેમને પ્રોડક્શન માટે કેવી રીતે તૈયાર કરવા
અહીં એક બોલ્ડ દાવો છે: બોર્ડરૂમમાં ડેમો કરવામાં આવતા મોટાભાગના “AI એજન્ટ્સ” ખરેખર એન્ટરપ્રાઇઝ માટે તૈયાર નથી હોતા. તેઓ દબાણમાં ખોટી માહિતી આપે છે, વાસ્તવિક ડેટા પર તૂટી જાય છે અને SOC 2 ઓડિટ પાસ કરી શકતા નથી. જો તમને AI જોઈએ છે જેને તમારી કાનૂની, સુરક્ષા અને IT ટીમ ખરેખર મંજૂર કરે—અને તમારા કર્મચારીઓ ખરેખર ઉપયોગ કરે—તો તમારે એક એવી રચનાની જરૂર છે જે એન્ટરપ્રાઇઝ-ગ્રેડ રિટ્રીવલ (Glean), મજબૂત ક્લાઉડ પ્રિમિટિવ્સ (AWS) અને શિસ્તબદ્ધ આર્કિટેક્ચરને મિશ્રિત કરે જે સ્કેલથી બચી શકે.
આ માર્ગદર્શિકા તમને Glean અને AWS સાથે એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ કેવી રીતે બનાવવા તે અંગે સ્ટેપ-બાય-સ્ટેપ સમજાવે છે—ઓળખ-સભાન રિટ્રીવલથી લઈને સુરક્ષિત ટૂલ ઉપયોગ સુધી, લેટન્સી બજેટથી લઈને ઓબ્ઝર્વેબિલિટી સુધી અને પાઇલટથી પ્રોડક્શન સુધી.
અમે પ્રશ્ન-આધારિત માળખું વાપરીશું જેથી તમે સીધા જ સૌથી મહત્વપૂર્ણ બાબતો પર જઈ શકો: ડેટા એક્સેસ, સુરક્ષા, આર્કિટેક્ચર અને રોલઆઉટ.
એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ દ્વારા અમારો શું અર્થ છે?
એક એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ માત્ર એક ચેટ ઇન્ટરફેસ નથી. તે એક સુરક્ષિત, ઓડિટ કરી શકાય તેવી સિસ્ટમ છે જે આ કરી શકે છે:
- કંપનીના જ્ઞાનનો ઉપયોગ કરીને સખત પરવાનગી સીમાઓ સાથે પ્રશ્નોના જવાબ આપો
- મંજૂર કરેલા ટૂલ્સ દ્વારા ક્રિયાઓ કરો (દા.ત., ServiceNow ટિકિટ્સ, Jira ઇશ્યૂઝ, Slack પોસ્ટ્સ)
- સ્ત્રોતોને એટ્રીબ્યૂટ કરો અને તર્ક સમજાવો
- એન્ટરપ્રાઇઝ SSO, SCIM અને DLP નિયંત્રણો હેઠળ કામ કરો
- ડેટા રેસિડેન્સી, લોગીંગ અને રીટેન્શન જરૂરિયાતોનું પાલન કરો
- આગાહી કરી શકાય તેવી લેટન્સી અને કિંમત સાથે હજારો વપરાશકર્તાઓ સુધી સ્કેલ કરો
આ તે જગ્યા છે જ્યાં Glean અને AWS સાથે AI એજન્ટ બનાવવાનું શ્રેષ્ઠ છે: Glean એપ્લિકેશન્સમાં ઓળખ-સભાન એન્ટરપ્રાઇઝ શોધ અને પુનઃપ્રાપ્તિ પ્રદાન કરે છે, જ્યારે AWS તમને પ્રોડક્શનમાં જરૂરી કમ્પ્યુટ, ઓર્કેસ્ટ્રેશન, નેટવર્કિંગ અને ગવર્નન્સ ફાઉન્ડેશન લાવે છે.
આર્કિટેક્ચર એક નજરમાં: Glean + AWS
સિસ્ટમને ચાર સ્તરો તરીકે વિચારો:
- ઓળખ અને એક્સેસ લેયર (SSO, SCIM, પરવાનગીઓ)
- Okta/Azure AD દ્વારા SSO; પ્રોવિઝનિંગ માટે SCIM; રોલ મેપિંગ્સ
- Glean ક્વેરી સમયે દસ્તાવેજ-સ્તરની પરવાનગીઓ લાગુ કરે છે
- AWS Cognito અથવા સીધું SAML/OIDC સેવાઓમાં ટોકન્સ બ્રોકર કરવા માટે
- એન્ટરપ્રાઇઝ રિટ્રીવલ લેયર (Glean)
- Google Drive, Slack, Confluence, Jira, GitHub, Box, Notion અને વધુમાં યુનિફાઇડ ઇન્ડેક્સ
- પરવાનગી-સભાન રિટ્રીવલ અને રેન્કિંગ
- ક્વેરી રિરાઇટિંગ, હાઇબ્રિડ સર્ચ, સિમેન્ટિક રિરૅન્કિંગ
- રિઝનિંગ અને ઓર્કેસ્ટ્રેશન લેયર (AWS + મોડેલ્સ)
- સ્ટેટલેસ એજન્ટ સ્ટેપ્સ માટે AWS Lambda અથવા ECS
- ફ્રન્ટિયર મોડેલ્સ સુધી મેનેજ્ડ એક્સેસ માટે Amazon Bedrock
- મલ્ટી-ટૂલ વર્કફ્લો અને રિટ્રાઇઝ માટે સ્ટેપ ફંક્શન્સ
- કી અને ટૂલ ઓળખપત્રો માટે સીક્રેટ્સ મેનેજર/પેરામીટર સ્ટોર
- એક્શન અને ટૂલ લેયર (એન્ટરપ્રાઇઝ ઇન્ટિગ્રેશન્સ)
- સિસ્ટમ્સ ઓફ રેકોર્ડમાં વાંચન અને લખવાની ક્રિયાઓ (ServiceNow, Salesforce, Jira, Slack)
- દરેક ટૂલ કોલ માટે ગાર્ડ્રેલ્સ, મંજૂરીઓ અને નિરીક્ષણ
- સમજાવવા માટે CloudWatch/OpenSearch માં ઓડિટ લોગ્સ
કોર બિલ્ડ: Glean અને AWS સાથે એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ કેવી રીતે બનાવવા
નીચે એક વ્યવહારુ, સંપૂર્ણ પાથ છે. તમારા સ્ટેક માટે અનુકૂલન કરો, પરંતુ સિદ્ધાંતો રાખો.
1) પહેલા ઓળખ અને ગવર્નન્સ સેટ કરો
- Okta/Azure AD દ્વારા SSO સ્થાપિત કરો. એપ્લિકેશન પરવાનગીઓ માટે જૂથો/ભૂમિકાઓ મેપ કરો.
- ઓટોમેટેડ યુઝર લાઇફસાયકલ (જોઇનર/મુવર/લીવર) માટે SCIM નો ઉપયોગ કરો. ડિપ્રોવિઝનિંગ એજન્ટને કેસ્કેડ થવું આવશ્યક છે.
- સૌથી ઓછી વિશેષાધિકાર IAM ભૂમિકાઓ સાથે AWS એકાઉન્ટ્સને ગોઠવો. અલગ દેવ, સ્ટેજીંગ, પ્રોડ. જ્યાં જરૂરી હોય ત્યાં Bedrock અને ડેટા એગ્રેસ નિયંત્રણો માટે VPC એન્ડપોઇન્ટ્સ લાગુ કરો.
- ડેટા રીટેન્શન વ્યાખ્યાયિત કરો: પ્રોમ્પ્ટ્સ, જવાબો અને વેક્ટર એમ્બેડિંગ્સને કેટલો સમય સ્ટોર કરવો. લોગ અને આર્ટિફેક્ટ્સ માટે KMS-એન્ક્રિપ્ટેડ S3 બકેટ્સનો ઉપયોગ કરો.
ટીપ: ઓળખને રનટાઇમ સિગ્નલ તરીકે ગણો. એજન્ટે Glean અને ટૂલ્સ દ્વારા અંતિમ વપરાશકર્તાની ઓળખ પાસ કરવી આવશ્યક છે જેથી પરવાનગી તપાસ અકબંધ રહે.
2) Glean માં સ્ત્રોતોને કનેક્ટ કરો અને પરવાનગી-સભાન પુનઃપ્રાપ્તિને સક્ષમ કરો
- તમારા ફૂટપ્રિન્ટ પ્રમાણે Slack, Drive, Confluence, Notion, GitHub, Jira, Box અને ઇમેઇલ કનેક્ટ કરો.
- Glean ને ઓછામાં ઓછા વિશેષાધિકાર સાથે ક્રોલ અને ઇન્ડેક્સ કરવા દો; સુરક્ષા સાથે સ્કોપ્સની પુષ્ટિ કરો.
- પરવાનગી પ્રસારણને માન્ય કરો: વપરાશકર્તાએ ફક્ત તે જ પુનઃપ્રાપ્ત કરવું જોઈએ જે તેઓ સ્ત્રોત એપ્લિકેશનમાં જોઈ શકે છે.
- Glean ક્વેરી રૂપરેખાંકનને ટ્યુન કરો: વધુ સારી ચોકસાઈ માટે ક્વેરી રિરાઇટિંગ, હાઇબ્રિડ પુનઃપ્રાપ્તિ અને સિમેન્ટિક રિરૅન્કિંગને સક્ષમ કરો.
તે શા માટે મહત્વપૂર્ણ છે: મોટાભાગના એન્ટરપ્રાઇઝમાં, 70-90% “ભ્રમણા” સમસ્યા ખરેખર પુનઃપ્રાપ્તિ સમસ્યા છે. Glean સાથે, AI એજન્ટ વપરાશકર્તાની પરવાનગીઓના આધારે યોગ્ય દસ્તાવેજો પુનઃપ્રાપ્ત કરે છે, જે જોખમ અને અસંગત જવાબોને મોટા પ્રમાણમાં ઘટાડે છે.
3) Amazon Bedrock દ્વારા મોડેલ્સ પસંદ કરો અને ગાર્ડ્રેલ્સ સેટ કરો
- સામાન્ય મોડેલથી પ્રારંભ કરો (દા.ત., Claude, Llama, અથવા Mistral Bedrock દ્વારા) અને ડોમેન પ્રોમ્પ્ટ્સ સામે A/B કરો.
- સુરક્ષા ફિલ્ટર્સ, પ્રોમ્પ્ટ ઇન્જેક્શન તપાસ અને સામગ્રી નીતિઓ માટે Bedrock Guardrails નો ઉપયોગ કરો.
- પ્રતિસાદોને નિયંત્રિત કરો: દસ્તાવેજ ID/URL દ્વારા ટાંકણોની જરૂર છે, ટૂલ આઉટપુટ માટે JSON સ્કીમા લાગુ કરો અને પ્રતિ સ્ટેપ મહત્તમ ટોકન્સ સેટ કરો.
- લેટન્સી બજેટ રાખો: Q&A માટે P95 અંત-થી-અંત < 2.5 સેકન્ડ અને ટૂલ-ઉપયોગ પ્રવાહો માટે < 6 સેકન્ડને લક્ષ્ય બનાવો.
4) AWS પર એજન્ટને ઓર્કેસ્ટ્રેટ કરો
પેટર્ન: ReAct-શૈલી આયોજન + ટૂલ ઉપયોગ + ગ્રાઉન્ડેડ જવાબ.
- સ્ટેપ્સને સંકલન કરવા માટે સ્ટેપ ફંક્શન્સનો ઉપયોગ કરો: પુનઃપ્રાપ્ત કરો → યોજના બનાવો → ટૂલ → માન્ય કરો → જવાબ આપો.
- રિઝનિંગ કોલ્સ Lambda અથવા ECS માં ચાલે છે; બર્સ્ટી ટ્રાફિક માટે Lambda પસંદ કરો, સતત થ્રુપુટ માટે ECS.
- ટૂલ એડેપ્ટર્સ (Jira, Slack, ServiceNow) AWS સીક્રેટ્સ મેનેજરમાં IAM-સ્કોપ્ડ સીક્રેટ્સ સાથે સ્ટેટલેસ લેમ્બડાસ છે.
- TTL સાથે DynamoDB માં ટૂંકા ગાળાની વાતચીત સ્થિતિ સ્ટોર કરો; S3/Glue/Athena માં લાંબા ગાળાના વિશ્લેષણો.
5) Glean સાથે રીટ્રીવલ-ઓગમેન્ટેડ જનરેશન (RAG) લાગુ કરો
- વપરાશકર્તાની ઓળખ ટોકન અને વપરાશકર્તાના પ્રશ્ન સાથે Glean ને ક્વેરી કરો.
- ટોચના-k પરિણામો પુનઃપ્રાપ્ત કરો (દા.ત., હાઇબ્રિડ: k=10 સિમેન્ટિક + 10 કીવર્ડ) પરવાનગીઓનું સન્માન કરો.
- Glean ની સુસંગતતા સાથે રિરૅન્ક કરો; મોડેલમાં ફક્ત ટોચના, ડિડુપ્લિકેટેડ ભાગો જ પાસ કરો.
- એજન્ટને સ્ત્રોતો ટાંકવા અને આત્મવિશ્વાસ સ્કોર શામેલ કરવાની જરૂર છે.
પ્રોમ્પ્ટ સ્કેલેટન:
- સિસ્ટમ: “તમે એક ગ્રાઉન્ડેડ એન્ટરપ્રાઇઝ સહાયક છો. ફક્ત પ્રદાન કરેલ સંદર્ભનો ઉપયોગ કરો. જો અસંગત હોય, તો ફોલો-અપ પ્રશ્ન પૂછો. હંમેશા શીર્ષક અને લિંક દ્વારા સ્ત્રોતો ટાંકો.”
- ટૂલ્સ: “તમે Jira_CreateIssue, Slack_PostMessage, ServiceNow_CreateIncident ને કૉલ કરી શકો છો. રનબુક ઓટોમેશનને અધિકૃત ન કરે ત્યાં સુધી વપરાશકર્તા સાથે પુષ્ટિ કર્યા પછી જ કાર્ય કરો.”
6) સુરક્ષિત ટૂલ ઉપયોગ અને મંજૂરીઓ ઉમેરો
- દરેક ટૂલને પરિમાણ માન્યતા અને દર મર્યાદા સાથે આવરે છે.
- અસરકારક ક્રિયાઓ માટે માનવ પુષ્ટિ અથવા મેનેજરની મંજૂરીની જરૂર છે (દા.ત., ઍક્સેસ પ્રોવિઝનિંગ, P1 બંધ કરવું).
- દરેક ટૂલ કૉલ (કોણ, શું, ક્યારે, ઇનપુટ સ્કીમા, આઉટપુટ) ને ઓડિટ માટે CloudWatch અને S3 માં લોગ કરો.
- Slack/Teams પોસ્ટ્સ માટે, મોકલતા પહેલા પૂર્વાવલોકન માટે “ડ્રાફ્ટ મોડ” ને સપોર્ટ કરો.
7) ઓબ્ઝર્વેબિલિટી, મૂલ્યાંકન અને ડ્રિફ્ટ નિયંત્રણ
- જરૂર પડે ત્યાં રિડેક્શન સાથે પ્રોમ્પ્ટ્સ, સંદર્ભ સ્નિપેટ્સ, ટાંકણો અને પ્રતિસાદો કેપ્ચર કરો.
- ચોકસાઈ@k, ગ્રાઉન્ડેડનેસ અને ડિફ્લેક્શન રેટને મોનિટર કરવા માટે OpenSearch ડેશબોર્ડ્સનો ઉપયોગ કરો.
- ઓફલાઇન ઇવેલ્સ ચલાવો: અપેક્ષિત જવાબો અને જરૂરી સ્ત્રોતો સાથે 100-300 સંસ્થા-વિશિષ્ટ પ્રશ્નોનો ગોલ્ડ સેટ ક્યુરેટ કરો.
- કનેક્ટર અથવા પરવાનગી ડ્રિફ્ટ શોધવા માટે કેનેરીઝનું શેડ્યૂલ કરો (દા.ત., બદલાયેલ Slack ચેનલો, ડ્રાઇવ સ્થળાંતર).
8) કામગીરી અને ખર્ચ ટ્યુનિંગ
- હોટ વિષયો માટે (દા.ત., HR નીતિ) ટૂંકા TTLs સાથે પ્રતિ વપરાશકર્તા Glean ક્વેરીઝ કેશ કરો.
- રૂટીંગ માટે નાના મોડેલ્સનો ઉપયોગ કરો, ફક્ત સખત ક્વેરીઝ અથવા મલ્ટી-ટૂલ યોજનાઓ માટે મોટા મોડેલ્સનો ઉપયોગ કરો.
- જ્યારે શક્ય હોય ત્યારે બેચ રિરૅન્કિંગ; સંદર્ભને સંકુચિત કરો; ભાગ ડિડુપ્લિકેશનનો ઉપયોગ કરો.
- ઉકેલાયેલા કાર્ય દીઠ ખર્ચ ટ્રૅક કરો; પ્રતિ સંસ્થા અને પ્રતિ વપરાશકર્તા જૂથ ક્વોટા સેટ કરો.
ઉદાહરણ: Glean અને AWS સાથે બનેલ એન્ટરપ્રાઇઝ IT સહાયક
ચાલો એક નક્કર પરિસ્થિતિ પર ચાલીએ જે બતાવે છે કે Glean અને AWS સાથે એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ કેવી રીતે બનાવવા.
ઉપયોગ કેસ: IT સપોર્ટ ટ્રાયેજ અને રિઝોલ્યુશન.
- વપરાશકર્તા પૂછે છે: “macOS 14 પર અપડેટ પછી VPN નિષ્ફળ જાય છે—કોઈ ફિક્સ છે?”
- એજન્ટ IT રનબુક ટ્રેક પર રૂટ કરે છે.
- પુનઃપ્રાપ્તિ: વપરાશકર્તાની ઓળખ સાથે Glean ને ક્વેરી કરે છે અને VPN રનબુક (Confluence), #it-support માંથી Slack થ્રેડ અને Jamf નીતિ દસ્તાવેજ મેળવે છે. ફક્ત તે જ સંસાધનો ધ્યાનમાં લેવામાં આવે છે જે વપરાશકર્તા ઍક્સેસ કરી શકે છે.
- આયોજન: એજન્ટ પગલાં સૂચવે છે: ફિક્સ શેર કરો, Jamf દ્વારા ઉપકરણ અનુપાલન તપાસો અને જો ઉકેલ ન આવે તો, ServiceNow ઘટના ખોલો.
- ટૂલ કોલ્સ: Jamf સ્થિતિ વાંચે છે (ફક્ત વાંચવા માટે), ફિક્સ સંદેશનો ડ્રાફ્ટ બનાવે છે અને વપરાશકર્તાને એસ્કેલેશનની પુષ્ટિ કરવા કહે છે. પુષ્ટિ સાથે, યોગ્ય ટેમ્પલેટ સાથે ઘટના બનાવે છે.
- જવાબ: રનબુક અને Slack થ્રેડના ટાંકણો સાથે સંક્ષિપ્ત ફિક્સ સારાંશ પ્રદાન કરે છે, બધા વપરાશકર્તાના પરવાનગી ક્ષેત્રમાં.
તે શા માટે કામ કરે છે: એજન્ટ Glean માંથી પરવાનગી-સભાન પુનઃપ્રાપ્તિમાં ગ્રાઉન્ડેડ છે અને AWS એક્ઝેક્યુશન, મંજૂરીઓ અને લોગીંગને હેન્ડલ કરે છે.
સુરક્ષા અને અનુપાલન ચેકલિસ્ટ (આ છોડશો નહીં)
- પુનઃપ્રાપ્તિ સંદર્ભ સર્વર-સાઇડ રાખો; ક્લાયંટને કાચા દસ્તાવેજની સામગ્રીનો પર્દાફાશ કરશો નહીં.
- KMS સાથે રેસ્ટ પર એન્ક્રિપ્ટ કરો; પરિવહનમાં TLS 1.2+ લાગુ કરો.
- વપરાશકર્તાની ઓળખ Glean અને ટૂલ્સ પર પાસ કરો; પુનઃપ્રાપ્તિ માટે ક્યારેય શેર કરેલી બોટ ઓળખનો ઉપયોગ કરશો નહીં.
- IdP જૂથોમાંથી ટૂલ સ્કોપ્સમાં RBAC મેપ કરો.
- Bedrock Guardrails ને સક્ષમ કરો; પ્રોમ્પ્ટ્સમાં સિક્રેટ્સને મંજૂરી આપશો નહીં.
- જરૂર પડે ત્યાં PII ને રિડેક્ટ કરો અને રીટેન્શન વિન્ડોઝ દસ્તાવેજ કરો.
- Object Lock સાથે S3 પર અપરિવર્તનશીલ લોગ; તમારા SIEM માં નિકાસ કરો.
- ઘટના પ્રતિસાદ અને મોડેલ રોલબેક માટે રનબુક રાખો.
અમલીકરણ બ્લુપ્રિન્ટ: પ્રોડક્શન માટે 10 પગલાં
- ટોચના 3 એજન્ટ ઉપયોગ કેસો (IT, HR, વેચાણ કામગીરી) અને સફળતા મેટ્રિક્સ વ્યાખ્યાયિત કરો (ડિફ્લેક્શન રેટ, CSAT, સમય-થી-રિઝોલ્યુશન).
- AWS એકાઉન્ટ્સ, VPC, IAM બેસલાઇન્સ અને Bedrock એક્સેસ ઊભા કરો.
- SSO/SCIM ને એકીકૃત કરો; ભૂમિકાઓ અને મંજૂરી પ્રવાહો મેપ કરો.
- Glean માં કોર સ્ત્રોતોને કનેક્ટ કરો અને પરવાનગી-સભાન પુનઃપ્રાપ્તિને માન્ય કરો.
- સ્ટેપ ફંક્શન્સ સાથે ન્યૂનતમ ઓર્કેસ્ટ્રેશન સેવા (Lambda + API ગેટવે) બનાવો.
- RAG પ્રોમ્પ્ટ કરાર, ટાંકણો અને સ્ત્રોત ફિલ્ટરિંગ લાગુ કરો.
- બે ટૂલ્સને અંત-થી-અંત ઉમેરો (પહેલા ફક્ત વાંચવા માટે, પછી મંજૂરી સાથે લખો).
- લોગીંગ, મૂલ્યાંકનો અને ડેશબોર્ડ્સ ઇન્સ્ટ્રુમેન્ટ કરો; 150-પ્રશ્નનો ગોલ્ડ સેટ બનાવો.
- 50-100 વપરાશકર્તાઓ સાથે બંધ બીટા ચલાવો; ટોચની સમસ્યાઓ ઠીક કરો; SLOs સેટ કરો.
- વ્યાપકપણે રોલ આઉટ કરો; સાપ્તાહિક ફેરફાર-સમીક્ષા અને માસિક મોડેલ મૂલ્યાંકન સ્થાપિત કરો.
Glean અને AWS સાથે AI એજન્ટ્સ બનાવતી વખતે વારંવાર પૂછાતા પ્રશ્નો
હું એન્ટરપ્રાઇઝ એજન્ટ્સમાં ભ્રમણા કેવી રીતે ઘટાડી શકું?
Glean માંથી પુનઃપ્રાપ્તિ સાથે મોડેલને ગ્રાઉન્ડ કરો અને કડક પ્રોમ્પ્ટ લાગુ કરો: ફક્ત પ્રદાન કરેલ સંદર્ભનો ઉપયોગ કરો અને હંમેશા સ્ત્રોતો ટાંકો. નીચા આત્મવિશ્વાસ સાથે જવાબોને નકારો અને સ્પષ્ટતા કરતા પ્રશ્નો પૂછો. જ્યારે તમે પરવાનગી-સભાન પુનઃપ્રાપ્તિ પર આધાર રાખો છો ત્યારે મોટાભાગની ભ્રમણા ઘટી જાય છે.
શું એજન્ટ એપ્લિકેશન્સમાં દસ્તાવેજ-સ્તરની પરવાનગીઓનું સન્માન કરી શકે છે?
હા. જ્યારે તમે Glean અને AWS સાથે AI એજન્ટ્સ બનાવો છો, ત્યારે Glean ક્વેરી સમયે કનેક્ટેડ એપ્લિકેશન્સમાંથી પરવાનગીઓ લાગુ કરે છે, તેથી એજન્ટ ફક્ત તે જ જુએ છે જે વપરાશકર્તા ઍક્સેસ કરી શકે છે. કસ્ટડીની સાંકળ જાળવવા માટે હંમેશા વપરાશકર્તાનું ઓળખ ટોકન પાસ કરો.
મારે AWS પર કયા મોડેલ્સથી શરૂઆત કરવી જોઈએ?
બહુવિધ મોડેલ્સની ઍક્સેસ માટે Amazon Bedrock નો ઉપયોગ કરો. તર્ક માટે મજબૂત સામાન્ય મોડેલ અને રૂટીંગ માટે નાના, ઝડપી મોડેલથી શરૂઆત કરો. તમારા ક્યુરેટેડ ગોલ્ડ સેટ સામે લેટન્સી, ખર્ચ અને ચોકસાઈનું મૂલ્યાંકન કરો.
હું Jira અથવા ServiceNow જેવી સિસ્ટમ્સમાં એજન્ટ્સને સુરક્ષિત રીતે ક્રિયાઓ કરવા કેવી રીતે દઈ શકું?
દરેક ટૂલને કડક સ્કીમા, ઇનપુટ માન્યતા અને મંજૂરી વર્કફ્લો સાથે આવરે છે. દરેક ટૂલ કૉલ લોગ કરો અને ઓડિટ માટે આઉટપુટ સ્ટોર કરો. અસરકારક ક્રિયાઓ માટે, માનવ પુષ્ટિ પગલાની જરૂર છે.
કયા મેટ્રિક્સ સાબિત કરે છે કે એજન્ટ ઉત્પાદન માટે તૈયાર છે?
ગ્રાઉન્ડેડનેસ (ટાંકણ દર), જવાબની ચોકસાઈ, P95 લેટન્સી, રિઝોલ્યુશન/ડિફ્લેક્શન રેટ અને ઉકેલાયેલા કાર્ય દીઠ ખર્ચ ટ્રૅક કરો. ડેશબોર્ડ્સ બનાવો અને તમારા ગોલ્ડ સેટ પર સાપ્તાહિક રીગ્રેશન તપાસ ચલાવો.
માર્ગ દ્વારા: બિલ્ડ લૂપને વેગ આપવો
નોંધનીય છે: જો તમારી ટીમ વારંવાર પ્રોટોટાઇપ બનાવે છે, તો સંશોધન અને ડ્રાફ્ટિંગ માટેનો કોપાયલોટ ડિઝાઇન દસ્તાવેજો, રનબુક્સ અને પ્રોમ્પ્ટ પુનરાવૃત્તિઓને ઝડપી બનાવી શકે છે. Sider.AI જેવા ટૂલ્સ ટીમોને લાંબા થ્રેડોનો સારાંશ આપવામાં, મૂલ્યાંકન પ્રોમ્પ્ટ્સનો ડ્રાફ્ટ બનાવવામાં અને મોડેલ આઉટપુટને બાજુ-બાજુ સરખાવવામાં મદદ કરે છે—જ્યારે તમે Glean અને AWS સાથે એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ કેવી રીતે બનાવવા તે ટ્યુન કરી રહ્યાં હોવ ત્યારે ઉપયોગી છે. મુખ્ય ટેકઅવે અને આગામી પગલાં
- Glean અને AWS સાથે AI એજન્ટ્સ બનાવવાથી તમને ઓળખ-સભાન પુનઃપ્રાપ્તિ અને એન્ટરપ્રાઇઝ-ગ્રેડ ઓર્કેસ્ટ્રેશન મળે છે.
- ફેન્સી આયોજન તર્ક પહેલાં ઓળખ, ગવર્નન્સ અને પરવાનગી-સભાન પુનઃપ્રાપ્તિથી શરૂઆત કરો.
- Bedrock ગાર્ડ્રેલ્સ, કડક ટૂલ સ્કીમા અને માનવ-ઇન-ધ-લૂપ મંજૂરીઓનો ઉપયોગ કરો.
- દરેક વસ્તુને ઇન્સ્ટ્રુમેન્ટ કરો: મૂલ્યાંકનો, ઓડિટ અને ખર્ચ નિયંત્રણો.
આ અઠવાડિયાના આગામી પગલાં:
- તમારા ટોચના ત્રણ ઉપયોગ કેસો અને સફળતા મેટ્રિક્સનો ડ્રાફ્ટ બનાવો.
- Glean માં બે કોર સ્ત્રોતોને કનેક્ટ કરો; 150-પ્રશ્નનું મૂલ્યાંકન ચલાવો.
- એક વાંચવા માટેના ટૂલ સાથે ન્યૂનતમ Lambda + સ્ટેપ ફંક્શન્સ ઓર્કેસ્ટ્રેટર ઊભો કરો.
- પાયલોટ વિસ્તરે તે પહેલાં તમારા લેટન્સી અને ખર્ચ બજેટ સેટ કરો.
FAQ
Q1: AWS પર AI એજન્ટ્સ માટે એન્ટરપ્રાઇઝ-રેડીનો અર્થ શું છે?
તેનો અર્થ છે સુરક્ષિત, ઓડિટ કરી શકાય તેવા એજન્ટ્સ જે SSO અને દસ્તાવેજ પરવાનગીઓનું સન્માન કરે છે, ટાંકણો પ્રદાન કરે છે અને અનુપાલન ઇન્ફ્રાસ્ટ્રક્ચર પર ચાલે છે. જ્યારે તમે Glean અને AWS સાથે AI એજન્ટ્સ બનાવો છો, ત્યારે તમને પરવાનગી-સભાન પુનઃપ્રાપ્તિ અને ક્લાઉડ-ગ્રેડ ઓબ્ઝર્વેબિલિટી મળે છે.
Q2: Glean AI જવાબોમાં ડેટા લીકને કેવી રીતે અટકાવે છે?
Glean ક્વેરી સમયે દરેક કનેક્ટેડ એપ્લિકેશનમાંથી દસ્તાવેજ-સ્તરની પરવાનગીઓ લાગુ કરે છે. એજન્ટ ફક્ત તે જ સામગ્રી પુનઃપ્રાપ્ત કરે છે જે વપરાશકર્તા ઍક્સેસ કરી શકે છે, જે Glean અને AWS સાથે એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ બનાવતી વખતે નિર્ણાયક છે.
Q3: મારે ઓર્કેસ્ટ્રેશન માટે કઈ AWS સેવાઓનો ઉપયોગ કરવો જોઈએ?
એક્ઝેક્યુશન માટે Lambda અથવા ECS નો ઉપયોગ કરો, મલ્ટી-સ્ટેપ વર્કફ્લો માટે સ્ટેપ ફંક્શન્સ, મોડેલ્સ અને ગાર્ડ્રેલ્સ માટે Bedrock અને ઓળખપત્રો માટે સીક્રેટ્સ મેનેજર. આ સ્ટેક Glean અને AWS સાથે AI એજન્ટ્સ બનાવવા માટે સાબિત આધાર છે.
Q4: હું ચોકસાઈનું મૂલ્યાંકન કેવી રીતે કરું અને ભ્રમણા કેવી રીતે ઘટાડી શકું?
પ્રશ્નોનો ગોલ્ડ સેટ બનાવો, ટાંકણોની જરૂર છે અને પુનઃપ્રાપ્તિ-ઓગમેન્ટેડ જનરેશનનો ઉપયોગ કરો. Glean અને AWS સાથે, પરવાનગી-સભાન પુનઃપ્રાપ્તિ વત્તા ગાર્ડ્રેલ્સ ભ્રમણાને નોંધપાત્ર રીતે ઘટાડે છે.
Q5: શું AI એજન્ટ્સ સુરક્ષિત રીતે ટિકિટ બનાવવી અથવા Slack માં પોસ્ટ કરવા જેવી ક્રિયાઓ કરી શકે છે?
હા—સ્કીમા-માન્ય ટૂલ્સ, ઉચ્ચ-અસર ક્રિયાઓ માટે મંજૂરીઓ અને સંપૂર્ણ ઓડિટ લોગીંગ સાથે. જ્યારે તમે Glean અને AWS સાથે એન્ટરપ્રાઇઝ-રેડી AI એજન્ટ્સ બનાવો છો ત્યારે આ એક મુખ્ય પેટર્ન છે.