यदि आप ChatGPT को चैट से आगे बढ़ाकर वास्तविक कार्रवाई करने में धकेलने के लिए उत्सुक हैं, तो आप सही जगह पर हैं। Gemini 2.5 Flash को कम-विलंबता तर्क और एजेंटिक टूल उपयोग के लिए डिज़ाइन किया गया है—जिसका अर्थ है कि यह तय कर सकता है कि कब फ़ंक्शन को कॉल करना है, डेटा प्राप्त करना है और कार्यों को पूरा करने के लिए टूल को चेन करना है। हाल के अपडेट में बेहतर टूल-उपयोग व्यवहार और दक्षता पर जोर दिया गया है, जो इसे उत्पादन-ग्रेड एजेंटों के लिए आदर्श बनाता है जिन्हें विश्वसनीयता से समझौता किए बिना गति की आवश्यकता होती है। Google के आधिकारिक दस्तावेज़ संरचित फ़ंक्शन कॉलिंग और लाइव टूल एकीकरण की रूपरेखा तैयार करते हैं, जो नीचे दिए गए वर्कफ़्लो को अनलॉक करते हैं।
नीचे 30 परीक्षण किए गए, कॉपी-पेस्ट प्रॉम्प्ट दिए गए हैं जो आपके बिल्ड को गति देंगे—जिन्हें पुनर्प्राप्ति, डेटा निष्कर्षण, योजना, ऑर्केस्ट्रेशन, मूल्यांकन और सुरक्षा जैसे व्यावहारिक परिदृश्यों द्वारा व्यवस्थित किया गया है। इनका यथावत उपयोग करें या अपनी स्वयं की टूल स्कीमा के साथ अनुकूलित करें।
शुरू करने से पहले प्रो टिप: अपनी सिस्टम या डेवलपर निर्देशों में, स्पष्ट रूप से टूल अनुबंधों (नाम, विवरण, JSON स्कीमा) को परिभाषित करें, गार्डरेल स्थापित करें (कब क्या कॉल करना है), और प्रतिक्रिया स्वरूपों को निर्दिष्ट करें। उद्यम विश्वसनीयता के लिए, दस्तावेज़ों में उल्लिखित फ़ंक्शन-कॉलिंग और स्कीमा अनुशासन का पालन करें।
—
इन प्रॉम्प्ट का उपयोग कैसे करें
- जहां आपको {tool_name}, {schema} या {constraints} दिखाई दे, वहां अपनी वास्तविक टूल परिभाषाएं डालें।
- उचित होने पर सख्त JSON का अनुरोध करके प्रतिक्रियाओं को नियतात्मक रखें।
- मॉडल को चरण-दर-चरण सोचने के लिए प्रोत्साहित करें लेकिन केवल अंतिम संरचित कॉल आउटपुट करें।
—
अनुभाग 1: पुनर्प्राप्ति और खोज (RAG-रेडी)
- बाधाओं के साथ केंद्रित वेब लुकअप
“लक्ष्य: उपयोगकर्ता के प्रश्न का उत्तर केवल आवश्यकता होने पर खोज टूल का उपयोग करके दें। यदि ज्ञान अनिश्चित है, तो खोज को कॉल करें। यदि निश्चित है, तो सीधे उत्तर दें।
खोज को कॉल करते समय, कीवर्ड और साइट फ़िल्टर का संक्षिप्त रूप से उपयोग करें। यदि कई परिणाम हैं, तो स्रोतों के साथ शीर्ष 3 को सारांशित करें। यदि अभी भी अनिश्चित है, तो एक स्पष्टीकरण प्रश्न पूछें।
उपयोगकर्ता प्रश्न: '{question}'
नीति: चौड़ाई से अधिक परिशुद्धता को प्राथमिकता दें। जब खोज का उपयोग किया जाता है तो स्रोतों का हवाला दें।”
- मल्टी-हॉप सत्यापन
“कार्य: दावे को सत्यापित करें: '{claim}'। चरण: (1) मुख्य कथनों की पहचान करें। (2) विशिष्ट कीवर्ड के साथ प्रत्येक कथन के लिए खोज को कॉल करें। (3) कम से कम दो स्वतंत्र स्रोतों को क्रॉस-चेक करें। (4) {‘verdict’: ‘true/false/uncertain’, ‘evidence’: . के रूप में फैसला वापस करें।
- Google के फ़ंक्शन-कॉलिंग और लाइव टूल दस्तावेज़ संरचित कॉलों के लिए मजबूत पैटर्न प्रदान करते हैं, जो बाहरी API के साथ अनुमानित एकीकरण को सक्षम करते हैं।
- उद्यम टीमें बड़े पैमाने पर विश्वसनीयता के लिए फ़ंक्शन कॉलिंग, स्कीमा कठोरता और सर्वोत्तम प्रथाओं पर Vertex AI मार्गदर्शन का लाभ उठा सकती हैं।
ध्यान देने योग्य: यदि आप तेज़ पुनरावृत्ति के साथ मल्टी-टूल ऑटोमेशन का प्रोटोटाइप बना रहे हैं, तो एक दृश्य या चैट-फ़र्स्ट IDE जो प्रॉम्प्ट लाइब्रेरी, टूल वायरिंग और त्वरित परीक्षण का समर्थन करता है, आपकी लूप को गति दे सकता है। Sider-शैली वर्कफ़्लो जो प्रॉम्प्ट का दस्तावेजीकरण करते हैं, संरचना को लागू करते हैं और एक-क्लिक परीक्षण की अनुमति देते हैं, एकीकरण त्रुटियों को कम करते हैं और मूल्यांकन को अधिक व्यवस्थित बनाते हैं।
अगले कदम
- ऊपर दिए गए 3-5 प्रॉम्प्ट चुनें जो आपके उपयोग के मामले से मेल खाते हों और उन्हें अपने टूल से कनेक्ट करें।
- लाइव होने से पहले गार्डरेल (PII रिडेक्शन, स्कीमा सत्यापन) जोड़ें।
- विलंबता, टूल-कॉल गिनती और त्रुटि दरों को ट्रैक करें; लागत/विलंबता-जागरूक योजना के साथ दोहराएं।
- जैसे-जैसे आपकी विश्वसनीयता में सुधार होता है, सिंगल-टूल कॉल से टूल-की-चेन पैटर्न तक विस्तार करें।
सामान्य प्रश्न
Q1: एजेंटिक टूल उपयोग के लिए Gemini 2.5 Flash को क्या अच्छा बनाता है?
यह कम-विलंबता तर्क और संरचित फ़ंक्शन कॉलिंग के लिए अनुकूलित है, जो उत्पादन एजेंटों के लिए तेज़, अनुमानित टूल निष्पादन को सक्षम करता है। आधिकारिक दस्तावेज़ बताते हैं कि विश्वसनीय ऑर्केस्ट्रेशन के लिए टूल को कैसे कनेक्ट किया जाए और स्कीमा को कैसे लागू किया जाए।
Q2: टूल का उपयोग करते समय मैं मतिभ्रम को कैसे कम करूं?
पुनर्प्राप्ति चरणों के पीछे तथ्यात्मक दावों को गेट करें और कई स्रोतों से सत्यापित करें। एक मतिभ्रम जांच जोड़ें जो कम-आत्मविश्वास वाले तथ्यों के लिए खोज को ट्रिगर करती है और जब टूल का उपयोग किया जाता है तो उद्धरण वापस करती है।
Q3: क्या मुझे हमेशा Gemini 2.5 Flash के साथ टूल कॉल करने के लिए मजबूर करना चाहिए?
नहीं। मॉडल को यह तय करने दें कि अनिश्चितता या लापता संदर्भ के आधार पर टूल को कब कॉल करना है। सिस्टम प्रॉम्प्ट में स्पष्ट नीतियां प्रदान करें कि कब कौन सा टूल कॉल करना है और यदि आत्मविश्वास कम रहता है तो कैसे प्रतिक्रिया देनी है।
Q4: फ़ंक्शन-कॉल आउटपुट को संरचित करने का सबसे अच्छा तरीका क्या है?
अपने टूल के स्कीमा से मेल खाने वाले सख्त JSON का उपयोग करें और निष्पादन से पहले मान्य करें। यदि सत्यापन विफल हो जाता है, तो कॉल को स्वतः-ठीक करें और पुनः-उत्सर्जित करें या सुरक्षित हैंडलिंग के लिए एक संरचित त्रुटि वापस करें।
Q5: एकाधिक टूल का उपयोग करते समय मैं विलंबता को कैसे कम रख सकता हूँ?
एक समय-बद्ध योजनाकार को अपनाएं, अनावश्यक खोजों को कम करें, मध्यवर्ती परिणामों को कैश करें और उच्च-मूल्य वाले टूल कॉल को प्राथमिकता दें। कॉल को कैप करने और समय सीमा तंग होने पर एक फास्ट-पाथ सारांश वापस करने के लिए लागत/विलंबता-जागरूक ह्यूरिस्टिक्स का उपयोग करें।