अनुक्रमणिका
4 मिनट पढ़ने में

AI Wrapper का युग समाप्त हो गया। Claude Agent Wrapper का युग शुरू हो रहा है।

Anthropic के Tariq Shihipar ने प्रोडक्शन-ग्रेड एजेंट बनाने की असली कुंजी बताई - Bash-first टूलिंग से लेकर फाइल सिस्टम-आधारित कॉन्टेक्स्ट इंजीनियरिंग तक।

मैंने Anthropic में Claude Code के प्रमुख Tariq Shihipar की 90 मिनट की वर्कशॉप का विश्लेषण किया।

Manus के बाद से एजेंट्स में दिलचस्पी तेज़ी से बढ़ी है - लेकिन प्रोडक्शन में काम करने वाले एजेंट असल में कैसे बनाएँ, यह अब भी बेहद अस्पष्ट है। यह वर्कशॉप Anthropic का इसी सवाल का जवाब थी।

सिर्फ़ LLM API को रैप करने वाली सर्विसेज़ से आगे, जब हम एजेंट-नेटिव एप्लिकेशन डिज़ाइन करते हैं तो क्या बदलना चाहिए? यहाँ चार सबसे अहम बातें हैं।

Bash सबसे ताकतवर टूल है

आपको दर्जनों कस्टम टूल्स की ज़रूरत नहीं है।

  • Linux पर पहले से मौजूद सॉफ़्टवेयर - ffmpeg, jq, curl, और बाकी - Bash कमांड्स के ज़रिए कंपोज़ करके ज़्यादातर काम निपटा सकते हैं।
  • एजेंट्स man pages और --help आउटपुट पढ़कर खुद ही टूल्स इस्तेमाल करना सीख लेते हैं।
  • आपको हर टूल की स्पेसिफ़िकेशन प्रॉम्प्ट में ठूँसने की ज़रूरत नहीं, जिसका मतलब है context window की कम बर्बादी।

इसका मतलब गहरा है: हर क्षमता के लिए अलग से कस्टम इंटीग्रेशन बनाने की बजाय, आप एजेंट को एक शेल दे दीजिए और उसे मौजूदा सॉफ़्टवेयर कंपोज़ करने दीजिए। CLI टूल्स की पूरी दुनिया एजेंट का टूलबॉक्स बन जाती है - बिना किसी को पहले से रजिस्टर किए।

एजेंट लूप का मूल है वेरिफ़िकेशन

Context इकट्ठा करो → Action लो → काम की जाँच करो।

  • एजेंट इस्तेमाल करने का मापदंड सीधा है: क्या आप आउटपुट को वेरिफ़ाई कर सकते हैं?
  • कोड को कंपाइलर और लिंटर से आसानी से वेरिफ़ाई किया जा सकता है। रिसर्च टास्क के लिए आपको अलग से वेरिफ़िकेशन लॉजिक डिज़ाइन करना होगा - जैसे सोर्स साइटेशन अनिवार्य करना।
  • सिर्फ़ मॉडल की बुद्धिमत्ता पर भरोसा मत करिए। लूप के अंदर डिटरमिनिस्टिक टूल्स रखिए - फ़ाइल एग्ज़िस्टेंस चेक, सिंटैक्स वैलिडेशन, टाइप चेकिंग - ताकि hallucination से बचा जा सके।

यही वो बात है जो ज़्यादातर टीमें नहीं समझतीं। वे एजेंट्स को स्मार्ट बनाने पर ध्यान देती हैं जबकि उन्हें एजेंट्स को ज़्यादा वेरिफ़ायबल बनाना चाहिए। एक औसत मॉडल जिसके पास मज़बूत वेरिफ़िकेशन लूप हो, वो बिना वेरिफ़िकेशन वाले शानदार मॉडल को हरा देगा।

गैर-डेव काम भी कोड जनरेशन से हल होता है

मौसम चेक करने या ईमेल एनालिसिस जैसे सीधे कामों को भी टेक्स्ट रिस्पॉन्स की बजाय कोड से हैंडल करना बेहतर है।

  • तरीका यह है: एजेंट को ऑन-द-फ़्लाई स्क्रिप्ट्स लिखने दो जो कई API को कनेक्ट करें और डेटा प्रोसेस करें।
  • Claude Code यूज़र्स का एक बड़ा हिस्सा असल में नॉन-डेव रोल्स में है - मार्केटिंग, फ़ाइनेंस, ऑपरेशन्स।
  • डेटा एनालिसिस और दोहराव वाले कामों को डिस्पोज़ेबल कोड की तरह ट्रीट करना - एक बार लिखो, एक बार चलाओ, फेंक दो - यह स्टैंडर्ड वर्कफ़्लो बनता जा रहा है।

इससे एजेंट युग में “कोडिंग” का मतलब ही बदल जाता है। एजेंट को आपके ईमेल प्रोवाइडर के साथ कोई पहले से बना इंटीग्रेशन नहीं चाहिए। वह एक स्क्रिप्ट लिखता है जो API कॉल करती है, डेटा फ़िल्टर करती है, और नतीजे लौटाती है - सब कुछ रनटाइम पर जनरेट होता है।

Context Engineering फ़ाइल सिस्टम में बसती है

Prompt engineering से आगे, आपको उस एनवायरनमेंट को डिज़ाइन करना होगा जिसमें एजेंट काम करता है।

  • एजेंट को नई क्षमताएँ देना किसी जटिल फ़ाइन-ट्यूनिंग के बारे में नहीं है। बात बस इतनी है कि उसे एक फ़ोल्डर दे दो जिसमें अच्छी तरह लिखी हुई markdown फ़ाइलें और स्क्रिप्ट्स हों।
  • Tariq ने इसे “file system pilled” होना बताया।
  • एजेंट्स की अपनी state होती है। एजेंट आर्किटेक्चर का मूल एक सैंडबॉक्स्ड एनवायरनमेंट है - एक कंटेनर - जहाँ एजेंट के पास फ़ाइल सिस्टम की एक्सेस होती है और वो Bash कमांड्स चला सकता है।

इसे ऐसे समझिए: फ़ाइल सिस्टम एजेंट की लॉन्ग-टर्म मेमोरी, उसकी रेफ़रेंस लाइब्रेरी, और उसका वर्कस्पेस - सब एक साथ है। प्रोजेक्ट रूट पर CLAUDE.md फ़ाइल सिर्फ़ डॉक्यूमेंटेशन नहीं है - यह एजेंट की ऑनबोर्डिंग गाइड है। scripts/ डायरेक्टरी सिर्फ़ यूटिलिटीज़ नहीं है - यह एजेंट का टूलकिट है।

पैराडाइम शिफ़्ट

जैसे वेब डेवलपमेंट jQuery से React की ओर बढ़ा - इम्परेटिव DOM मैनिपुलेशन से कंपोनेंट-बेस्ड आर्किटेक्चर की ओर - वैसे ही एजेंट डेवलपमेंट रॉ प्रॉम्प्ट कॉल्स से स्ट्रक्चर्ड फ़्रेमवर्क की ओर बढ़ रहा है।

सवाल अब यह नहीं रहा कि “मुझे क्या पूछना चाहिए?” बल्कि यह है कि “मुझे कौन सी परमिशन्स और कैसा एनवायरनमेंट देना चाहिए?”

जो टीमें यह फ़र्क समझ लेंगी - कि एजेंट की परफ़ॉर्मेंस मॉडल से कम और उसके आसपास के सिस्टम से ज़्यादा तय होती है - वही अगली पीढ़ी का सॉफ़्टवेयर बनाएँगी।

Anthropic में Tariq Shihipar की वर्कशॉप पर आधारित।

न्यूज़लेटर से जुड़ें

मेरे नवीनतम प्रोजेक्ट्स, लेखों और AI तथा वेब डेवलपमेंट प्रयोगों के बारे में अपडेट प्राप्त करें।