अनुक्रमणिका
5 मिनट पढ़ने में

Claude Code टीम ने टूल्स को 3 बार दोबारा बनाकर सीखे 4 डिज़ाइन सिद्धांत

Anthropic की Claude Code टीम ने अपने टूल्स तीन बार दोबारा बनाए। कम टूल्स से AI ने बेहतर काम किया। यहाँ हैं अनुभव से सीखे चार सिद्धांत।

त्वरित सार

Anthropic की Claude Code टीम ने अपने टूल्स तीन बार दोबारा बनाए। कम टूल्स से AI ने बेहतर काम किया। यहाँ हैं अनुभव से सीखे चार सिद्धांत।

टूल्स कम किए, तो AI ने बेहतर काम किया। एजेंट बनाते समय सबसे स्वाभाविक सोच यही होती है: “अगर कोई फीचर कम है, तो एक और टूल दे दो।” Anthropic की टीम ने Claude Code को एक साल तक बनाते हुए इसका ठीक उल्टा पाया। हर अतिरिक्त टूल AI के लिए “इसे कॉल करूँ या नहीं?” वाली सोच का बोझ बढ़ाता है — और यह लागत बढ़ती ही जाती है।

मैं खुद एजेंट बनाते हुए इसी जाल में फँसा था, इसलिए Claude Code टीम के डेवलपर Thariq की यह कहानी मुझे गहरे तक लगी। यहाँ उनका पूरा सफ़र है — कैसे उन्होंने टूल्स जोड़े, हटाए और फिर से डिज़ाइन किए।

एक टूल में दो भूमिकाएँ डालो, तो AI रुक जाता है

यह Claude Code टीम की सबसे पहली समस्या थी। उन्हें यूज़र से सवाल पूछने की सुविधा चाहिए थी, तो उन्होंने इसे “प्लानिंग” टूल में ही डाल दिया। कार्यान्वयन तेज़ था, लेकिन AI एक साथ प्लान बनाने और सवाल तैयार करने की कोशिश करता था। जब यूज़र का जवाब प्लान से टकराता, तो AI फ़ैसला नहीं कर पाता।

दूसरी कोशिश में उन्होंने AI से Markdown फ़ॉर्मेट में सवाल निकलवाने की कोशिश की। AI ने फ़ॉर्मेट को मनमाने ढंग से बदल दिया या अतिरिक्त टेक्स्ट जोड़ दिया। तीसरी बार उन्होंने सवाल पूछने की सुविधा को एक अलग टूल — AskUserQuestion — में अलग किया, और तब जाकर सब स्थिर हुआ। एक टूल, एक भूमिका। सुनने में सीधा लगता है, लेकिन जब तक जल नहीं जाते, समझ नहीं आता।

  • प्लान + सवाल एक साथ — AI गलती से एक ही टूल को दो बार कॉल करता था
  • Markdown फ़ॉर्मेट आउटपुट — AI वाक्य जोड़ देता या स्ट्रक्चर को अनदेखा करता
  • अलग टूल में विभाजन — स्ट्रक्चर्ड रिस्पॉन्स आखिरकार स्थिर रूप से आने लगे
  • डिज़ाइन कितना भी अच्छा हो, अगर AI उसे कॉल नहीं करना चाहता, तो बेकार है

अच्छे से काम करने वाला टूल एक दिन बेड़ी बन जाता है

टूल्स को ठीक से अलग करना कहानी का अंत नहीं है। मैं इसे “टूल की एक्सपायरी डेट (tool decay)” कहूँगा — वह घटना जब कभी ज़रूरी रहा टूल मॉडल अपग्रेड के बाद उल्टा बोझ बन जाता है।

शुरुआत में Claude Code में एक Todo टूल था, और सिस्टम हर पाँच टर्न पर रिमाइंडर भेजता था: “अपनी टास्क लिस्ट मत भूलो।” मॉडल बेहतर होने के बाद ये रिमाइंडर उल्टे पड़ गए। AI ज़िद से अपने मूल प्लान पर अड़ा रहता, तब भी जब उसे बदलना चाहिए था। जब Opus 4.5 में सब-एजेंट सहयोग संभव हुआ, तो मौजूदा Todo स्ट्रक्चर में एजेंट्स के बीच टास्क शेयर करना ही संभव नहीं था।

आखिरकार उन्होंने इसे पूरी तरह Task Tool से बदल दिया।

  • TodoWrite को Task Tool से बदला — एजेंट्स के बीच डिपेंडेंसी शेयरिंग संभव हुई
  • “क्या यह टूल अभी भी मान्य है?” की समय-समय पर समीक्षा ज़रूरी — नए टूल जोड़ने जितना ही महत्वपूर्ण
  • कम मॉडल्स को सपोर्ट करने से ये फ़ैसले तेज़ होते हैं
  • टूल्स की संख्या से ज़्यादा ज़रूरी है कि टूल का रूप मॉडल की क्षमताओं से मेल खाए

AI को संदर्भ चम्मच से खिलाने से वह और ख़राब होता है

टूल्स जोड़ने-हटाने की प्रक्रिया में Claude Code टीम ने एक और मूलभूत पैटर्न खोजा: AI को जानकारी देने से बेहतर है कि उसे खुद खोजने दो।

शुरू में उन्होंने RAG वेक्टर डेटाबेस से संदर्भ पहले से लोड किया। तेज़ और शक्तिशाली था, लेकिन अलग-अलग वातावरण में इंडेक्सिंग टूट जाती थी और AI निष्क्रिय हो जाता — बस जो दिया गया, उसी पर निर्भर रहता। जब उन्होंने AI को Grep टूल दिया ताकि वह सीधे कोडबेस में खोज सके, तो संदर्भ की गुणवत्ता बढ़ गई। उसके ऊपर Skills फ़ाइलें जोड़ीं, जिससे AI फ़ाइलों के अंदर संदर्भित अन्य फ़ाइलों को रिकर्सिवली खोज सकता था।

इसे मैं प्रगतिशील संदर्भ खोज (progressive disclosure) कहता हूँ — सारी जानकारी एक बार में देने के बजाय, AI को ज़रूरत के अनुसार खुद खोजने देना।

  • RAG — वातावरण पर ज़्यादा निर्भरता, AI निष्क्रिय रूप से संदर्भ खपत करता
  • Grep + Skills — AI सक्रिय रूप से फ़ाइलों की कई परतें खोजता
  • एक साल में “संदर्भ न खोज पाने वाले AI” से “खुद खोजने वाले AI” में बदलाव
  • बिना नए टूल जोड़े, सिर्फ़ Skills फ़ाइलों से क्षमता विस्तार संभव

टूल जोड़े बिना AI की क्षमताएँ बढ़ाना

प्रगतिशील संदर्भ खोज पैटर्न ने एक और मामले में अपनी ताकत दिखाई। यूज़र Claude Code के इस्तेमाल के बारे में पूछते और वह जवाब नहीं दे पाता। सिस्टम प्रॉम्प्ट में सारा डॉक्यूमेंटेशन डाला जा सकता था, लेकिन यह सवाल कभी-कभार ही आता है। जब कम इस्तेमाल होने वाली जानकारी कॉन्टेक्स्ट विंडो में हमेशा जगह घेरती है, तो मुख्य काम — कोड लिखने — का प्रदर्शन गिरता है। इसे मैं संदर्भ शोर (context rot) कहता हूँ।

समाधान था एक समर्पित सब-एजेंट। जब उपयोग संबंधी सवाल आता, तभी एक गाइड एजेंट डॉक्स में खोजकर सिर्फ़ जवाब लौटाता। टूल्स की संख्या वही रही, लेकिन AI की क्षमताएँ बढ़ गईं।

  • सिस्टम प्रॉम्प्ट में सारी जानकारी — संदर्भ शोर से कोड गुणवत्ता गिरी
  • सिर्फ़ डॉक लिंक देना — AI बहुत ज़्यादा रिज़ल्ट कॉन्टेक्स्ट में लोड कर लेता
  • समर्पित सब-एजेंट + खोज निर्देश — साफ़-सुथरे, केंद्रित जवाब
  • टूल जोड़ने के बजाय स्ट्रक्चर बदलकर समस्या हल की

कोई जादुई फ़ॉर्मूला नहीं है

टूल्स जोड़ना, हटाना और फिर से डिज़ाइन करना — इस प्रक्रिया का कोई सार्वभौमिक फ़ॉर्मूला नहीं है। जब मॉडल बदलते हैं, टूल्स भी बदलने चाहिए। कल की सर्वोत्तम संरचना आज की बाधा बन सकती है।

Anthropic की टीम ने पूरे साल एक चीज़ दोहराई: AI का आउटपुट पढ़ो, प्रयोग करो, और फिर ठीक करो। अंत में, बेहतरीन एजेंट बनाने वाले वे लोग हैं जो AI के नज़रिए से देख सकते हैं।

न्यूज़लेटर से जुड़ें

मेरे नवीनतम प्रोजेक्ट्स, लेखों और AI तथा वेब डेवलपमेंट प्रयोगों के बारे में अपडेट प्राप्त करें।