Meta ने Manus को 2.5 अरब डॉलर में खरीदा - अब उसकी मूल तकनीक ओपन सोर्स है
Manus के 2.5 अरब डॉलर के मूल्यांकन के पीछे की फ़ाइल-आधारित मेमोरी प्रणाली अब एक मुफ़्त Claude Code स्किल के रूप में उपलब्ध है। जानिए यह हर AI एजेंट डेवलपर के लिए क्यों महत्वपूर्ण है।
अगर आपने कभी AI एजेंट को जटिल कामों के लिए इस्तेमाल किया है, तो आपने यह देखा होगा: एक लंबे वर्कफ़्लो के बीच में, एजेंट कुछ ऐसा कर रहा होता है जिसका आपकी मूल रिक्वेस्ट से कोई लेना-देना नहीं होता।
यह यूज़र की गलती नहीं है। यह बड़े भाषा मॉडल (LLM) की एक संरचनात्मक सीमा है। इस समस्या को हल करने वाली कंपनी - Manus - को Meta ने 2.5 अरब डॉलर में खरीद लिया। अब एक डेवलपर ने इसके मूल सिद्धांत को Claude Code स्किल के रूप में ओपन सोर्स कर दिया है, और तीन दिनों में यह GitHub पर करीब 1,000 स्टार तक पहुँच गया।
मूल समस्या - AI एजेंट अपने लक्ष्य क्यों भूल जाते हैं
LLM एक कॉन्टेक्स्ट विंडो के भीतर काम करते हैं - एक निश्चित आकार की कार्य स्मृति।
- बातचीत जितनी लंबी होती जाती है, मूल लक्ष्य मॉडल के सक्रिय ध्यान क्षेत्र से उतना ही दूर हो जाता है
- महत्वपूर्ण जानकारी अटेंशन मैकेनिज़्म की प्रभावी सीमा से बाहर चली जाती है
- एजेंट धीरे-धीरे मूल अनुरोध से भटक जाता है
इस घटना को गोल ड्रिफ़्ट (Goal Drift) कहते हैं। जब टूल कॉल 50 से अधिक हो जाती हैं, तो यह लगभग अपरिहार्य हो जाता है।
Manus का समाधान - फ़ाइल सिस्टम को बाहरी मेमोरी के रूप में उपयोग
Manus का जवाब आश्चर्यजनक रूप से सरल था: AI से नोट्स लिखवाओ।
- फ़ाइल सिस्टम को एजेंट के स्थायी मेमोरी स्टोर के रूप में उपयोग करना
- कॉन्टेक्स्ट विंडो की भौतिक सीमाओं को पूरी तरह से बायपास करना
- जब भी एजेंट को ज़रूरत हो, संग्रहीत जानकारी को वापस लाना
यह दृष्टिकोण कॉन्टेक्स्ट इंजीनियरिंग (Context Engineering) का एक रूप है - LLM की कार्य स्मृति में और उससे बाहर जानकारी कैसे प्रवाहित होती है, इसे डिज़ाइन करना।
ओपन सोर्स कार्यान्वयन - 3-फ़ाइल मेमोरी सिस्टम
planning-with-files नामक Claude Code स्किल Manus के सिद्धांत को तीन markdown फ़ाइलों से लागू करती है।
- task_plan.md - लक्ष्यों, प्रगति चरणों और त्रुटि लॉग वाला मास्टर प्लान। एजेंट को हर बड़े निर्णय से पहले यह फ़ाइल पढ़ने का निर्देश दिया जाता है
- notes.md - शोध परिणामों और मध्यवर्ती डेटा के लिए स्क्रैच पैड। कॉन्टेक्स्ट विंडो ओवरलोड को रोकता है
- [deliverable].md - अंतिम आउटपुट फ़ाइल जहाँ पूरा किया गया काम जमा होता है
सुंदरता सरलता में है। कोई कस्टम इंफ़्रास्ट्रक्चर नहीं, कोई डेटाबेस नहीं - बस डिस्क पर markdown फ़ाइलें।
मूल तंत्र - हर निर्णय से पहले योजना फ़ाइल दोबारा पढ़ो
इस सिस्टम का सबसे ज़रूरी नियम एक वाक्य में है:
“किसी भी बड़े निर्णय से पहले, योजना फ़ाइल पढ़ो।”
- LLM का अटेंशन मैकेनिज़्म सबसे हाल में दर्ज किए गए टोकन पर सबसे ज़्यादा प्रतिक्रिया देता है
- निर्णय से ठीक पहले
task_plan.mdपढ़ने से मूल लक्ष्य कॉन्टेक्स्ट के शीर्ष पर बहाल हो जाता है - यह समस्या को कॉन्टेक्स्ट विंडो बढ़ाकर नहीं, बल्कि उसके भीतर जानकारी की स्थिति को अनुकूलित करके हल करता है
कॉन्टेक्स्ट विंडो बढ़ाना ब्रूट फ़ोर्स है। रणनीतिक सूचना स्थिति निर्धारण इंजीनियरिंग है।
त्रुटि प्रबंधन - अनंत रिट्राई लूप को तोड़ना
दूसरा महत्वपूर्ण डिज़ाइन निर्णय अनिवार्य त्रुटि लॉगिंग है।
- जब त्रुटि होती है, एजेंट को
task_plan.mdके त्रुटि अनुभाग में इसे दर्ज करना अनिवार्य है - यह AI को चुपचाप रिट्राई करने के बजाय विफलता को स्पष्ट रूप से स्वीकार करने के लिए मजबूर करता है
- एजेंट को वही गलती दोहराने के बजाय योजना संशोधन की ओर निर्देशित किया जाता है
- डिबग लॉग स्वचालित रूप से एक उपोत्पाद के रूप में जमा होते हैं
इसके बिना, एजेंट बार-बार उसी दीवार से टकराते रहते हैं - बिना किसी प्रगति के टोकन और कॉन्टेक्स्ट जलाते रहते हैं।
निहितार्थ - AI एजेंट प्रदर्शन का नया मानक
तीन दिनों में लगभग 1,000 स्टार मिलने का कारण स्पष्ट है: अरबों डॉलर की आर्किटेक्चरल अंतर्दृष्टि अब किसी भी टर्मिनल वाले व्यक्ति के लिए सुलभ है।
गहरा सबक यह है कि AI एजेंट का प्रदर्शन मॉडल के आकार या पैरामीटर की संख्या से तय नहीं होता। यह मेमोरी आर्किटेक्चर डिज़ाइन से तय होता है - आप मॉडल की सीमाओं के इर्द-गिर्द सूचना प्रवाह को कैसे संरचित करते हैं।
सबसे अच्छे एजेंट वे नहीं हैं जिनका दिमाग सबसे बड़ा है। वे हैं जो नोट्स लेना जानते हैं।
न्यूज़लेटर से जुड़ें
मेरे नवीनतम प्रोजेक्ट्स, लेखों और AI तथा वेब डेवलपमेंट प्रयोगों के बारे में अपडेट प्राप्त करें।