मैंने दोनों tools के SDK type definitions और system prompts को खंगाला। 29 बनाम 7 का अंतर feature count का नहीं है। यह उसी सवाल के दो बुनियादी तौर पर अलग जवाब हैं: एक AI coding agent को आपके system के साथ कैसे interact करना चाहिए?
किसी ने LLM से लिखे Rust reimplementation of SQLite को benchmark किया। Code जो सही दिखता है और code जो सच में सही है, उनके बीच का अंतर पांच orders of magnitude निकला।
मैंने reverse-engineer किया कि Codex, context overflow को Claude Code से अलग कैसे handle करता है। जवाब में है AES encryption, session handover patterns, और KV cache tricks।
किसी ने बताया कि मैं बहुत कम पब्लिश करता हूं, उसके बाद नींद नहीं आई। सुबह 3 बजे free-router बनाना शुरू किया। यह रियल-टाइम में मुफ्त AI मॉडल खोजकर आपके कोडिंग टूल्स से एक बटन में जोड़ देता है।
जब agents एक दिन में 3,000 commits push करते हैं, तो इंसान सब review नहीं कर सकते। यहाँ जानें कैसे बनाएं एक machine-verified pipeline जो वो पकड़े जो इंसान नहीं पकड़ सकते।
नए benchmark data से पता चला कि AGENTS.md और CLAUDE.md context files coding agent की performance असल में घटा देती हैं। कभी-कभी आलस ही सबसे बड़ी engineering होती है।
तीन कंपनियों ने लगभग एक साथ अपने कोडिंग एजेंट अपडेट किए। दिशाएँ मिलती-जुलती हैं। असली मुकाबला मॉडल का नहीं, डेवलपर वर्कफ़्लो को अवशोषित करने की रफ़्तार का है।
Thomas Wolf की पांच भविष्यवाणियां कि AI सॉफ्टवेयर आर्किटेक्चर को कैसे मूलभूत रूप से बदलेगा। डिपेंडेंसी के अंत से लेकर AI-नेटिव प्रोग्रामिंग लैंग्वेज के उदय तक।
OpenAI की Codex टीम ने केवल AI एजेंट्स का उपयोग करके 10 लाख लाइन का कोडबेस बनाया। यहाँ उनके द्वारा खोजे गए harness engineering के पाँच मूल सिद्धांत हैं।