작업 성공률 6.7%에서 68.3%로: 모델이 아니라 하네스가 10배 차이를 만들었다
LangChain의 Terminal Bench 결과와 hashline 포맷 실험이 보여준 것. 같은 모델로 리더보드 순위가 뒤집힌 이유는 프롬프트, 도구, 미들웨어 세 가지였다.
11 posts
LangChain의 Terminal Bench 결과와 hashline 포맷 실험이 보여준 것. 같은 모델로 리더보드 순위가 뒤집힌 이유는 프롬프트, 도구, 미들웨어 세 가지였다.
OpenClaw 창시자 Peter Steinberger의 OpenAI 합류가 단순한 인재 영입이 아닌 이유. AI가 채팅 앱 자체를 재정의하는 글로벌 흐름을 분석합니다.
OpenAI Codex 팀이 에이전트만으로 100만 줄 코드베이스를 구축하며 발견한 하네스 엔지니어링 5가지 핵심 원칙을 분석합니다.
Claude Code의 멀티 에이전트 팀 기능 실전 가이드입니다. 활성화 방법, 단축키, 터미널 호환성, 태스크 관리, 알려진 제한 사항을 정리했습니다.
OpenAI와 Google이 저가형 AI 요금제를 앞다퉈 출시하고, 중국 업체들이 가격 파괴를 주도하고 있습니다. 지금이 AI에 뛰어들 최적의 시점인 이유를 설명합니다.
앤스로픽의 Tariq Shihipar가 프로덕션급 에이전트 구축의 핵심을 공개했습니다 - Bash 중심 툴링부터 파일 시스템 기반 컨텍스트 엔지니어링까지.
AI의 문서 열람 비율이 50%에 육박하고 봇 트래픽이 사람의 3배를 넘어선 지금, 서비스들이 핵심 지식을 스킬로 패키징하기 시작했습니다.
안드레이 카파시가 개발자로서 이렇게 뒤처진 느낌은 처음이라 고백합니다. 그가 말하는 새로운 AI 에이전트 추상화 계층을 마스터하지 않으면 10배 뒤처질 수 있습니다.
Manus가 LangChain과의 공동 발표에서 프로덕션 AI 에이전트를 만들며 얻은 핵심 교훈을 공유했습니다. 컨텍스트 부패부터 평가 체계 재설계까지, 실전에서 검증된 원칙들입니다.
메타가 마누스를 약 5조원에 인수했습니다. 비밀은 더 큰 모델이 아닌 컨텍스트 엔지니어링에 있었습니다. 대부분의 AI 에이전트가 놓치고 있는 것을 정리합니다.
클로드 코드와 AI 아바타 앱이 증명합니다. 사용자는 복잡한 인터페이스가 아닌 결과를 원합니다. 제로 UI 시대가 생각보다 빠르게 다가오고 있습니다.