AI Wrapper 시대는 끝났다. Claude Agent Wrapper의 시대가 열린다.
앤스로픽의 Tariq Shihipar가 프로덕션급 에이전트 구축의 핵심을 공개했습니다 - Bash 중심 툴링부터 파일 시스템 기반 컨텍스트 엔지니어링까지.
앤스로픽에서 Claude Code를 이끌고 있는 Tariq Shihipar의 90분짜리 워크숍을 분석했습니다.
Manus 이후 에이전트에 대한 관심이 폭발적으로 늘었지만, 프로덕션에서 실제로 작동하는 에이전트를 어떻게 만들어야 하는지는 여전히 답답할 정도로 모호합니다. 이 워크숍은 바로 그 질문에 대한 앤스로픽의 답이었습니다.
LLM API를 단순히 감싸는 서비스를 넘어, 에이전트 네이티브 애플리케이션을 설계할 때 무엇이 달라져야 하는가? 핵심 내용 네 가지를 정리했습니다.
Bash가 가장 강력한 도구다
수십 개의 커스텀 도구를 만들 필요가 없습니다.
- Linux에 이미 존재하는 소프트웨어 - ffmpeg, jq, curl 등 - 을 Bash 명령어로 조합하면 대부분의 작업을 처리할 수 있습니다.
- 에이전트는 man 페이지와
--help출력을 읽으면서 스스로 도구 사용법을 익힙니다. - 모든 도구 스펙을 프롬프트에 집어넣을 필요가 없으니, context window 낭비가 줄어듭니다.
시사점은 분명합니다. 기능마다 전용 통합을 구축하는 대신, 에이전트에게 셸 하나를 넘겨주고 기존 소프트웨어를 조합하게 하는 겁니다. CLI 도구의 세계 전체가 에이전트의 도구상자가 됩니다 - 사전에 등록할 필요도 없이.
에이전트 루프의 핵심은 검증이다
컨텍스트 수집 → 행동 → 결과 검증.
- 에이전트를 도입할지 판단하는 기준은 단순합니다. 출력을 검증할 수 있는가?
- 코드는 컴파일러와 린터로 쉽게 검증할 수 있습니다. 리서치 작업이라면 검증 로직을 별도로 설계해야 합니다 - 예를 들어 출처 인용을 필수로 요구하는 식으로.
- 모델 지능에만 의존하지 마세요. 파일 존재 여부 확인, 구문 검증, 타입 체크 같은 결정적(deterministic) 도구를 루프 안에 배치해서 hallucination을 방지해야 합니다.
이게 대부분의 팀이 놓치는 핵심입니다. 에이전트를 더 똑똑하게 만드는 데 집중하지만, 정작 해야 할 일은 에이전트를 더 검증 가능하게 만드는 것입니다. 검증 루프가 탄탄한 평범한 모델이, 검증 루프가 없는 뛰어난 모델을 이깁니다.
비개발 업무도 코드 생성으로 해결된다
날씨 확인이나 이메일 분석 같은 단순한 작업도 텍스트 응답보다 코드로 처리하는 게 낫습니다.
- 접근 방식은 이렇습니다. 에이전트가 즉석에서 스크립트를 작성해 여러 API를 연결하고 데이터를 처리합니다.
- Claude Code 사용자 중 상당수가 실은 비개발 직군입니다 - 마케팅, 재무, 운영 부서.
- 데이터 분석과 반복 작업을 일회용 코드로 취급하는 것 - 한 번 작성하고, 한 번 실행하고, 버리는 것 - 이 표준 워크플로우가 되고 있습니다.
이건 에이전트 시대에 “코딩”의 의미를 재정의합니다. 에이전트는 이메일 서비스와의 사전 통합이 필요 없습니다. API를 호출하고, 데이터를 필터링하고, 결과를 반환하는 스크립트를 직접 작성합니다 - 전부 런타임에 생성됩니다.
컨텍스트 엔지니어링은 파일 시스템에 있다
프롬프트 엔지니어링을 넘어, 에이전트가 작업하는 환경 자체를 설계해야 합니다.
- 에이전트에 새로운 능력을 부여하는 건 복잡한 파인튜닝이 아닙니다. 잘 작성된 마크다운 파일과 스크립트가 담긴 폴더를 넘겨주는 것입니다.
- Tariq는 이를 “file system pilled”라고 표현했습니다.
- 에이전트는 상태를 가집니다. 에이전트 아키텍처의 핵심은 샌드박스 환경 - 컨테이너 - 이며, 에이전트가 파일 시스템에 접근하고 Bash 명령어를 실행할 수 있는 공간입니다.
이렇게 생각하면 됩니다. 파일 시스템은 에이전트의 장기 기억이자, 레퍼런스 라이브러리이자, 작업 공간입니다. 프로젝트 루트의 CLAUDE.md 파일은 단순한 문서가 아닙니다 - 에이전트의 온보딩 가이드입니다. scripts/ 디렉토리는 단순한 유틸리티가 아닙니다 - 에이전트의 도구 키트입니다.
패러다임의 전환
웹 개발이 jQuery에서 React로 진화한 것처럼 - 명령형 DOM 조작에서 컴포넌트 기반 아키텍처로 - 에이전트 개발도 날것의 프롬프트 호출에서 구조화된 프레임워크로 이동하고 있습니다.
질문이 바뀌었습니다. “무엇을 물어볼까?”가 아니라 “어떤 권한과 환경을 제공할까?”입니다.
이 차이를 이해하는 팀 - 에이전트 성능이 모델이 아니라 모델을 둘러싼 시스템에 달려 있다는 것을 아는 팀 - 이 차세대 소프트웨어를 만들게 될 것입니다.
앤스로픽 Tariq Shihipar의 워크숍 내용을 바탕으로 작성.
뉴스레터 구독하기
최신 프로젝트, 아티클, AI와 웹 개발 실험에 대한 소식을 받아보세요.