Index
4 min de lecture

L'ère des AI Wrappers est terminée. L'ère des Claude Agent Wrappers commence.

Tariq Shihipar d'Anthropic dévoile les clés pour construire des agents de production - du tooling Bash-first à l'ingénierie de contexte pilotée par le système de fichiers.

J’ai analysé le workshop de 90 minutes animé par Tariq Shihipar, le responsable de Claude Code chez Anthropic.

Depuis Manus, l’engouement pour les agents a explosé - mais la question de savoir comment réellement construire des agents qui fonctionnent en production reste désespérément floue. Ce workshop était la réponse d’Anthropic à cette question.

Au-delà des services qui se contentent de wrapper une API LLM, qu’est-ce qui doit changer dans la conception d’applications nativement orientées agents ? Voici les quatre enseignements clés.

Bash est l’outil le plus puissant

Inutile de multiplier les outils custom.

  • Les logiciels déjà présents sur Linux - ffmpeg, jq, curl, et bien d’autres - couvrent la majorité des besoins lorsqu’ils sont composés via des commandes Bash.
  • Les agents apprennent à utiliser les outils par eux-mêmes en lisant les pages man et la sortie de --help.
  • Plus besoin d’intégrer la spécification de chaque outil dans le prompt, ce qui réduit considérablement le gaspillage de la fenêtre de contexte.

L’implication est majeure : au lieu de développer des intégrations sur mesure pour chaque capacité, on donne un shell à l’agent et on le laisse composer les logiciels existants. L’univers des outils CLI devient la boîte à outils de l’agent - sans qu’aucun d’entre eux n’ait besoin d’être déclaré à l’avance.

Le coeur de la boucle agent, c’est la vérification

Collecter le contexte → Agir → Vérifier le résultat.

  • Le critère pour déterminer s’il faut recourir à un agent est simple : peut-on vérifier sa sortie ?
  • Le code est facile à vérifier grâce aux compilateurs et aux linters. Pour les tâches de recherche, il faut concevoir une logique de vérification distincte - comme exiger des citations de sources.
  • Ne comptez pas uniquement sur l’intelligence du modèle. Placez des outils déterministes - vérification d’existence de fichiers, validation syntaxique, contrôle de types - à l’intérieur de la boucle pour prévenir les hallucinations.

C’est l’insight que la plupart des équipes ratent. Elles se focalisent sur rendre l’agent plus intelligent, alors qu’elles devraient le rendre plus vérifiable. Un modèle moyen doté de boucles de vérification solides surpassera un modèle brillant qui n’en possède aucune.

Même les tâches non-dev se résolvent par la génération de code

Même des tâches simples comme consulter la météo ou analyser des e-mails sont mieux traitées par du code que par des réponses textuelles.

  • L’approche : laisser l’agent écrire des scripts à la volée pour connecter plusieurs API et traiter les données.
  • Une part significative des utilisateurs de Claude Code occupe en réalité des postes non-techniques - marketing, finance, opérations.
  • Traiter l’analyse de données et les tâches répétitives comme du code jetable - des scripts écrits une fois, exécutés une fois, puis abandonnés - est en train de devenir le workflow standard.

Cela redéfinit ce que « coder » signifie à l’ère des agents. L’agent n’a pas besoin d’une intégration pré-construite avec votre fournisseur de messagerie. Il écrit un script qui appelle l’API, filtre les données et renvoie les résultats - le tout généré à l’exécution.

L’ingénierie de contexte vit dans le système de fichiers

Au-delà du prompt engineering, il faut concevoir l’environnement dans lequel l’agent opère.

  • Donner de nouvelles capacités à un agent ne passe pas par un fine-tuning complexe. Il suffit de lui fournir un dossier contenant des fichiers markdown bien rédigés et des scripts.
  • Tariq décrit cette approche comme étant « file system pilled ».
  • Les agents ont un état. Le coeur de l’architecture agent, c’est un environnement sandboxé - un conteneur - dans lequel l’agent a accès à un système de fichiers et peut exécuter des commandes Bash.

Voyez les choses ainsi : le système de fichiers est à la fois la mémoire à long terme de l’agent, sa bibliothèque de référence et son espace de travail. Un fichier CLAUDE.md à la racine du projet n’est pas qu’une simple documentation - c’est le guide d’intégration de l’agent. Un répertoire scripts/ n’est pas qu’un recueil d’utilitaires - c’est la boîte à outils de l’agent.

Le changement de paradigme

De la même manière que le développement web est passé de jQuery à React - d’une manipulation impérative du DOM à une architecture par composants - le développement d’agents est en train de passer d’appels bruts au modèle à des frameworks structurés.

La question n’est plus « que dois-je demander ? » mais « quelles permissions et quel environnement dois-je fournir ? »

Les équipes qui saisissent cette distinction - que la performance d’un agent dépend moins du modèle que du système qui l’entoure - construiront la prochaine génération de logiciels.

Basé sur le workshop de Tariq Shihipar chez Anthropic.

Rejoindre la newsletter

Recevez des mises à jour sur mes derniers projets, articles et expériences en IA et développement web.