Index
7 min de lecture

5 prédictions IA pour 2026 : agents, puces et exits historiques

Du SaaSpocalypse aux puces dédiées par modèle, cinq prédictions audacieuses sur la direction de l'IA en 2026, avec environ 50 % de chances d'avoir raison.

Honnêtement, j’ai longuement hésité avant d’écrire un article de prédictions. En discuter en privé avec ma co-fondatrice Hyeonji Hwang est une chose ; le publier en est une autre.

Si on a raison, les gens disent « c’était évident ». Si on a tort, c’est embarrassant. Mais le rythme des événements depuis le début de 2026 est tout sauf ordinaire, alors j’ai décidé de mettre de l’ordre dans mes idées.

Les développeurs (et tout le monde) ne seront pas remplacés cette année, mais doivent commencer à trouver de nouvelles compétences

En tant que diplômé en bio-ingénierie, une nouvelle m’a frappé il y a quelques jours. Le coût du séquençage du génome humain était de 2,7 milliards de dollars il y a 25 ans (Projet Génome Humain). Il y a 5 ans, il était tombé à 1 000 $. Cette semaine, Element Biosciences a présenté VITARI, un appareil à 100 $. Même dans la biotechnologie, l’un des secteurs les plus lents à évoluer, la vitesse est déjà à ce niveau. La plupart des industries évoluent encore plus vite.

Et le logiciel est beaucoup plus rapide. À l’ère du mobile, les cycles de remplacement des appareils nous laissaient le temps de nous adapter. Avec l’IA, les choses changent au jour le jour. C’est la nature du logiciel.

  • 2024 Prolifération de Cursor → Génération d’apps full-stack avec Bolt & Lovable → « Vibe coding » de Karpathy → 2025 Claude Code, Opus 4.5, Gemini 3.0 Pro → Janvier 2026 le SaaSpocalypse. Deux ans pour en arriver là
  • SaaSpocalypse : Rien que la première semaine de février, 285 milliards de dollars de capitalisation boursière ont disparu du secteur logiciel. Le plugin Claude Cowork d’Anthropic a été le déclencheur. L’ambiance ressemble exactement à début 2023, juste après le lancement de ChatGPT (décembre 2022)
  • Les ingénieurs logiciels infrastructure restent en pénurie aux États-Unis, mais d’autres postes subissent déjà les conséquences statistiques. Les offres d’emploi pour développeurs juniors ont chuté de 45 % par rapport à 2023

Désormais, même suivre le flux d’information sera réservé à ceux qui font tourner des dizaines d’agents simultanément. J’ai pris les développeurs comme exemple, mais chacun devrait commencer à cultiver d’autres compétences, vente en sous-traitance, communication sur les réseaux sociaux, gestion stable des revenus d’investissement, etc.

Le logiciel ne survit que comme fournisseur de données ou packaging de plans IA

Du point de vue de l’utilisateur, peu importe que ce soit l’original ou un clone. Les poursuites judiciaires ne font que gaspiller du temps, donc les abus se multiplient. Ce qui a de la valeur à l’ère de l’IA, ce sont les données difficiles à apprendre pour les modèles mais accessibles en temps réel au moment de l’inférence.

La tendance était déjà limpide en janvier.

Acquisition de sources de données, la connexion, pas l’entraînement

  • Perplexity s’est associé à BlueMatrix pour intégrer des données de recherche financière institutionnelle dans son produit Enterprise (annoncé le 13 janvier)
  • Manus s’est associé à SimilarWeb pour connecter les données de trafic web/app via un serveur MCP, permettant aux agents IA de les analyser directement (annoncé le même jour)
  • Pour ces données, les rendre accessibles est bien plus efficace que de les utiliser pour l’entraînement. Rattraper des entreprises qui accumulent des données depuis des années est extrêmement difficile

Packaging de l’accès aux modèles, 100-200 $/mois pour 10 000 $+ de valeur

  • Claude Max à 100-200 $/mois, ChatGPT Pro à 200 $/mois, Higgsfield à 149-249 $/mois, une utilisation qui coûterait 200-400 $ via l’API est conditionnée en forfaits qui font dire aux utilisateurs « autant de valeur à ce prix ? »
  • Un responsable produit d’Anthropic a même mentionné qu’un « forfait à 500 $/mois est à l’étude », signe d’une forte demande pour les abonnements premium
  • Seedance 2.0, GPT-3.5-Codex, etc., offrir un accès exclusif aux modèles plus rapidement et à un prix plus compétitif que quiconque est la seule valeur restante du logiciel IA

Conclusion : construire une API de données utilisable en amont de l’inférence, packager les droits d’accès aux modèles, ou accélérer la sous-traitance pour les entreprises. L’analyse en aval n’a plus de sens, l’IA le fait mieux et moins cher.

Les agents IA déclenchent le 5e boom du hardware (le hardware est désormais pour les AGENTS)

OpenClaw l’a démontré de façon éclatante. Créé par le développeur autrichien Peter Steinberger, cet agent personnel open source a atteint 60 000 étoiles GitHub en 72 heures et dépasse désormais les 145 000. Il gère automatiquement les emails, les agendas, la navigation web et les achats via WhatsApp, Telegram et Slack. DigitalOcean a proposé un déploiement en un clic et Raspberry Pi a publié un guide officiel.

C’est là que ça devient intéressant.

  • Les agents doivent répondre instantanément quand l’utilisateur en a besoin, chaque agent nécessite donc son propre appareil (ou instance)
  • Le concept d’un agent par personne double déjà la demande de calcul actuelle. Et si une personne fait tourner 10, 100 agents personnels ?
  • Un « appareil » = puissance de calcul (CPU) + stockage (DRAM, SSD) + réseau. Exécutés sur des serveurs ou des Mac Mini, chaque agent/utilisateur dans son propre conteneur Docker
  • Des puces legacy peuvent gérer certaines de ces tâches, ce qui crée une opportunité massive pour les entreprises chinoises. Samsung et SK Hynix qui reprennent l’expansion de leurs lignes de production après avoir hésité, la raison est peut-être là

(Feat. Samsung, SK Hynix, TSMC, SanDisk : au regard du précédent Nvidia, les valorisations restent peut-être attractives. Mais contrairement à Nvidia, l’existence de la Chine comme alternative est le piège.)

L’ère des puces spécifiques par modèle est arrivée (The Model is the CHIP)

Taalas, basé à Toronto, a dévoilé le HC1, une puce ASIC conçue exclusivement pour Llama 3.1 8B. Résultat : 17 000 tokens par seconde, 73× plus rapide qu’un Nvidia H200 et environ 10× plus rapide que Cerebras. En gravant les poids du modèle directement dans les transistors, le HC1 n’a besoin ni de HBM ni de refroidissement liquide, et sa consommation d’énergie est réduite à 1/10.

Taalas a levé 219 millions de dollars au total et prévoit de supporter des modèles jusqu’à 20 milliards de paramètres avec le HC2.

Tout le monde disait que ces puces n’atteindraient jamais l’efficacité énergétique ou la scalabilité. Pourtant, les startups de puces spécialisées continuent d’attirer des capitaux massifs :

  • 24 décembre : Nvidia a licencié la technologie LPU de Groq pour 20 milliards de dollars et recruté les talents clés (fondateur Jonathan Ross, président Sunny Madra), une acquisition de fait
  • Cerebras a retiré son IPO et levé plus de 1 milliard de dollars, maintenant son indépendance
  • Les puces dédiées par modèle peuvent s’adapter à un nouveau modèle en environ 2 mois en changeant seulement deux masques, combinées aux modèles frontières, cela pourrait transformer toute la structure de coûts d’inférence

Une nouvelle ère des semi-conducteurs est clairement en train de s’ouvrir.

Une startup inspirée d’OpenClaw réalisera un exit historique cette année

Cette prédiction repose sur un schéma déjà établi.

Le schéma établi : Browser-use → Manus → Acquisition par Meta

  • En 2025, Browser-use (open source) a démontré le potentiel de l’automatisation IA
  • Manus a combiné Sonnet 4 avec Browser-use pour ouvrir l’ère des agents (mars 2025)
  • Résultat : 100 M$ d’ARR en seulement 8 mois. Le 29 décembre, Meta a acquis Manus pour plus de 2 milliards de dollars, l’un des exits licorne les plus rapides de l’histoire

Les ingrédients du prochain exit : OpenClaw → pi-mono → ?

  • OpenClaw était lui-même open source. Son créateur, Peter Steinberger, a confirmé son arrivée chez OpenAI le 15 février. OpenClaw continue en tant que fondation indépendante
  • Le moteur d’OpenClaw, pi-mono (développé par Mario Zechner, ~8 900 étoiles GitHub), émerge comme le SDK central des services d’agents personnels
  • En Chine, Alibaba, Tencent et ByteDance ont tous publié des agents optimisés pour OpenClaw. Minimax M2.5, Kimi Claw et d’autres pivotent vers la compatibilité OpenClaw
  • Les attentes des utilisateurs passent de « demander à ChatGPT » à « laisser l’agent s’en charger ». Un simple assouplissement des autorisations d’accès aux données rend la commodité écrasante

Je suis convaincu qu’environ trois services exploitant pi-mono de façon exceptionnelle émergeront, et que l’un d’entre eux sera acquis.

Rejoindre la newsletter

Recevez des mises à jour sur mes derniers projets, articles et expériences en IA et développement web.