Le Model Context Protocol (MCP) face aux outils CLI traditionnels est l'un des débats les plus chauds du développement d'agents IA en 2025-2026. Le MCP, introduit par Anthropic fin 2024, est un standard ouvert qui permet aux grands modèles de langage, comme Claude, de se connecter de manière sécurisée à des sources de données externes, des APIs et des outils via une architecture client-serveur. Il permet aux agents IA d'effectuer des actions structurées, par exemple interroger des dépôts GitHub, gérer des ressources AWS ou analyser des fichiers, avec des paramètres typés et moins d'erreurs de parsing.
À l'inverse, les outils CLI, pensez à gh, aws, kubectl, git ou à des scripts shell personnalisés, permettent à l'IA de simplement générer et exécuter des commandes shell, souvent via des outils comme Claude Code, Amazon Q CLI en mode non-MCP, Aider ou des wrappers maison.
Les deux approches permettent aux agents IA d'agir sur le monde, mais le coût, en particulier l'usage de tokens LLM et les frais API qui en découlent, est devenu le facteur décisif pour de nombreux développeurs et entreprises.
Le moteur principal des coûts : la consommation de tokens dans les appels LLM
La plupart des modèles de pointe, Claude, GPT, Gemini et autres, facturent à l'input + output token. Dans les workflows agentiques, les agents tournent en boucle planification → usage d'outil → observation → répétition, donc l'inflation de la fenêtre de contexte multiplie rapidement les coûts.
Les serveurs MCP exposent des outils avec des schémas JSON riches, descriptions, paramètres, enums, champs requis, etc. Les implémentations populaires chargent de nombreux outils d'un coup :
- Un serveur MCP GitHub complet injecte souvent des définitions pour ~93 outils → ~55 000 tokens d'emblée.
- Les setups Microsoft Graph ou MCP d'entreprise peuvent atteindre 100k-150k+ tokens avant même le début du travail réel.
Cette surcharge fixe est renvoyée à chaque tour, ou mal mise en cache, dans les conversations multi-tours, ce qui gonfle chaque appel LLM.
Les agents basés CLI ont généralement seulement besoin d'inclure :
- Un prompt système court expliquant l'usage shell et la sécurité.
- Des exemples de patterns de commandes.
- L'observation ou la sortie courante issue des commandes précédentes.
Un seul appel outil peut coûter ~900 à 3 000 tokens au total contre 15 000+ pour l'appel MCP équivalent.
Benchmarks réels et économies rapportées
Les développeurs ont partagé des chiffres parlants :
- Une expérience générant des CLIs à partir de serveurs MCP existants a atteint 92 à 94 % d'économies de tokens sur des appels répétés, par exemple 15 570 tokens → 910 tokens pour un appel, avec un gain encore meilleur à l'échelle de 100 appels.
- Des opérations GitHub via
ghCLI ont utilisé bien moins de tokens et terminé les tâches plus vite que le MCP GitHub officiel dans plusieurs tests indépendants. - Dans des workflows de code et de debugging, LLDB, analyse de projet, REPL Python, les approches CLI coûtent parfois légèrement plus dans des cas isolés, mais gagnent souvent globalement grâce à une surcharge de contexte plus faible et une meilleure composabilité, pipes, chaining.
- Des setups MCP lourds et multi-outils consommaient 27 à 50 % d'une fenêtre de contexte de 200k rien que pour les définitions d'outils, avant même de taper un seul prompt.
Certaines tâches favorisent légèrement MCP, par exemple un benchmark montrait MCP 2,5 % moins cher et 23 % plus rapide sur une suite précise, mais la tendance générale penche fortement vers la CLI pour l'efficacité token quand les agents effectuent des dizaines ou des centaines d'actions.
Tableau comparatif rapide
| Aspect | MCP (Model Context Protocol) | Approche outils CLI | Gagnant typique sur le coût |
|---|---|---|---|
| Coût initial en tokens | Élevé, 20k-150k+ tokens pour les schémas d'outils | Très faible, de quelques centaines à 2-3k | CLI |
| Surcharge par appel | Moyenne, appel JSON structuré + parsing de réponse | Faible, commande texte + sortie | CLI |
| Tâches longues | Coûteux à cause du contexte répété | Bien moins cher, observations ajoutées progressivement | CLI |
| Fiabilité du parsing | Excellente, paramètres typés | Peut nécessiter jq, regex ou retries | MCP |
| Composabilité | Limitée, les outils s'enchaînent mal nativement | Excellente, pipes, redirections, scripts | CLI |
| Complexité de setup | Moyenne, serveur MCP, auth, intégration client | Faible, si la CLI est déjà installée | CLI |
| Cas où cela brille | APIs complexes typées, guardrails entreprise, discovery | DevOps quotidien, git, CLIs cloud, scripts custom | — |
Quand choisir quoi, conseil optimisé coût
Choisissez la CLI, généralement moins chère, lorsque :
- Vous utilisez des outils courants,
gh,aws,gcloud,kubectl,jq, etc. - Les agents exécutent de longues sessions ou un grand volume d'appels outils.
- Le budget tokens compte, startups, usage intensif, projets personnels.
- Vous voulez une composabilité maximale sans maintenance de schéma.
Choisissez MCP, quand le surcoût vaut la peine, lorsque :
- Vous avez besoin d'un typage fort et de validation pour réduire hallucinations et erreurs.
- Le service n'a pas de bonne CLI ou la CLI est trop verbeuse ou fragile.
- La sécurité ou l'audit entreprise exigent un accès sandboxé et permissionné.
- Vous construisez pour des utilisateurs non techniques qui préfèrent la précision du langage naturel à la syntaxe shell.
De nombreuses équipes adoptent désormais une approche hybride : utiliser des wrappers CLI légers qui n'appellent les serveurs MCP qu'en cas de besoin, ou générer automatiquement de petites CLIs à partir des définitions MCP afin d'obtenir le meilleur des deux mondes.
L'essentiel
En 2026, le verdict de la communauté devient de plus en plus clair : pour la plupart des cas d'usage pratiques d'agents, en particulier ceux sensibles au coût, les bons vieux outils CLI battent les serveurs MCP sophistiqués sur les dollars dépensés par tâche réalisée. Le protocole est élégant, mais la physique de la fenêtre de contexte est brutale.
Si vous construisez des agents aujourd'hui, démarrez avec une approche CLI-first. Vous pourrez toujours ajouter une couche MCP plus tard si la sécurité structurée devient le goulot d'étranglement, mais vous économiserez probablement 60 à 90 % sur votre facture LLM en attendant.
Besoin d'aide ?
Vous voulez construire des agents IA économes ou vous hésitez entre MCP et CLI pour votre cas d'usage ? Contactez-nous, nous aidons les équipes à livrer des solutions agentiques intelligentes et abordables.




