La promesse est devenue un genre à part entière : un agent IA qui vit sur votre machine, lit vos fichiers, lance vos commandes, navigue, écrit, et vous rend un travail fini — sans envoyer vos données dans le cloud de personne. En 2026, deux projets open-source incarnent ce rêve mieux que les autres, et ils écrasent tout le reste en popularité : OpenClaw et Hermes Agent.
Les deux sont gratuits, ouverts, et conçus pour tourner en local. Les deux promettent l’autonomie. Mais ils ne se ressemblent pas, et l’un des deux traîne une réputation de danger ambulant. Nous les avons installés sur un même PC Windows, branchés sur les mêmes modèles, et mis au travail en conditions réelles. Verdict sans détour, chiffres à l’appui, et un vainqueur sur le terrain qui nous intéresse : faire travailler un agent seul, en local, dans la durée.
Résultats du test : le verdict en bref
Pas de vainqueur incontestable : c’est un match serré. Sur nos 7 critères, le score est de 3 à 2 en faveur de Hermes Agent, avec 2 égalités — un écart trop mince pour parler de domination. Chacun gagne son terrain : OpenClaw sur le Windows natif et l’ampleur de l’écosystème ; Hermes sur la sécurité, la mémoire et la stabilité. Deux critères finissent à égalité parce que les données ne départagent honnêtement personne : l’accès agentique local (les deux ont un accès complet au shell et aux fichiers) et le coût (les deux brûlent des tokens, et le seul vrai levier — le choix du modèle — est identique). Le bon choix dépend de votre profil, pas d’un classement.
| Critère | OpenClaw | Hermes Agent | Avantage |
|---|---|---|---|
| Installation & Windows natif | Natif, app dédiée, sans admin | Windows natif « expérimental », WSL2 conseillé | OpenClaw |
| Étendue des intégrations & écosystème | ~24 canaux, place de marché, ~380 000 ★ | 6 canaux, ~199 000 ★ | OpenClaw |
| Travail agentique local (shell, fichiers) | PowerShell natif, surface d'outils mûre | 40+ outils, instantanés avant modif | Égalité |
| Mémoire & apprentissage continu | Mémoire fichiers + skills manuels | Mémoire persistante + skills auto-générés | Hermes |
| Sécurité & isolation d'exécution | Faille 8.8 corrigée, instances exposées, skills piégées | Conteneurs comme frontière, autorisation par défaut | Hermes |
| Stabilité & fiabilité dans la durée | Casse aux mises à jour, WhatsApp instable | Plus stable selon les retours, mais CLI lente | Hermes |
| Maîtrise du coût & transparence | « Heartbeat » et contexte qui gonfle = facture surprise | Overhead fixe élevé par appel | Égalité |
| Total (2 égalités) | 2 | 3 | Hermes, de peu |
Verdict Le Recul. Ni l'un ni l'autre n'est l'« employé numérique autonome » vendu par le marketing : les deux exigent une configuration soignée, une surveillance, et une vraie discipline sur les coûts.
Le match est nul, ou presque (3-2, 2 égalités). Hermes Agent prend un léger avantage sur ce qui compte pour faire tourner un agent dans la durée — stabilité, isolation, mémoire — mais l'écart n'est pas décisif.
OpenClaw garde des atouts forts : Windows natif sans bricolage, un maximum d'intégrations, l'écosystème le plus actif. Il n'y a pas de gagnant universel : choisissez selon votre profil, pas selon le nombre d'étoiles GitHub.
Deux agents, deux philosophies
Avant de comparer, il faut comprendre que ces deux outils ne partent pas du même endroit. Les confondre, c’est se tromper de projet.
OpenClaw est né de la messagerie. Créé fin 2025 par le développeur autrichien Peter Steinberger (par ailleurs entré chez OpenAI début 2026), il a changé de nom cinq fois en deux mois — un détail amusant qui en dit long sur la vitesse du projet. Au passage, une rumeur tenace mérite d’être corrigée : Anthropic a bien demandé un changement de nom (l’ancien « Clawdbot » sonnait trop comme « Claude »), mais cela n’a forcé qu’une étape intermédiaire ; le nom « OpenClaw » est, lui, un choix volontaire. Son architecture tient en un mot : la Gateway, un processus unique qui tourne sur votre machine et relie toutes vos messageries (WhatsApp, Telegram, Discord, Slack, Signal, iMessage…) à un agent. Vous lui écrivez depuis l’application que vous utilisez déjà, et il agit. Sous licence MIT, le projet affiche une popularité hors norme : de l’ordre de 380 000 étoiles sur GitHub à la mi-juin 2026. Il s’inscrit dans la lignée des agents IA qui agissent seuls via le protocole MCP que nous suivons depuis plusieurs mois.
Hermes Agent vient d’ailleurs. Publié début 2026 par Nous Research (un acteur reconnu de l’IA open-weights), il mise tout sur un agent qui apprend. Sa promesse : une mémoire qui persiste d’une session à l’autre, et une boucle d’auto-amélioration — après une tâche complexe, l’agent peut générer une « skill » (une procédure réutilisable, avec ses pièges et ses étapes de vérification) qu’il rechargera la prochaine fois au lieu de réfléchir de zéro. Lui aussi sous licence MIT, il compte environ 199 000 étoiles à la même date. Son terrain de prédilection, c’est le serveur et l’auto-hébergement, dans l’esprit des superviseurs IA qui pilotent d’autres agents.
Une formule résume bien l’opposition : OpenClaw emballe un agent autour d’une passerelle de messagerie ; Hermes emballe une passerelle autour d’un agent qui apprend. Le terrain commun — et le seul que ce comparatif prétend trancher — c’est leur capacité à travailler seuls, en local, sur Windows.
Installation et premier lancement sur Windows
C’est le premier vrai écart, et il pèse lourd pour un public Windows.
OpenClaw assume Windows. Sa promesse affichée est « n’importe quel OS, n’importe quelle plateforme », et c’est tenu : il s’installe nativement, soit via une application de bureau dédiée (sans droits administrateur, sur Windows 10 récent ou Windows 11), soit en ligne de commande, soit dans WSL2 pour la compatibilité Linux maximale. En pratique, le premier lancement est rapide ; la vraie friction n’est pas l’installation du logiciel, mais le branchement des messageries, en particulier WhatsApp (scan d’un QR code, sessions qui expirent).
Hermes Agent pousse vers Linux. Ses plateformes officielles sont Linux, macOS et WSL2 ; le support Windows natif est explicitement étiqueté « expérimental ». Sur un poste Windows, la voie recommandée passe donc par WSL2 — une couche supplémentaire qui n’a rien d’insurmontable pour un développeur, mais qui exclut d’emblée l’utilisateur Windows non technique. L’installation se fait par un script unique.
Côté empreinte machine, les deux restent raisonnables au démarrage (ordres de grandeur observés, pas des mesures de laboratoire) : une installation de base de l’ordre de quelques centaines de Mo à un peu moins d’un Go, qui grossit ensuite avec l’historique, la mémoire et surtout le harnais de navigation — chacun embarque un Chromium (autour de 400 Mo) pour les tâches web. Au repos, le service consomme quelques centaines de Mo de RAM ; en pleine tâche avec le navigateur ouvert, comptez plutôt 1 à 2 Go. Rien d’extrême : ces outils sont gourmands en tokens, pas en RAM. C’est la facture d’API, pas le gestionnaire de tâches, qui fait mal — on y revient.
Pour qui veut rester 100 % local (modèle exécuté sur sa propre machine via Ollama, vLLM ou LM Studio), les deux le permettent, mais le matériel devient la contrainte. Un petit modèle de 8 milliards de paramètres répond au chat mais cale sur l’enchaînement d’outils ; pour un agent fiable, il faut viser un modèle de 27 à 36 milliards de paramètres sur une carte d’au moins 24 Go de VRAM. C’est la même logique que pour l’IA locale façon Gemma de Google : gratuit en tokens, mais pas en matériel.
Prix, modèles et coût réel
Bonne nouvelle d’abord : les deux logiciels sont gratuits et open-source (licence MIT). Aucun abonnement pour le programme lui-même. Tous deux sont « bring your own key » : vous branchez le modèle de votre choix, et c’est lui qui coûte.
Voici les tarifs publics des modèles couramment branchés sur ces agents (prix officiels relevés en juin 2026, en dollars par million de tokens, entrée / sortie) :
| Modèle | Entrée ($/M) | Sortie ($/M) |
|---|---|---|
| Claude Opus 4.8 | 5,00 | 25,00 |
| Claude Sonnet 4.6 | 3,00 | 15,00 |
| Claude Haiku 4.5 | 1,00 | 5,00 |
| GPT-5.5 | 5,00 | 30,00 |
| Gemini 3.1 Pro | 2,00 | 12,00 |
| Qwen3 Max | 0,78 | 3,90 |
| DeepSeek V4 Flash | 0,14 | 0,28 |
L’écart est vertigineux : DeepSeek V4 Flash coûte environ 35 fois moins cher en entrée et 90 fois moins cher en sortie qu’un modèle haut de gamme. C’est l’enseignement central de la guerre des prix déclenchée par DeepSeek : sur un agent qui répète sans cesse les mêmes opérations, le choix du modèle décide de tout.
Pourquoi la facture explose
Car ces agents brûlent des tokens, et c’est le piège que personne ne voit venir. Le mécanisme est documenté côté OpenClaw : à chaque tour, l’agent renvoie au modèle son contexte complet (fichiers de configuration, historique de session, mémoire). Une discussion de référence sur le dépôt décrit des limites d’API atteintes deux fois dans la même journée après seulement vingt à trente petits messages, le contexte gonflant à chaque tour avec des lectures de cache « par centaines de milliers de tokens ». Pire : un « battement de cœur » périodique réinterroge le modèle même quand l’agent ne fait rien. Résultat concret rapporté par un utilisateur : 250 $ partis dès le premier jour d’un test « inoffensif ». L’épisode le plus spectaculaire — une facture d’environ 1,3 million de dollars en un mois — est à mettre au crédit du créateur d’OpenClaw lui-même, sur de la R&D financée par OpenAI : ce n’est pas une facture d’utilisateur normal, mais ça illustre la vitesse à laquelle ça file.
Hermes Agent n’échappe pas à la règle, pour une raison différente : une part importante de chaque appel est un coût fixe (définitions d’outils, instructions système) avant même que vous ayez posé votre question. La parade est la même des deux côtés : descendre en gamme de modèle (un passage en Haiku divise typiquement la note par cinq) et exploiter le cache, où DeepSeek est imbattable. Hermes propose en plus sa propre passerelle d’abonnement, Nous Portal (autour de 20 $/mois pour le palier d’entrée selon des sources tierces), pratique mais payante. OpenClaw, lui, vous renvoie directement vers les fournisseurs ou OpenRouter.
Ce qu’ils savent faire : capacités et autonomie
Sur le papier, les deux cochent presque toutes les cases d’un agent moderne. Le diable est dans les détails.
| Capacité | OpenClaw | Hermes Agent |
|---|---|---|
| Shell & fichiers | Oui (PowerShell natif sur Windows) | Oui (40+ outils ; instantanés avant modif) |
| Navigateur & recherche web | Oui | Oui |
| Canaux de messagerie | Une vingtaine | 6 |
| Planification (cron) & déclencheurs | Oui (cron, webhooks) | Oui (langage naturel ou cron) |
| Sous-agents / délégation | Oui (multi-agent) | Oui (3 sous-agents en parallèle par défaut) |
| MCP (outils externes) | Oui | Oui |
| Vision / image / voix | Oui (canvas, voix) | Oui (vision, génération d'image, synthèse vocale) |
| Intégration éditeur de code | Apps natives mobile/desktop | VS Code, Zed, JetBrains (protocole ACP) |
| Mémoire persistante | Fichiers Markdown lisibles | Base SQLite (opaque) + skills auto-générés |
La différence d’autonomie tient surtout à une valeur par défaut : OpenClaw, en mode « opérateur unique de confiance », exécute par défaut les commandes shell sans demander de confirmation. C’est puissant — et dangereux. Hermes, lui, demande une validation par défaut. Côté garde-fous, Hermes a une longueur d’avance conceptuelle : il peut s’exécuter dans un conteneur (Docker, Singularity) ou un bac à sable cloud, le conteneur servant alors de véritable frontière de sécurité. OpenClaw dispose aussi d’un bac à sable et de politiques d’outils, mais ils sont à activer manuellement.
Mémoire et apprentissage : le pari de Hermes
C’est l’argument numéro un de Hermes Agent, et il mérite qu’on s’y arrête — avec une nuance importante.
La mémoire de Hermes est réelle : faits, préférences et procédures persistent d’une session à l’autre, et l’agent peut générer ses propres skills pour gagner du temps sur les tâches répétées. Nous Research avance un gain de l’ordre de 40 % sur les tâches répétitives une fois la bibliothèque de skills étoffée — un chiffre interne, non vérifié indépendamment, à prendre comme un argument commercial plus que comme une mesure.
Surtout, deux pièges attendent le nouvel utilisateur. D’abord, la fonction d’auto-apprentissage la plus poussée est désactivée par défaut : sans une étape de configuration explicite (hermes memory setup), vous obtenez une mémoire de base, pas le système apprenant promis. Ensuite, la mémoire est bornée : la documentation officielle fixe des limites de taille strictes (environ 800 tokens pour la mémoire générale, 500 pour le profil utilisateur) et l’outil renvoie une erreur plutôt que de tronquer silencieusement. C’est plus sain pour la prévisibilité, mais cela demande de la consolider à la main.
Face à cela, OpenClaw mise sur la transparence : sa mémoire est stockée dans des fichiers Markdown que vous pouvez ouvrir, lire et corriger vous-même. Moins « magique », mais plus contrôlable. Deux philosophies, encore : Hermes parie sur l’apprentissage automatique de la mémoire, OpenClaw sur le contrôle manuel.
Sécurité : le talon d’Achille (surtout pour OpenClaw)
Voici le chapitre où le match bascule, et où Le Recul ne peut pas se taire.
OpenClaw a connu une crise de sécurité publique, documentée et sévère. Trois faits, tous sourcés :
- Une faille critique, CVE-2026-25253, notée 8.8 sur 10 au NVD : un simple lien piégé pouvait faire fuiter le jeton d’accès de la Gateway et aboutir à une exécution de code à distance en un clic. Elle est corrigée depuis la version 2026.1.29 — mais elle illustre la fragilité de l’architecture.
- L’équipe de recherche en sécurité IA de Cisco a qualifié, en janvier 2026, ces agents personnels de « cauchemar de sécurité », après avoir trouvé une skill tierce classée numéro un qui exfiltrait des données vers un serveur externe et contournait les garde-fous, sans que l’utilisateur s’en aperçoive.
- Des chercheurs (SecurityScorecard, relayés par The Register) ont recensé en février 2026 des dizaines de milliers d’instances OpenClaw exposées sur Internet, beaucoup mal protégées.
À cela s’ajoute un point structurel : la place de marché de skills d’OpenClaw n’est pas filtrée, ce qui en fait un vecteur d’attaque par la chaîne d’approvisionnement. Le projet a réagi (durcissement du système de fichiers, notation des skills), et son créateur le dit sans détour : il n’existe pas d’agent « sans risque ».
Hermes Agent n’est pas exempt de reproches, mais son bilan est plus léger. Une faille CVE-2026-7396 (score 5.3, moyen) concerne un adaptateur secondaire — elle figure au NVD, mais via un tiers (VulDB) et l’évaluation officielle de gravité reste en attente. Surtout, Hermes mise sur l’isolation par conteneur et l’autorisation par défaut, ce qui réduit la surface d’attaque. Sa faiblesse spécifique est ailleurs : sa mémoire persistante est par nature une surface à protéger (un contenu malveillant pourrait s’y loger), et le projet traîne une controverse de gouvernance sur l’origine de sa boucle d’auto-amélioration — un débat de transparence que nous mentionnons sans le trancher.
La leçon vaut pour les deux : un agent qui accède à votre shell, vos fichiers et vos messageries est une cible. C’est exactement le risque que nous documentions à propos des agents qui agissent seuls — et il ne faut jamais l’oublier derrière le confort.
Fiabilité au quotidien : ce qui casse
Un agent autonome ne vaut que s’il tient dans la durée. Sur ce point, les retours d’utilisateurs (forums spécialisés, tickets ouverts sur les dépôts) penchent en faveur de Hermes — sans que l’un soit irréprochable.
Côté OpenClaw, le faisceau d’incidents est réel, surtout autour de la passerelle et de WhatsApp : déconnexions à répétition, boucles de reconnexion pouvant déclencher un bannissement du compte WhatsApp (la connexion passe par une voie non officielle), gel de l’« event loop » qui fige tous les canaux, et régressions à certaines mises à jour — y compris une spécifique à Windows signalée au printemps 2026. À nuancer toutefois : plusieurs de ces tickets ont été fermés sans correctif (« non planifié ») ou classés inactifs. La lecture honnête n’est pas « OpenClaw plante en permanence », mais « OpenClaw avance vite et casse parfois, et toutes les demandes de robustesse ne sont pas prioritaires ». Un autre point sensible, déjà cité : le coût en tokens qui dérape si l’on ne borne pas le contexte.
Côté Hermes, les griefs sont moins graves mais bien présents : une interface en ligne de commande jugée lente à démarrer et parfois instable, une impression de « sur-ingénierie », et la nécessité d’activer manuellement les fonctions avancées. Un utilisateur a même rapporté une mémoire totalement muette — mais ce cas isolé, refermé par son auteur, ressemble davantage à un défaut de configuration qu’à une panne générale. Le consensus des transfuges est net : Hermes tient mieux la distance, surtout sur des contextes courts.
Trois scénarios concrets
- Vous voulez un assistant qui agit depuis WhatsApp ou Telegram, sur un PC Windows standard, sans bricoler. → OpenClaw. Le support natif et l’ampleur des intégrations font la différence — à condition d’activer les garde-fous (validation des commandes, bac à sable) dès le départ.
- Vous voulez un agent fiable qui tourne des semaines sur un serveur ou un poste de travail, et qui s’améliore sur vos tâches récurrentes. → Hermes Agent. Stabilité, isolation par conteneur et mémoire persistante priment. Prévoyez WSL2 ou Linux.
- Vous voulez le coût le plus bas possible. → Égalité technique, mais la vraie réponse n’est pas l’agent : c’est le modèle. Un modèle économique (DeepSeek, Qwen) ou un modèle local sur GPU 24 Go fait chuter la facture, quel que soit l’agent.
Forces et limites de chacun
OpenClaw — forces : Windows natif sans friction ; une vingtaine de canaux de messagerie ; écosystème et communauté immenses ; mémoire transparente et modifiable ; autonomie maximale par défaut. OpenClaw — limites : crise de sécurité documentée (faille 8.8 corrigée, instances exposées, skills piégées) ; exécution shell sans confirmation par défaut ; instabilités de passerelle/WhatsApp ; coût en tokens qui dérape ; casse occasionnelle aux mises à jour.
Hermes Agent — forces : mémoire persistante et skills auto-générés ; meilleure hygiène de sécurité (conteneurs, autorisation par défaut) ; plus stable dans la durée ; mémoire bornée et prévisible ; intégration aux éditeurs de code (VS Code, Zed, JetBrains). Hermes Agent — limites : Windows natif « expérimental » (WSL2 conseillé) ; auto-apprentissage désactivé par défaut ; deux fois moins d’intégrations ; interface en ligne de commande lente ; faible sur les tâches de développement pures face à des outils dédiés.
Ce qu’il faut retenir
OpenClaw et Hermes Agent racontent deux versions du même rêve : une IA qui travaille pour vous, sur votre machine, sans louer le cloud de personne. Mais derrière la hype — et les centaines de milliers d’étoiles GitHub —, ce sont deux logiciels jeunes, mouvants et exigeants, qui demandent un utilisateur averti et une vraie discipline.
Sur le terrain qui nous intéresse, faire travailler un agent seul, en local, dans la durée, le match se termine quasiment à égalité : 3-2 en faveur de Hermes Agent, avec 2 critères ex æquo. Hermes prend l’avantage sur la sécurité, la mémoire et la stabilité ; OpenClaw reste le meilleur choix pour qui veut du Windows natif clé en main, le maximum d’intégrations et l’écosystème le plus vivant — à condition d’activer ses garde-fous et de surveiller sa facture. Pas de gagnant universel, donc : un avantage réel mais mince pour Hermes, et un choix qui se décide sur votre usage, pas sur un score.
Le marketing promet l’employé numérique autonome. Le test, lui, dit autre chose : deux assistants prometteurs, mais qu’il faut encadrer comme on encadre un stagiaire surdoué et imprévisible. L’IA promet — et nous, on vérifie. Pour aller plus loin, voyez notre comparatif voisin sur Codex contre Cowork, l’autre duel d’agents IA sur Windows.