Le rêve est le même des deux côtés : vous confiez une tâche à une IA, elle ouvre vos fichiers, lance les commandes, écrit, corrige, et vous rend un travail fini. Plus de copier-coller, plus de pilotage manuel — un collègue numérique qui bosse pendant que vous faites autre chose.
OpenAI vend ce rêve sous le nom de Codex. Anthropic le vend sous le nom de Cowork. Les deux savent agir seuls sur une machine. Nous les avons installés sur un même PC Windows 11 et nous les avons mis au travail, en conditions réelles. Verdict sans détour, chiffres à l’appui, et un vainqueur sur le terrain qui nous intéresse : le travail agentique en local, sur Windows.
Résultats du test : le verdict en bref
Vainqueur sur le terrain testé (agent autonome en local sur Windows) : OpenAI Codex, par une courte tête — 4 critères sur 7. Codex l’emporte parce qu’il s’exécute nativement, s’installe sans friction sur une machine Windows standard, et pousse l’autonomie plus loin. Cowork n’est pas battu partout : il gagne sur la polyvalence bureautique, les garde-fous et l’isolation par machine virtuelle.
| Critère | Codex (OpenAI) | Cowork (Anthropic) | Avantage |
|---|---|---|---|
| Support & installation Windows | Natif, éditions récentes | VM Hyper-V, Windows 11 Pro requis | Codex |
| Travail agentique local (shell, fichiers) | PowerShell natif, accès direct | Via VM isolée | Codex |
| Polyvalence hors code (bureautique) | Limité (orienté code) | Apps, tableurs, navigateur | Cowork |
| Autonomie & arrière-plan | Threads parallèles, tâches cloud | Pas d'arrière-plan, app fermée | Codex |
| Garde-fous & contrôle | Niveaux de bac à sable | Plan validé avant action | Cowork |
| Tarif d'entrée & accessibilité | Offre gratuite + Go à 8 $ | Inclus dès Pro à 20 $ | Codex |
| Isolation / sécurité d'exécution | Bac à sable système (faille passée) | Isolation forte par VM | Cowork |
| Total | 4 | 3 | Codex |
Verdict Le Recul. Aucun des deux n'est l'employé autonome promis par le marketing : tous deux exigent validation et surveillance.
Pour faire travailler une IA en local sur Windows, Codex gagne — natif, sans friction, plus autonome, et accessible jusqu'au gratuit.
Cowork reprend l'avantage dès qu'on sort du code : tâches de bureau (tableurs, navigateur, documents), garde-fous plus stricts et exécution isolée dans une machine virtuelle. Le score est serré (4-3) : c'est un choix d'usage, pas une démonstration de force.
Deux agents, deux philosophies
Avant de comparer, il faut comprendre que Codex et Cowork ne visent pas le même utilisateur. Les confondre, c’est se tromper d’outil.
Codex (OpenAI) est né côté développeur. Sa première brique, une interface en ligne de commande open source, est apparue en avril 2025 ; une version web a suivi, puis un modèle dédié au codage agentique à l’automne 2025, et enfin une application native Windows avec son propre bac à sable au printemps 2026. Aujourd’hui, Codex vit partout où un développeur travaille : le terminal, l’éditeur de code, le web, GitHub, et le bureau Windows. Son cœur de métier : lire, écrire, exécuter et corriger du code en autonomie. C’est l’aboutissement d’une tendance que nous suivons depuis que Codex est sorti du simple code pour exécuter des tâches, dans la lignée des agents IA qui agissent seuls via le protocole MCP.
Cowork (Anthropic) vise, lui, le travail de bureau au sens large. Lancé d’abord sur macOS début 2026, il est arrivé sur Windows quelques semaines plus tard, puis a été généralisé au printemps. Sa promesse : « déléguez une tâche, récupérez un livrable fini ». Concrètement, Cowork ouvre des applications, remplit des tableurs, navigue dans votre navigateur et manipule vos fichiers, en s’appuyant par défaut sur un modèle Claude Opus doté d’une très large fenêtre de contexte (de l’ordre du million de tokens). Il s’inscrit dans la stratégie d’Anthropic autour de Claude Code et des agents superviseurs, portée par des modèles présentés comme plus autonomes.
Autrement dit : d’un côté un outil de spécialiste taillé pour le code, de l’autre un assistant polyvalent taillé pour la bureautique. Le terrain commun — et le seul que ce comparatif prétend trancher — c’est leur capacité à travailler seuls, en local, sur Windows.
Prix, modèles et fonctionnement de l’abonnement
C’est souvent là que la promesse rencontre la facture. Vue d’ensemble des offres grand public :
| Critère | Codex (OpenAI) | Cowork (Anthropic) |
|---|---|---|
| Gratuit | Oui (offre Free) | Non — exclu du plan gratuit |
| Entrée payante | Go : 8 $/mois — Plus : 20 $/mois | Claude Pro : 20 $/mois (17 $/mois en annuel) |
| Offre « pro » | Pro : à partir de 100 $/mois (paliers 5× et 20×) | Claude Max : à partir de 100 $/mois (5× et 20×) |
| Modèle IA par défaut | GPT-5.5 / GPT-5.4 / GPT-5.4 mini | Claude Opus 4.6 (contexte 1 M tokens) |
| Logique de facturation | Quotas par fenêtre de 5 h, puis crédits/tokens | Inclus dans l'abonnement, puise dans son quota |
Codex : 5 heures glissantes, puis des tokens
Codex ne facture pas au message « à l’unité ». Les usages (messages locaux + tâches cloud) sont décomptés sur une fenêtre glissante de 5 heures. Voici le nombre de messages locaux par fenêtre, selon le plan et le modèle :
| Plan | GPT-5.5 | GPT-5.4 | GPT-5.4 mini |
|---|---|---|---|
| Plus (20 $) | 15 à 80 | 20 à 100 | 60 à 350 |
| Pro 5× (100 $+) | 75 à 400 | 100 à 500 | 300 à 1 750 |
| Pro 20× (100 $+) | 300 à 1 600 | 400 à 2 000 | 1 200 à 7 000 |
Le plan Business est en pay-as-you-go (quotas alignés sur Plus) et Enterprise/Edu sur devis. Au-delà des quotas, ou via une clé API, Codex bascule sur une facturation aux crédits par million de tokens :
| Modèle | Entrée | Entrée en cache | Sortie |
|---|---|---|---|
| GPT-5.5 | 125 | 12,5 | 750 |
| GPT-5.4 | 62,5 | 6,25 | 375 |
| GPT-5.4 mini | 18,75 | 1,875 | 113 |
OpenAI évalue le coût réel à ~100 à 200 $/développeur/mois, avec une forte variance selon le modèle, le nombre d’agents lancés en parallèle et l’usage du « fast mode ». La logique est claire : plus l’agent travaille, plus la facture monte. Un exemple parle de lui-même — lancer trois agents en parallèle sur GPT-5.5 pour réécrire un module épuise un quota Plus en une poignée d’heures, là où le même travail sur GPT-5.4 mini tient plus longtemps mais avec un modèle moins fin.
Cowork : inclus dans Claude, mais il puise dans votre quota
Cowork n’a pas de tarif propre : il est inclus dans les abonnements Claude payants. La grille :
| Plan Claude | Prix | Cowork inclus ? |
|---|---|---|
| Free | 0 $ | Non |
| Pro | 20 $/mois — ou 17 $/mois en annuel (200 $ d'avance) | Oui |
| Max | à partir de 100 $/mois (5× et 20×) | Oui |
| Team Standard | 20 $/siège (annuel) — 25 $ mensuel | Oui |
| Team Premium | 100 $/siège (annuel) — 125 $ mensuel | Oui |
| Enterprise | prix au siège + usage aux tarifs API | Oui |
Le revers : Cowork consomme le même quota que votre plan Claude. Une session complexe peut absorber l’équivalent de plusieurs dizaines de messages de chat — sur le modèle Opus, les crédits filent vite. « Inclus » ne veut donc pas dire « illimité » : déléguer une grosse tâche bureautique le matin peut entamer sérieusement ce qu’il vous reste pour le reste de la journée.
Lecture chiffrée. Les tarifs d’entrée se ressemblent (gratuit / ~20 $ / 100 $+), mais la mécanique diffère du tout au tout. Codex décompte par fenêtres de 5 h puis facture au token : transparent, mais imprévisible si l’on multiplie les agents. Cowork est intégré à un abonnement que beaucoup paient déjà, mais il ponctionne un quota commun et n’offre pas de palier gratuit. Sur le seul tarif d’entrée et l’accessibilité, l’offre gratuite de Codex lui donne le point — c’est le seul des deux qu’on peut tester sans sortir la carte bleue.
Ce qu’ils savent faire en autonomie
| Capacité | Codex | Cowork |
|---|---|---|
| Lire / écrire les fichiers locaux | Oui (dossier de travail) | Oui (dossiers autorisés) |
| Exécuter des commandes shell | Oui (cœur de métier) | Via la VM et ses outils |
| Éditer du code multi-fichiers | Oui (IDE + GitHub) | Possible, pas son axe principal |
| Piloter apps / navigateur / tableurs | Limité (orienté code) | Oui (axe principal) |
| Connecteurs externes (MCP) | Oui + recherche web | Oui (plugins + connecteurs) |
| Agents en parallèle | Oui (threads parallèles) | Non mis en avant |
| Pilotage depuis le mobile | Via l'app ChatGPT iOS | Oui |
Le constat à l’usage est net : Codex couvre le développement en profondeur (exécution de commandes, édition multi-fichiers, intégration GitHub, parallélisme), Cowork couvre la bureautique en largeur (applications, tableurs, navigateur). Les deux périmètres se recoupent peu, et c’est pour ça que le « match » n’a de sens que sur le terrain commun : agir sur la machine, en local. Pour piloter le système, lancer des commandes et toucher au système de fichiers — la définition même du travail agentique local — Codex est plus direct ; pour transformer un tas de documents en livrable, Cowork est plus à l’aise.
Autonomie et garde-fous
C’est ici que les deux cultures divergent le plus.
Codex gradue l’autonomie par des niveaux de bac à sable :
- lecture seule : il inspecte, ne touche à rien sans validation ;
- écriture dans le dossier de travail (le mode par défaut) : il lit, édite et lance des commandes dans le projet, mais demande l’autorisation avant d’aller sur Internet ou hors du dossier ;
- accès total : plus aucune frontière, ni fichiers ni réseau.
Sur Windows, ce bac à sable s’appuie sur des mécanismes du système : selon la configuration, Codex isole ses actions via des comptes à privilèges réduits, des frontières de système de fichiers et des règles de pare-feu, ou via un jeton restreint et des autorisations d’accès (ACL). Conséquence directe : Codex peut être réglé pour agir très loin sans intervention humaine — y compris exécuter des tâches dans le cloud ou faire tourner plusieurs agents en même temps. C’est sa force pour le travail autonome… et exactement ce qui impose de la rigueur.
Cowork mise sur le plan validé. Avant d’agir, il affiche ce qu’il compte faire et attend votre feu vert ; vous choisissez les dossiers et connecteurs auxquels il accède, et vous pouvez le rediriger à n’importe quelle étape. Ce contrôle systématique est rassurant — il limite les mauvaises surprises — mais il brise l’idée d’un agent qui abat le travail pendant que vous dormez. Surtout, Cowork ne tourne pas en arrière-plan une fois l’application fermée : les tâches ne s’exécutent que si l’ordinateur est allumé et l’application ouverte.
Bilan du critère : pour l’autonomie brute (parallélisme, arrière-plan, déport cloud), Codex prend le point. Pour les garde-fous (plan validé, contrôle pas à pas), Cowork prend le sien. Deux visions opposées de ce que doit être « un agent qui travaille seul ».
Windows en local : natif contre machine virtuelle
C’est le cœur du sujet, et c’est à l’installation que la différence saute aux yeux.
| Sur Windows | Codex | Cowork |
|---|---|---|
| Mode d'exécution | Natif (app, terminal, extension IDE) | Machine virtuelle Hyper-V |
| Shell | PowerShell natif, sans WSL obligatoire | Passe par la VM isolée |
| Isolation | Bac à sable au niveau du système | Forte isolation par la VM |
| Édition Windows requise | Windows 11 conseillé (Win 10 récent toléré) | Windows 11 Pro/Enterprise (Home insuffisant) |
| Friction d'installation | Faible | Élevée (dépend de la VM) |
| Tâches en arrière-plan | Oui (cloud) | Non si l'app est fermée |
Codex joue la carte du natif. Sur notre poste, il s’est lancé au plus près du système : commandes PowerShell natives, bac à sable géré directement par Windows, sans dépendre de WSL. On confie une tâche, il lit le dossier, exécute, corrige — l’expérience est immédiate, sur une édition Windows standard.
Cowork joue la carte de la machine virtuelle. Cowork installe un service de machine virtuelle Hyper-V sur le PC et y exécute son travail. C’est élégant côté sécurité — l’agent est cloisonné du reste de la machine — mais ça impose un prérequis brutal : Windows 11 Pro ou Enterprise. L’édition Home ne fournit pas le composant de gestion de machines virtuelles requis, et l’installation se bloque avant même de commencer. À cela s’ajoutent des aléas observés sur Windows : un service de VM qui s’interrompt après une mise en veille, des conflits réseau avec un VPN ou Docker qui privent la VM d’accès Internet. Quand la VM tousse, l’agent perd la main.
Sur ce critère décisif — faire travailler un agent en local sur une machine Windows ordinaire — l’écart est net. Codex s’installe et travaille partout ; Cowork exige une édition Pro et une couche de virtualisation qui peut se mettre en travers. C’est l’une des raisons qui font pencher la balance générale du côté de Codex pour l’usage local sur Windows. Reste que cette VM, contraignante, protège mieux le reste de votre système : la rançon de la commodité, c’est moins d’isolation.
Fiabilité, sécurité et coûts cachés
Un agent qui agit seul sur votre machine, c’est aussi un risque qui agit seul sur votre machine. Les deux outils ont leurs angles morts, et il serait malhonnête d’en épargner un.
Codex — sécurité déjà prise en défaut. Une faille critique (CVE-2025-61260) a visé Codex CLI : un dépôt piégé pouvait, via un simple fichier de configuration local pointant vers des définitions malveillantes, faire exécuter une commande dès le démarrage de l’outil, sans le moindre consentement. De quoi installer un accès distant, voler des identifiants, exfiltrer des secrets ou compromettre une chaîne d’intégration. La faille a été corrigée dans une version ultérieure, mais elle rappelle une règle d’or : un agent qui lit la configuration d’un projet inconnu doit être traité comme du code qu’on exécute. S’ajoute le coût qui grimpe mécaniquement avec l’usage, du fait de la facturation au token.
Cowork — risque de suppression et dépendance au service. Le danger n’est pas une faille exotique, c’est la banalité : plusieurs utilisateurs rapportent des dégâts après une consigne trop vague — typiquement un agent à qui l’on demande de « ranger un dossier » et qui efface bien plus que prévu. Cowork dépend aussi d’un service distant : en période de saturation, il hérite des lenteurs et des pannes du service Claude, et il ne fonctionne pas hors ligne ni application fermée. Son atout sécurité reste l’isolation par VM, qui limite la casse en cas de dérapage.
Notre lecture : match nul sur l’intention (les deux peuvent faire des dégâts), mais des profils de risque différents. Codex expose surtout à l’exécution non maîtrisée ; Cowork surtout à la suppression de données et à la panne de service.
Trois scénarios concrets
Pour sortir des généralités, voici comment chaque outil s’en sort sur trois tâches typiques d’un poste Windows.
1. Corriger un bug dans un projet de code. Lecture du dépôt, modification de plusieurs fichiers, exécution des tests, correction en boucle. C’est le terrain de jeu de Codex : accès direct au shell, édition multi-fichiers, intégration Git. Cowork peut s’en approcher, mais sans la même fluidité. Avantage Codex.
2. Compiler un rapport à partir de fichiers Excel et d’un site web. Ouvrir plusieurs tableurs, extraire des chiffres, croiser avec une page web, produire un document propre. Là, Cowork est dans son élément : il pilote les applications et le navigateur, et son large contexte aide à garder le fil. Codex, orienté code, est moins naturel. Avantage Cowork.
3. Lancer une tâche longue et la laisser tourner. Un nettoyage de base de code, une migration, un traitement par lots qu’on veut lancer le soir. Codex peut déporter la tâche dans le cloud et faire tourner des agents en parallèle ; Cowork s’arrête dès que l’application est fermée. Avantage Codex.
Deux scénarios sur trois reviennent à Codex — non parce qu’il serait « meilleur » dans l’absolu, mais parce que deux de ces trois tâches relèvent du travail système local, son point fort. Sur la tâche bureautique pure, Cowork reprend la main sans discussion.
Forces et limites de chacun
| Outil | Forces | Limites |
|---|---|---|
| Codex | Natif Windows (PowerShell) ; profond sur le code ; threads parallèles ; tâches cloud en arrière-plan ; offre gratuite. | Autonomie pouvant aller jusqu'à l'accès total ; faille de sécurité passée (CVE) ; facturation au token qui grimpe ; peu utile hors développement. |
| Cowork | Généraliste (apps, tableurs, navigateur) ; plan validé avant d'agir ; isolation par VM ; inclus dans l'abonnement Claude. | Exige Windows 11 Pro (VM Hyper-V) ; pas d'arrière-plan app fermée ; quota partagé qui se vide vite ; risque de suppression ; dépend du service distant. |
Ce qu’il faut retenir
- Vainqueur sur le travail agentique local Windows : Codex (4-3). Natif, sans friction d’installation, plus autonome, accessible jusqu’au gratuit.
- Cowork gagne hors du code : bureautique (tableurs, navigateur, documents), garde-fous plus stricts, isolation par machine virtuelle.
- Prix d’entrée proches (gratuit / ~20 $ / 100 $+), mais mécaniques opposées : Codex décompte par fenêtres de 5 h puis facture aux tokens (~100-200 $/dev/mois selon OpenAI) ; Cowork est inclus dans l’abonnement Claude mais puise dans le quota commun.
- Autonomie : Codex peut être poussé jusqu’à l’accès total et tourner en arrière-plan ; Cowork impose un plan validé et s’arrête, application fermée.
- Sécurité : Codex a connu une faille critique corrigée (CVE-2025-61260) ; Cowork expose surtout au risque de suppression et dépend d’un service distant.
- Prérequis qui tranche : Cowork exige Windows 11 Pro/Enterprise ; Codex tourne sur une édition standard.
Notre verdict. L’IA promet un collègue qui travaille tout seul ; Le Recul vérifie : on en est aux assistants encadrés, pas aux employés autonomes — pour l’un comme pour l’autre. Sur le terrain précis de ce test — faire travailler un agent en local, sur Windows — Codex l’emporte, parce qu’il s’installe partout, agit au plus près du système et pousse l’autonomie plus loin. Cowork garde une vraie longueur d’avance dès qu’il s’agit de bureautique déléguée, avec des garde-fous plus stricts. Le score serré (4-3) dit l’essentiel : ce n’est pas une démonstration de force, c’est un choix d’usage. Dans tous les cas, la règle reste la même : sauvegardez, validez les plans, et ne donnez jamais les pleins pouvoirs à une machine sur la foi d’une promesse.