Claude contrôle votre Mac : la faille déjà exploitée

Anthropic vient de donner à Claude le pouvoir de cliquer, taper et naviguer sur votre Mac à votre place. Pendant ce temps, la fonctionnalité équivalente chez OpenAI a perdu trois quarts de ses utilisateurs en quelques mois. La course aux agents de bureau est lancée, mais personne n’a encore trouvé la formule.

Claude apprend à utiliser un ordinateur comme un humain

Annoncée ce 24 mars, la nouvelle capacité de Claude Cowork permet à l’assistant d’Anthropic de prendre le contrôle direct du bureau macOS. Concrètement, Claude peut déplacer la souris, cliquer sur des boutons, saisir du texte et passer d’une application à l’autre comme le ferait un opérateur humain assis devant l’écran.

Le mécanisme fonctionne en deux temps, selon Anthropic. Claude tente d’abord d’utiliser les intégrations logicielles classiques : Slack, calendriers, applications connectées. Ce n’est que lorsqu’aucune interface n’est disponible que l’IA bascule sur le contrôle physique du bureau. Le contrôle direct n’est donc pas le mode par défaut, mais un dernier recours.

Cette capacité est disponible en « research preview » (version de test avant lancement grand public) dans Claude Cowork et Claude Code, et reste pour l’instant limitée à macOS. Anthropic a également dévoilé une fonctionnalité baptisée « Dispatch » qui permet de piloter son propre ordinateur à distance depuis n’importe quel appareil, rapporte The Decoder.

Le rachat éclair qui a tout accéléré

Derrière cette annonce se cache une acquisition. Anthropic avait racheté Vercept AI, une startup spécialisée dans le contrôle d’écran par intelligence artificielle, comme nous le rapportions dans un précédent article. Selon Kiana Ehsani, co-fondatrice de Vercept, son équipe a livré son premier produit en moins de quatre semaines après avoir rejoint Anthropic.

L’intégration a été plus rapide que prévu. Ehsani explique sur X que tout le monde craignait que le rachat ralentisse le développement. C’est l’inverse qui s’est produit. Elle attribue cette vitesse à la culture interne d’Anthropic, où « tout le monde va vite, tout le monde est brillant, humble et disponible », selon ses propres mots.

Cowork lui-même avait été construit en une semaine et demie seulement, entièrement par Claude Code, l’outil de développement assisté par IA d’Anthropic. Une rapidité impressionnante, mais qui pose une question que les chercheurs en sécurité n’ont pas tardé à rendre très concrète.

Deux jours et un fichier Word pour voler des données confidentielles

Deux jours. C’est le temps qu’il a fallu aux chercheurs de PromptArmor pour documenter une vulnérabilité critique dans la version initiale de Cowork, lancée en janvier. La technique est redoutable de simplicité : un attaquant glisse dans le dossier de travail de l’utilisateur un fichier Word (.docx) déguisé en document anodin.

À l’intérieur, une instruction cachée en police de 1 point, en blanc sur fond blanc, avec un interligne de 0,1. Invisible à l’œil humain, parfaitement lisible par l’IA. L’injection de prompt (une technique qui détourne le comportement d’une IA en insérant des instructions malveillantes dans un contenu qu’elle analyse) est le talon d’Achille des systèmes d’IA agentiques.

Lorsque l’utilisateur demande à Cowork d’analyser ses fichiers en utilisant ce « skill » piégé, l’injection prend le relais. Elle ordonne à Claude d’exécuter une commande qui expédie le fichier le plus volumineux du dossier vers le compte Anthropic de l’attaquant, via l’API officielle de l’entreprise. Aucune autorisation humaine n’est requise à aucune étape du processus.

Le plus préoccupant : même Claude Opus 4.5, le modèle le plus puissant d’Anthropic au moment du test, est tombé dans le piège. Le chercheur Johann Rehberger, du site embracethered.com, avait d’ailleurs signalé la faille d’isolation sous-jacente avant même le lancement de Cowork. Anthropic avait reconnu le problème sans jamais le corriger, selon les conclusions de PromptArmor.

OpenAI a testé la même idée, résultat : 75 % d’utilisateurs en moins

Anthropic n’est pas la première entreprise à tenter de transformer une IA en agent de bureau. OpenAI avait lancé ChatGPT Agent avec la promesse de laisser l’IA naviguer sur le web et accomplir des tâches complexes de manière autonome, via un navigateur virtuel intégré.

Les résultats ont été catastrophiques. Au lancement, ChatGPT Agent attirait quatre millions d’utilisateurs actifs par semaine, soit environ 11 % des 35 millions d’abonnés payants d’OpenAI. En quelques mois, ce chiffre a plongé sous le million, selon The Information. Les utilisateurs ne comprenaient pas à quoi servait l’outil, ou ne savaient même pas qu’il existait. Les problèmes de vitesse, de fiabilité et de cybersécurité n’ont rien arrangé.

OpenAI a depuis pivoté vers des agents spécialisés comme « Shopping Research », un assistant dédié aux recommandations de produits. Le nom « ChatGPT Agent » était lui-même source de confusion, souligne The Decoder : ChatGPT était déjà capable de naviguer sur le web et d’écrire du code, ce qui rendait difficile pour les utilisateurs de comprendre ce que l’agent apportait de plus. Le constat est net : les modèles d’IA actuels ne sont pas encore capables de tout faire de manière autonome. Les agents qui fonctionnent sont ceux dont la mission est clairement définie.

Pourquoi la stratégie d’Anthropic est différente

La stratégie d’Anthropic diverge de celle d’OpenAI sur un point fondamental. Plutôt qu’un agent généraliste, Claude Cowork s’appuie sur un écosystème d’intégrations spécialisées et ne recourt au contrôle bureau qu’en dernier recours. C’est une approche modulaire : chaque outil est utilisé dans son contexte optimal, et le contrôle brut du bureau n’intervient que lorsque tout le reste échoue.

Mais les défis restent immenses. L’injection de prompt, la faille exploitée contre Cowork, est un problème structurel de toute l’industrie que personne n’a résolu malgré des années de recherche. Tant que les modèles de langage ne distinguent pas de manière fiable les instructions légitimes des instructions malveillantes cachées dans les documents, donner à une IA le contrôle d’un ordinateur revient à lui confier les clés de la maison en laissant les fenêtres ouvertes.

La concurrence s’organise. Meta a récemment acqui-embauché l’équipe complète de Dreamer pour renforcer ses propres ambitions en matière d’agents IA, rapporte The Decoder. Jensen Huang, PDG de Nvidia, a expliqué sur le podcast de Lex Fridman que les agents IA vont utiliser les logiciels existants plutôt que les remplacer, comparant l’impact du concept à celui de ChatGPT pour l’IA générative. Nvidia a d’ailleurs redessiné toute l’architecture de ses serveurs Vera Rubin pour exécuter des agents plutôt que de simples modèles de langage.

Pour les utilisateurs de Mac, la fonctionnalité reste en phase de test et nécessite une activation volontaire. La prochaine mise à jour d’Anthropic devra démontrer que les protections contre l’injection de prompt ont été sérieusement renforcées. Sans quoi, le contrôle bureau de Claude risque de rester une démonstration technique séduisante pour développeurs, mais trop risquée pour que le grand public y confie son quotidien numérique. OpenAI a déjà montré ce qui se passe quand on met un agent de bureau entre les mains d’utilisateurs qui n’en voient pas l’utilité : ils partent.

Claude peut cliquer et taper sur votre Mac : un fichier invisible a déjà volé des données

Claude apprend à utiliser un ordinateur comme un humain

Le rachat éclair qui a tout accéléré

Deux jours et un fichier Word pour voler des données confidentielles

OpenAI a testé la même idée, résultat : 75 % d’utilisateurs en moins

Pourquoi la stratégie d’Anthropic est différente

À lire aussi

Partager

Laisser un commentaire Annuler la réponse

Articles similaires

Dire à ChatGPT qu’il est expert le rend plus nul, et c’est prouvé

Cette IA a résolu un problème de maths qu’aucun humain n’avait cracké

ChatGPT garde vos fichiers sans rien demander, et l’Europe n’y a pas droit