Quand la confiance devient une arme
Une nouvelle technique d’attaque vient d’être documentée par BleepingComputer : des hackers créent de fausses conversations Claude.ai pour diffuser des malwares sur Mac. Pas de vulnérabilité technique dans Claude lui-même. Pas de faille de sécurité chez Anthropic. Juste une exploitation méthodique de notre confiance envers les interfaces d’IA conversationnelle.
Et c’est précisément ce qui rend cette attaque brillante et inquiétante.
Le scénario est d’une simplicité redoutable : l’utilisateur clique sur une pub Google (elle-même malveillante), arrive sur une page qui ressemble trait pour trait à l’interface Claude.ai, engage une conversation avec ce qu’il croit être Claude, et le « modèle » lui suggère d’installer un logiciel pour résoudre son problème. Résultat : un malware sur sa machine.
Ce qui me frappe en tant que praticien quotidien de Claude, c’est que cette attaque ne repose pas sur une faiblesse technique. Elle exploite quelque chose de bien plus fondamental : la relation de confiance asymétrique que nous avons développée avec les IA conversationnelles.
Pourquoi ça fonctionne si bien
Quand vous utilisez Claude ou ChatGPT tous les jours, vous développez un réflexe cognitif particulier : vous baissez votre garde critique. Pas complètement, mais suffisamment pour que l’interaction soit fluide et productive.
C’est normal. C’est même souhaitable pour travailler efficacement avec une IA. Le problème, c’est que les attaquants l’ont compris.
La technique utilisée ici repose sur trois piliers :
1. La reproduction parfaite de l’interface
Les fausses pages Claude.ai sont visuellement identiques. Police, couleurs, mise en page, jusqu’au petit logo en haut à gauche. Pour un utilisateur Mac habitué à jongler entre plusieurs onglets, la différence est imperceptible en situation réelle.
2. Le mimétisme conversationnel
Le faux « Claude » répond avec le ton, la structure et les tournures de phrase caractéristiques du vrai modèle. Les attaquants ont manifestement étudié les patterns de réponse de Claude pour créer des scripts convaincants.
3. L’autorité technique implicite
Quand « Claude » vous suggère d’installer un outil, ça ne ressemble pas à une pub intrusive. Ça ressemble à un conseil d’expert. C’est la même dynamique qui fait qu’on suit les recommandations de son médecin sans les questionner.
Ce que ça révèle sur notre usage de l’IA
Cette attaque met en lumière une vulnérabilité plus large : nous n’avons pas encore développé les réflexes de sécurité adaptés à l’ère de l’IA conversationnelle.
Avec les sites web classiques, nous avons appris (difficilement, mais nous avons appris) :
- À vérifier l’URL dans la barre d’adresse
- À nous méfier des boutons « Télécharger » trop visibles
- À questionner les demandes d’installation de logiciel
Mais avec les interfaces conversationnelles, ces réflexes sont court-circuités. L’interface disparaît au profit du dialogue. On ne regarde plus l’URL. On ne se pose plus la question de savoir si c’est “légitime” parce que la conversation elle-même crée la légitimité.
J’ai testé moi-même cette semaine : combien de fois est-ce que je vérifie activement que je suis bien sur claude.ai et non sur une copie ? Réponse honnête : jamais. Je tape “clau” dans la barre d’adresse, Chrome autocomplete, j’appuie sur Entrée et je commence à travailler.
Ce raccourci mental est une cible parfaite.
La responsabilité partagée qu’on refuse de voir
Anthropic n’est pas responsable de cette attaque. La sécurité de la plateforme Claude.ai n’a pas été compromise. Mais l’entreprise porte une responsabilité indirecte : celle d’avoir créé une interface suffisamment distinctive pour être reconnaissable, mais pas suffisamment sécurisée au niveau de l’expérience utilisateur pour être infalsifiable.
Qu’est-ce que je veux dire par là ?
Prenez votre banque en ligne. Elle a probablement mis en place :
- Une authentification à deux facteurs systématique
- Des alertes de connexion depuis un nouvel appareil
- Des messages d’avertissement quand vous allez faire une action sensible
- Une conception visuelle qui intègre des éléments de sécurité (cadenas, codes couleur, etc.)
Claude.ai, comme la plupart des interfaces d’IA conversationnelle, n’a rien de tout ça. L’expérience est délibérément fluide, frictionless, sans interruption. C’est excellent pour la productivité. C’est catastrophique pour la sécurité.
Et je ne jette pas la pierre à Anthropic. OpenAI, Google, Mistral : tous ont le même problème. L’industrie entière de l’IA conversationnelle a optimisé pour la fluidité au détriment de la vigilance.
Ce qui doit changer (et ce que vous pouvez faire maintenant)
Du côté des fournisseurs d’IA, plusieurs mesures devraient devenir standard :
Authentification visuelle persistante
Un élément graphique unique, généré aléatoirement pour chaque utilisateur lors de la création de compte, qui apparaît systématiquement dans l’interface. Si vous ne voyez pas votre “signature visuelle”, vous savez instantanément que vous n’êtes pas sur le bon site.
Interdiction absolue de recommander des installations
Claude, GPT et les autres devraient avoir une règle système dure : jamais de suggestion d’installation de logiciel tiers. Jamais. Cette limitation fonctionnelle devient un élément de sécurité.
Watermarking conversationnel
Des phrases ou tournures uniques, impossibles à reproduire sans accès au vrai modèle, qui permettent de vérifier l’authenticité de l’échange.
Mais en attendant que ces protections existent, voici ce que je fais maintenant systématiquement :
-
J’ai mis claude.ai en favori et je n’y accède QUE par ce favori. Plus jamais via une recherche Google ou un lien.
-
Je vérifie l’URL avant chaque nouvelle session. Oui, c’est pénible. Oui, ça casse le flow. Mais une seconde de friction vaut mieux qu’un malware.
-
Je ne suis jamais aucune recommandation d’installation venant d’une IA conversationnelle, même si elle semble légitime. Si Claude me suggère un outil, je sors de l’interface, je fais ma propre recherche, et je télécharge depuis la source officielle.
-
J’ai activé les notifications de connexion sur mon compte Anthropic pour être alerté de toute activité inhabituelle.
La leçon qu’on feint d’ignorer
Cette attaque n’est pas un cas isolé. C’est le premier signal d’un problème structurel : notre modèle mental de la sécurité en ligne n’est pas adapté aux interfaces conversationnelles.
Pendant 30 ans, nous avons appris à nous méfier des sites web qui “ont l’air suspect”. Mais les IA conversationnelles n’ont pas d’air suspect. Elles parlent bien. Elles sont polies. Elles nous aident.
Les hackers l’ont compris avant nous.
Le paradoxe, c’est que plus Claude devient utile, plus il devient une cible attractive pour ce type d’attaque. Plus nous lui faisons confiance, plus cette confiance devient exploitable. C’est la rançon du succès, et c’est un problème que l’industrie ne peut plus se permettre d’ignorer.
Anthropic a construit Claude avec une obsession pour la sécurité et l’alignement. Il est temps d’appliquer cette même rigueur à l’expérience utilisateur elle-même. Parce qu’un modèle parfaitement sûr ne sert à rien si l’interface qui y donne accès peut être clonée en une heure par un attaquant motivé.
Et vous, avez-vous déjà vérifié l’URL de votre interface Claude aujourd’hui ? Prenez cinq minutes pour mettre claude.ai en favori et activer les notifications de sécurité sur votre compte. C’est moins sexy que de discuter des capacités de raisonnement de Claude 3.5 Sonnet, mais ça pourrait vous éviter un malware.
Partagez cet article avec vos collègues qui utilisent Claude. Pas pour faire peur, mais pour créer le réflexe de sécurité qui manque encore à notre adoption collective de l’IA conversationnelle.