← Articles

Anthropic ouvre les Extended Thinking à tous : Claude réfléchit jusqu'à 10 minutes avant de répondre

La fonctionnalité Extended Thinking est désormais accessible à tous les utilisateurs Claude. Fini les réponses instantanées moyennes, Claude peut maintenant prendre son temps pour résoudre les problèmes complexes.

Claude qui prend son temps, c’est nouveau et c’est dispo maintenant

Anthropic vient de déployer Extended Thinking pour tous les utilisateurs. Avant, c’était réservé aux API et aux comptes Pro. Maintenant, même avec un compte gratuit, vous pouvez voir Claude réfléchir pendant plusieurs minutes avant de vous sortir sa réponse.

Le principe ? Au lieu de générer une réponse direct, Claude « pense » d’abord en interne. Ça ressemble aux modèles o1 d’OpenAI, mais avec l’approche Anthropic : vous voyez exactement ce que Claude se raconte pendant qu’il réfléchit.

Bon, concrètement ça change quoi pour nous ?

Comment ça marche techniquement

Quand vous activez Extended Thinking sur claude.ai, le modèle passe par une phase de raisonnement avant de générer sa réponse finale. Cette phase peut durer de 30 secondes à 10 minutes selon la complexité de votre demande.

Vous voyez apparaître en temps réel les étapes de réflexion. Claude se parle à lui-même en quelque sorte. Il explore des pistes, se corrige, revient en arrière. C’est assez impressionnant la première fois.

La semaine dernière j’ai testé ça sur un problème de maths niveau prépa que mon neveu m’avait filé. Sans Extended Thinking, Claude me sortait une réponse correcte mais classique en 15 secondes. Avec Extended Thinking activé, il a pris 4 minutes, exploré trois approches différentes, et au final m’a donné une solution plus élégante avec une explication sur pourquoi les deux autres méthodes étaient moins optimales.

Le truc c’est que ça consomme beaucoup plus de tokens. En mode gratuit, vous avez droit à quelques utilisations par jour. En Pro, c’est illimité mais ça compte triple dans votre quota.

Les cas où ça vaut vraiment le coup

Franchement, activez pas Extended Thinking pour tout et n’importe quoi. Pour rédiger un email ou résumer un texte, c’est du gaspillage.

Par contre, pour ces situations là, c’est bluffant :

Problèmes de code complexes : Quand vous avez un bug tordu ou que vous cherchez l’architecture optimale pour un système. Claude va vraiment explorer les différentes options, peser le pour et le contre de chaque approche.

Maths et logique : Problèmes de niveau lycée ou sup, énigmes logiques, optimisations. Là il brille vraiment. J’ai testé avec des problèmes de concours, et il cartonne.

Analyse stratégique : Pour des décisions business complexes où vous avez plein de paramètres à considérer. Claude va structurer sa réflexion, identifier les risques, proposer des scénarios.

Vérification et critique : Vous avez pondu un raisonnement complexe ? Demandez à Claude en mode Extended Thinking de le vérifier. Il va chercher les failles logiques, les assumptions bancales.

Creative writing structuré : Pas pour écrire directement, mais pour construire l’architecture narrative d’un roman ou d’un scénario. Il va réfléchir aux arcs narratifs, aux contradictions potentielles entre personnages.

En vrai, le pattern que j’ai remarqué : plus votre problème a plusieurs solutions valides avec des trade-offs, plus Extended Thinking apporte de la valeur.

Ma comparaison avec o1 d’OpenAI

Alors oui, OpenAI a sorti o1 et o1-pro avant. Anthropic n’est pas le premier sur ce coup.

Mais il y a deux différences majeures :

La transparence : Avec Claude, vous voyez tout le processus de réflexion. Chez OpenAI, c’est une boîte noire. Vous voyez juste “thinking…” et hop, la réponse finale. Perso je préfère voir le cheminement, surtout quand Claude se trompe et se corrige.

L’intégration : Extended Thinking marche avec tous les outils Claude. Artifacts, Projects, analyse de documents. Chez OpenAI, o1 c’est un modèle à part sans les features avancées du reste de la plateforme.

Par contre, o1-pro est objectivement meilleur sur les maths pures et la physique théorique. J’ai fait tourner les deux sur les mêmes problèmes de l’Olympiade internationale de maths. o1-pro gagne 7 fois sur 10.

Mais Claude Extended Thinking est plus polyvalent. Il garde sa capacité à bien écrire, à comprendre les nuances, à bosser sur du code legacy dégueu. o1 c’est un laser ultra-puissant mais étroit. Claude c’est un couteau suisse qui sait aussi réfléchir longuement.

Ce que ça change pour les devs et les entreprises

Si vous utilisez l’API, Extended Thinking change pas mal la donne pour certains use cases.

Avant, pour des tâches complexes, vous deviez soit :

  • Faire plusieurs aller-retours avec Claude (lent et cher)
  • Pré-décomposer le problème vous-même en sous-tâches (chiant)
  • Accepter une réponse moyenne (frustrant)

Maintenant vous pouvez juste activer extended_thinking et laisser Claude faire le boulot.

J’ai un pote qui bosse sur un outil d’analyse de contrats. Avant il faisait un pipeline en 5 étapes avec des prompts différents. Maintenant il balance tout à Claude en Extended Thinking et ça sort directement l’analyse complète avec les clauses problématiques, les risques juridiques, et les suggestions de reformulation.

Par contre attention au coût. Une requête Extended Thinking peut facilement consommer 50k à 100k tokens. À 3$ pour 1M tokens input et 15$ pour 1M tokens output sur l’API, ça monte vite si vous optimisez pas.

Mon conseil : utilisez Prompt Caching pour les contextes longs que vous réutilisez. Et activez Extended Thinking seulement quand la qualité de la réponse justifie le coût.

Les limites qu’on voit déjà

Bon, faut être honnête, c’est pas magique non plus.

Ça prend du temps : Attendre 5 minutes pour une réponse, c’est long. Surtout si au final la réponse vous convient pas et que vous devez relancer. Pour du dev interactif rapide, c’est pas idéal.

C’est pas toujours nécessaire : Des fois Claude réfléchit pendant 3 minutes pour au final sortir exactement la même réponse qu’il aurait donné en mode normal. Difficile de savoir à l’avance.

Le quota en version gratuite : Vous avez genre 5 ou 6 Extended Thinking par jour en gratuit. Ça part vite si vous testez.

Pas adapté aux tâches simples : J’ai vu des gens l’activer par défaut. Erreur. Pour 80% des tâches courantes, le mode normal suffit largement.

Et puis bon, parfois Claude se perd dans sa réflexion. Il explore une piste pendant 2 minutes, se rend compte que ça mène nulle part, repart sur autre chose. C’est intéressant à voir mais ça allonge le temps pour rien.

Comment l’activer et bien l’utiliser

Sur claude.ai, c’est simple : vous avez maintenant un toggle “Extended Thinking” dans les paramètres avancés avant d’envoyer votre message.

Mon workflow perso :

  1. Je formule ma question en mode normal d’abord
  2. Si la réponse me satisfait, parfait
  3. Si je sens que le problème mérite plus de réflexion, je réactive Extended Thinking et je reformule en demandant explicitement à Claude d’explorer les différentes approches

Pour l’API, vous ajoutez juste le paramètre extended_thinking: true dans votre requête. Pensez à augmenter le timeout parce que ça peut être long.

Ah et aussi : combinez Extended Thinking avec les Projects. Si vous bossez sur un sujet complexe, mettez tout le contexte dans un Project et activez Extended Thinking. Claude va pouvoir réfléchir en ayant accès à tout votre historique et vos documents.

Alors, faut s’y mettre ?

Ouais, clairement.

Même si vous êtes en version gratuite, testez sur vos problèmes les plus complexes. Vous verrez vite si ça apporte de la valeur pour votre usage.

Pour les comptes Pro, c’est un game changer sur les tâches qui nécessitent vraiment de la réflexion approfondie. Moi je l’utilise maintenant systématiquement pour l’architecture de nouveaux projets, les reviews de code critiques, et l’analyse de docs techniques complexes.

Pour les entreprises qui utilisent l’API, faites le calcul. Si une réponse de meilleure qualité vous fait gagner 30 minutes de temps humain, payer 0,50$ de plus en tokens c’est rentable.

Le vrai truc à retenir : Extended Thinking c’est pas un remplaçant du mode normal, c’est un complément pour les 20% de tâches qui en valent la peine. Utilisez-le intelligemment et vous allez voir la différence.

Et franchement, voir Claude réfléchir en temps réel, se corriger, explorer des pistes, c’est fascinant. Ça change votre perception de ce qu’est vraiment l’IA. C’est plus juste un perroquet statistique qui crache du texte, là y’a vraiment un processus de raisonnement qui se passe.