← Articles

Claude Sonnet 4.6 : 1 million de tokens et nouveau modèle par défaut

Sonnet 4.6 devient le modèle gratuit de Claude avec des performances proches d'Opus, une fenêtre de contexte d'1M de tokens et l'Adaptive Thinking.

Anthropic vient de frapper fort : Claude Sonnet 4.6 est désormais le modèle par défaut pour tous les utilisateurs, y compris le tier gratuit. Et ses specs ont de quoi surprendre.

Les chiffres qui parlent

BenchmarkSonnet 4.6Opus 4.6
SWE-bench Verified79.6%~82%
OSWorld72.5%~75%
Prix (input/output)$3 / $15$15 / $75

Sonnet 4.6 rivalise avec Opus au cinquième du prix. Pour la majorité des cas d’usage, c’est le sweet spot idéal.

1 million de tokens de contexte

C’est la headline : Sonnet 4.6 peut ingérer jusqu’à 1 million de tokens en une seule requête (beta).

Pour donner un ordre de grandeur :

  • 1M tokens ≈ 750 000 mots ≈ 10 romans
  • Un repo moyen (50 fichiers) tient largement dans le contexte
  • Une documentation technique complète ? Ça passe aussi
import anthropic

client = anthropic.Anthropic()

# Vous pouvez envoyer un repo entier dans le contexte
with open("mon-repo-complet.txt") as f:
    code = f.read()  # même 500K tokens, ça passe

response = client.messages.create(
    model="claude-sonnet-4-6-20260217",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": f"Analyse ce codebase et identifie les failles de sécurité :\n\n{code}"
    }]
)

Plus besoin de découper vos documents en chunks ou de faire du RAG pour des volumes raisonnables. Vous balancez tout, Claude se débrouille.

Adaptive Thinking : Claude réfléchit quand il faut

L’Adaptive Thinking est le nouveau moteur de raisonnement de Sonnet 4.6. Concrètement, le modèle décide lui-même quand une question nécessite une réflexion approfondie.

Pour une question simple comme “Quelle est la syntaxe d’un map en Python ?”, Claude répond directement. Pour un problème de debug complexe, il active son raisonnement étendu automatiquement.

response = client.messages.create(
    model="claude-sonnet-4-6-20260217",
    max_tokens=8000,
    thinking={
        "type": "enabled",
        "budget_tokens": 5000  # budget pour le raisonnement
    },
    messages=[{
        "role": "user",
        "content": "Pourquoi cette query SQL retourne des doublons ?"
    }]
)

# Accès au raisonnement interne
for block in response.content:
    if block.type == "thinking":
        print("Réflexion :", block.thinking)
    elif block.type == "text":
        print("Réponse :", block.text)

Le résultat : des réponses plus justes sur les problèmes complexes, sans ralentir les réponses simples.

Web Search amélioré

Sonnet 4.6 intègre un Dynamic Filtering pour la recherche web : le modèle exécute du code en interne pour vérifier les faits en temps réel. Moins d’hallucinations, plus de fiabilité.

Le tier gratuit s’enrichit

Bonne nouvelle pour ceux qui n’ont pas d’abonnement. Le tier gratuit de Claude inclut maintenant :

  • Création de fichiers (artefacts)
  • Connecteurs (Google Drive, etc.)
  • Skills (templates de prompts)
  • Compaction (conversations longues)

Des fonctionnalités qui étaient réservées aux abonnés Pro il y a encore quelques semaines.

Quel modèle choisir ?

Voici mon guide rapide :

BesoinModèle recommandé
Usage quotidien, chat, code simpleSonnet 4.6 (gratuit)
Code complexe, gros projetsSonnet 4.6 (Pro, avec thinking)
Tâches critiques, multi-agentOpus 4.6 (Pro/Max)
Prototypage rapide, scriptsHaiku 4.5 (le plus rapide)

Pour 90% des développeurs, Sonnet 4.6 suffit largement. Opus 4.6 se justifie pour les projets complexes ou le multi-agent (Agent Teams).

Ce qu’il faut retenir

Sonnet 4.6, c’est un modèle flagship déguisé en modèle mid-tier. 1M de tokens, Adaptive Thinking, performances proches d’Opus. Le tout à $3/$15.

Anthropic démocratise l’accès à l’IA de pointe, et c’est une excellente nouvelle pour les développeurs.


Sonnet 4.6 est disponible dès maintenant sur claude.ai, l’API Anthropic et Claude Code.