Claude Sonnet 4.6 : 1 million de tokens et nouveau modele par defaut

Anthropic vient de frapper fort : Claude Sonnet 4.6 est desormais le modele par defaut pour tous les utilisateurs, y compris le tier gratuit. Et ses specs ont de quoi surprendre.

Les chiffres qui parlent

Benchmark	Sonnet 4.6	Opus 4.6
SWE-bench Verified	79.6%	~82%
OSWorld	72.5%	~75%
Prix (input/output)	$3 / $15	$15 / $75

Sonnet 4.6 rivalise avec Opus au cinquieme du prix. Pour la majorite des cas d’usage, c’est le sweet spot ideal.

1 million de tokens de contexte

C’est la headline : Sonnet 4.6 peut ingerer jusqu’a 1 million de tokens en une seule requete (beta).

Pour donner un ordre de grandeur :

1M tokens ≈ 750 000 mots ≈ 10 romans
Un repo moyen (50 fichiers) tient largement dans le contexte
Une documentation technique complete ? Ca passe aussi

import anthropic

client = anthropic.Anthropic()

# Vous pouvez envoyer un repo entier dans le contexte
with open("mon-repo-complet.txt") as f:
    code = f.read()  # meme 500K tokens, ca passe

response = client.messages.create(
    model="claude-sonnet-4-6-20260217",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": f"Analyse ce codebase et identifie les failles de securite :\n\n{code}"
    }]
)

Plus besoin de decouper vos documents en chunks ou de faire du RAG pour des volumes raisonnables. Vous balancez tout, Claude se debrouille.

Adaptive Thinking : Claude reflechit quand il faut

L’Adaptive Thinking est le nouveau moteur de raisonnement de Sonnet 4.6. Concretement, le modele decide lui-meme quand une question necessite une reflexion approfondie.

Pour une question simple comme “Quelle est la syntaxe d’un map en Python ?”, Claude repond directement. Pour un probleme de debug complexe, il active son raisonnement etendu automatiquement.

response = client.messages.create(
    model="claude-sonnet-4-6-20260217",
    max_tokens=8000,
    thinking={
        "type": "enabled",
        "budget_tokens": 5000  # budget pour le raisonnement
    },
    messages=[{
        "role": "user",
        "content": "Pourquoi cette query SQL retourne des doublons ?"
    }]
)

# Acces au raisonnement interne
for block in response.content:
    if block.type == "thinking":
        print("Reflexion :", block.thinking)
    elif block.type == "text":
        print("Reponse :", block.text)

Le resultat : des reponses plus justes sur les problemes complexes, sans ralentir les reponses simples.

Web Search ameliore

Sonnet 4.6 integre un Dynamic Filtering pour la recherche web : le modele execute du code en interne pour verifier les faits en temps reel. Moins d’hallucinations, plus de fiabilite.

Le tier gratuit s’enrichit

Bonne nouvelle pour ceux qui n’ont pas d’abonnement. Le tier gratuit de Claude inclut maintenant :

Creation de fichiers (artefacts)
Connecteurs (Google Drive, etc.)
Skills (templates de prompts)
Compaction (conversations longues)

Des fonctionnalites qui etaient reservees aux abonnes Pro il y a encore quelques semaines.

Quel modele choisir ?

Voici mon guide rapide :

Besoin	Modele recommande
Usage quotidien, chat, code simple	Sonnet 4.6 (gratuit)
Code complexe, gros projets	Sonnet 4.6 (Pro, avec thinking)
Taches critiques, multi-agent	Opus 4.6 (Pro/Max)
Prototypage rapide, scripts	Haiku 4.5 (le plus rapide)

Pour 90% des developpeurs, Sonnet 4.6 suffit largement. Opus 4.6 se justifie pour les projets complexes ou le multi-agent (Agent Teams).

Ce qu’il faut retenir

Sonnet 4.6, c’est un modele flagship deguise en modele mid-tier. 1M de tokens, Adaptive Thinking, performances proches d’Opus — le tout a $3/$15.

Anthropic democratise l’acces a l’IA de pointe, et c’est une excellente nouvelle pour les developpeurs.

Sonnet 4.6 est disponible des maintenant sur claude.ai, l’API Anthropic et Claude Code.