Anthropic vient de frapper fort : Claude Sonnet 4.6 est desormais le modele par defaut pour tous les utilisateurs, y compris le tier gratuit. Et ses specs ont de quoi surprendre.
Les chiffres qui parlent
| Benchmark | Sonnet 4.6 | Opus 4.6 |
|---|---|---|
| SWE-bench Verified | 79.6% | ~82% |
| OSWorld | 72.5% | ~75% |
| Prix (input/output) | $3 / $15 | $15 / $75 |
Sonnet 4.6 rivalise avec Opus au cinquieme du prix. Pour la majorite des cas dâusage, câest le sweet spot ideal.
1 million de tokens de contexte
Câest la headline : Sonnet 4.6 peut ingerer jusquâa 1 million de tokens en une seule requete (beta).
Pour donner un ordre de grandeur :
- 1M tokens â 750 000 mots â 10 romans
- Un repo moyen (50 fichiers) tient largement dans le contexte
- Une documentation technique complete ? Ca passe aussi
import anthropic
client = anthropic.Anthropic()
# Vous pouvez envoyer un repo entier dans le contexte
with open("mon-repo-complet.txt") as f:
code = f.read() # meme 500K tokens, ca passe
response = client.messages.create(
model="claude-sonnet-4-6-20260217",
max_tokens=4096,
messages=[{
"role": "user",
"content": f"Analyse ce codebase et identifie les failles de securite :\n\n{code}"
}]
)
Plus besoin de decouper vos documents en chunks ou de faire du RAG pour des volumes raisonnables. Vous balancez tout, Claude se debrouille.
Adaptive Thinking : Claude reflechit quand il faut
LâAdaptive Thinking est le nouveau moteur de raisonnement de Sonnet 4.6. Concretement, le modele decide lui-meme quand une question necessite une reflexion approfondie.
Pour une question simple comme âQuelle est la syntaxe dâun map en Python ?â, Claude repond directement. Pour un probleme de debug complexe, il active son raisonnement etendu automatiquement.
response = client.messages.create(
model="claude-sonnet-4-6-20260217",
max_tokens=8000,
thinking={
"type": "enabled",
"budget_tokens": 5000 # budget pour le raisonnement
},
messages=[{
"role": "user",
"content": "Pourquoi cette query SQL retourne des doublons ?"
}]
)
# Acces au raisonnement interne
for block in response.content:
if block.type == "thinking":
print("Reflexion :", block.thinking)
elif block.type == "text":
print("Reponse :", block.text)
Le resultat : des reponses plus justes sur les problemes complexes, sans ralentir les reponses simples.
Web Search ameliore
Sonnet 4.6 integre un Dynamic Filtering pour la recherche web : le modele execute du code en interne pour verifier les faits en temps reel. Moins dâhallucinations, plus de fiabilite.
Le tier gratuit sâenrichit
Bonne nouvelle pour ceux qui nâont pas dâabonnement. Le tier gratuit de Claude inclut maintenant :
- Creation de fichiers (artefacts)
- Connecteurs (Google Drive, etc.)
- Skills (templates de prompts)
- Compaction (conversations longues)
Des fonctionnalites qui etaient reservees aux abonnes Pro il y a encore quelques semaines.
Quel modele choisir ?
Voici mon guide rapide :
| Besoin | Modele recommande |
|---|---|
| Usage quotidien, chat, code simple | Sonnet 4.6 (gratuit) |
| Code complexe, gros projets | Sonnet 4.6 (Pro, avec thinking) |
| Taches critiques, multi-agent | Opus 4.6 (Pro/Max) |
| Prototypage rapide, scripts | Haiku 4.5 (le plus rapide) |
Pour 90% des developpeurs, Sonnet 4.6 suffit largement. Opus 4.6 se justifie pour les projets complexes ou le multi-agent (Agent Teams).
Ce quâil faut retenir
Sonnet 4.6, câest un modele flagship deguise en modele mid-tier. 1M de tokens, Adaptive Thinking, performances proches dâOpus â le tout a $3/$15.
Anthropic democratise lâacces a lâIA de pointe, et câest une excellente nouvelle pour les developpeurs.
Sonnet 4.6 est disponible des maintenant sur claude.ai, lâAPI Anthropic et Claude Code.