Métriques d'efficacité
J'ai analysé les historiques complets de mes sessions Claude Code sur 6 mois, de novembre 2025 à avril 2026. 10 629 sessions, 48 projets, des ratios qui racontent une histoire claire sur ce qui fonctionne et ce qui ne fonctionne pas.
Vue d'ensemble
Ces chiffres proviennent de l'analyse du fichier history.jsonl de Claude Code, croisée avec les historiques git de chaque projet. La métrique centrale est le ratio sessions/commits : combien de sessions Claude Code sont nécessaires pour produire un commit intégré. Plus le ratio est bas, plus le travail est efficace.
Ratio sessions/commits par projet
Le ratio sessions/commits est mon indicateur principal. Il mesure combien de sessions Claude Code aboutissent à un commit intégré dans le dépôt. Un ratio de 1:1 signifie que chaque session produit un commit. Un ratio de 94:1 signifie qu'il faut 94 sessions pour un commit.
| Projet | Sessions | Commits | Ratio | Efficacité |
|---|---|---|---|---|
| granit-golem | 622 | 552 | 1.1:1 | Excellent |
| comrenov | 635 | 269 | 2.4:1 | Bon |
| tordu-jardin | 416 | 134 | 3.1:1 | Bon |
| cloud | 831 | 159 | 5.2:1 | OK (IaC) |
| sioule (total) | 908 | — | — | Actif |
| siliceum-website | 1 364 | 83 | 16:1 | Mauvais |
| sioule-2 | 1 416 | ~15 | 94:1 | Échec |
Corrélation CLAUDE.md et efficacité
J'ai croisé la taille du fichier CLAUDE.md de chaque projet avec son ratio sessions/commits. La corrélation est nette : plus le CLAUDE.md est détaillé, meilleur est le ratio.
CLAUDE.md le plus complet de mon lab. Le ratio est quasi parfait.
Ratio acceptable pour de l'IaC, CLAUDE.md de taille moyenne.
Bon ratio avec un CLAUDE.md modeste mais ciblé.
Pas de CLAUDE.md mais ratio correct. Projet petit et simple.
Aucun CLAUDE.md. Itérations design sans fin, sessions exploratoires perdues.
Répartition par domaine
J'ai classé mes 10 629 sessions par domaine d'activité pour comprendre où je passe mon temps avec Claude Code.
Le poste "Sites web / design" à 23% est disproportionné par rapport à sa valeur produite. C'est le domaine où le ratio sessions/commits est le pire, siliceum-website est à 16:1. Les itérations visuelles avec Claude Code sont coûteuses en sessions car elles impliquent beaucoup de va-et-vient. À l'inverse, les projets clients concentrent le meilleur rapport effort/résultat.
Évolution dans le temps
La croissance de mon usage de Claude Code sur 6 mois :
* Avril 2026 : mois en cours, 15 jours. La croissance entre novembre et mars est de x22. Mars représente à lui seul 50% du volume total. C'est le mois où j'ai déployé Claude Code sur l'ensemble de mes projets actifs.
Impact des agents spécialisés
Les projets qui utilisent des agents Claude Code spécialisés (via les fichiers .claude/agents/) obtiennent de meilleurs ratios que les autres. Voici la comparaison directe :
Avec agents
Sans agents
Couverture de tests
La couverture de tests est un indicateur complémentaire. Les projets avec la meilleure couverture sont aussi ceux où Claude Code est le plus efficace, parce que les tests servent de filet de sécurité pour valider le code généré.
Mutation kill rate ≥70%. Tests de propriétés Rust. Couverture réelle plus haute que le chiffre brut.
Couverture en progression. Objectif 65% au prochain trimestre.
Gate CI à 35%. Le minimum pour empêcher les régressions en production.
Indicateurs clés
Après 6 mois d'analyse, voici les indicateurs que je recommande de suivre et les cibles à viser :
Quasi chaque session produit du code intégré. CLAUDE.md mature, agents en place.
Ratio normal pour un projet en développement actif. Marge d'amélioration via CLAUDE.md.
Trop de sessions exploratoires. Revoir la documentation projet et la structuration.
L'IA tourne en boucle. Problème de fond : code legacy, absence de tests, manque de specs.
Checklist de suivi
Ratio sessions/commits
Indicateur principal. Cible < 3:1 sur les projets matures. Mesurer chaque mois pour détecter les dérives.
Taille du CLAUDE.md
Corrélé directement avec le ratio. Viser 100+ lignes sur les projets complexes. 757 lignes sur granit-golem.
Nombre d'agents
Les projets avec agents spécialisés ont de meilleurs ratios. Commencer par un agent review, puis test, puis refactor.
Couverture de tests
Les tests sont le filet de sécurité de l'IA. Sans eux, on ne peut pas valider le code généré et le ratio explose.