La loi de Goodhart et les grands modèles de langage : quand l’IA apprend à réussir l’examen plutôt qu’à maîtriser la matière
Lorsqu’une mesure devient un objectif, elle cesse d’être une bonne mesure. Les LLM sont désormais la démonstration la plus coûteuse de ce principe, affichant des scores de plus en plus élevés sur les benchmarks tout en contournant les métriques qu’ils sont censés satisfaire.
Intelligence artificielle Intemporel