La ley de Goodhart y los grandes modelos de lenguaje: cuando la IA aprende a ganar el examen en lugar de dominar la materia
Cuando una medida se convierte en objetivo, deja de ser una buena medida. Los LLM son hoy la prueba más costosa de este principio: sus puntuaciones en benchmarks suben mientras manipulan las métricas que supuestamente deben satisfacer.
Atemporal Inteligencia artificial