LLMs en programacion: ¿mejora real o solo benchmarks?
El benchmark que está cambiando la conversación sobre los LLMsDurante meses, la narrativa dominante fue que los modelos de lenguaje grande (LLMs) mejoraban semana tras semana en tareas de programación. Los leaderboards subían, los comunicados de prensa prometían modelos más capaces, y el ecosistema tech celebraba cada décima de punto porcentual como un hito. Pero …









