Cognition AI lanza FrontierCode: nuevo benchmark de código
¿Qué es FrontierCode y por qué cambia las reglas del juego? Cognition AI acaba de presentar FrontierCode, un nuevo benchmark diseñado para medir la capacidad real de los modelos de IA para escribir código apto para producción. A diferencia de evaluaciones anteriores que solo verifican si el código funciona, FrontierCode evalúa la fusionabilidad (mergeability) del …









