La IA aplicada ya resuelve tareas largas: Opus 4.5 y startups
El desafío de medir la capacidad de IA en tareas largasEvaluar la capacidad de los modelos de IA para completar tareas largas es un reto fundamental para quienes buscan aplicar esta tecnología en startups. El reciente análisis de METR utiliza una métrica innovadora: mide cuánto se acercan los modelos de IA actuales al rendimiento humano …









