CVE-Bench: IA solo explota 13% de vulnerabilidades reales
¿Qué es CVE-Bench y por qué debería importarte como founder?CVE-Bench es el primer benchmark que evalúa agentes de IA en condiciones reales de ciberseguridad, usando 40 vulnerabilidades críticas (CVEs) de aplicaciones web existentes. Desarrollado por el UIUC Kang Lab y presentado en ICML 2025, este framework revela algo que pocos están discutiendo: incluso los modelos …









