N-Day-Bench: LLMs vs vulnerabilidades reales en código
¿Pueden los LLMs encontrar vulnerabilidades reales en código de producción?Los mejores modelos de lenguaje del mundo solo logran identificar y parchear entre el 18% y el 34% de las vulnerabilidades reales en repositorios de producción, según los benchmarks más rigurosos publicados en 2025 y 2026. Para cualquier founder que esté integrando IA en su stack …









