El Ecosistema Startup > Blog > Actualidad Startup > ARTEMIS: IA aplicada supera el 90% de expertos en pen testing

ARTEMIS: IA aplicada supera el 90% de expertos en pen testing

ARTEMIS: la IA que reta a los profesionales en penetration testing

El reciente estudio liderado por Stanford, Carnegie Mellon y Gray Swan AI marca un hito al comparar, por primera vez en condiciones reales y a gran escala, el desempeño de agentes de IA aplicada frente a profesionales humanos en penetration testing. La estrella fue ARTEMIS, un marco multi-agente diseñado específicamente para detectar y explotar vulnerabilidades en entornos complejos.

Comparativa de desempeño: capacidades y limitaciones

En una red universitaria de más de 8.000 hosts y 12 subredes, ARTEMIS detectó 9 vulnerabilidades válidas con un 82% de precisión, superando al 90% de los especialistas en ciberseguridad —solo el mejor humano encontró más (13). Otros agentes AI incluidos (Codex, CyAgent, Claude Code, Incalmo, MAPTA) lograron entre 4 y 7 hallazgos válidos, por debajo de los humanos promedio.

Entre las fortalezas de ARTEMIS destacan:

  • Enumeración sistemática y explotación en modo paralelo
  • Operatividad sostenida (>10 horas) sin fatiga
  • Bajo costo operativo (18 USD/hora frente a 60 USD/hora humano)

Sin embargo, las IA presentaron debilidades relevantes: mayor tasa de falsos positivos y dificultades ante tareas basadas en GUIs, donde el criterio y creatividad humana siguen siendo superiores.

Implicancias para startups de tecnología y ciberseguridad

Para fundadores que buscan escalar la seguridad de sus productos, este avance supone un punto de inflexión: los agentes AI pueden sistematizar grandes superficies de ataque a bajo costo, pero el expertise humano sigue siendo necesario para validar resultados y cubrir tareas complejas. El futuro de la automatización en ciberseguridad será híbrido, combinando la velocidad y escala de la IA con la intuición y adaptabilidad de equipos humanos.

El código y los artefactos de la competencia han sido liberados como open-source para fortalecer estándares de evaluación realista y fomentar la colaboración en la comunidad.

Conclusión

La integración de IA aplicada en penetration testing real ya no es ciencia ficción: ARTEMIS muestra que es viable y productivo, aunque con matices importantes en cuanto a supervisión y ajuste humano. Para startups y equipos de ciberseguridad en LATAM, se abre una oportunidad para experimentar, colaborar y acelerar la madurez en automatización de seguridad.

Descubre cómo otros founders implementan estas soluciones…

Conectar ahora

Fuentes

  1. https://arxiv.org/abs/2512.09882 (fuente original)
  2. https://www.grayswan.ai/news/conducting-the-first-live-enterprise-comparison-between-agents-and-human-professionals (fuente adicional)
  3. https://cyberpress.org/artemis-ai-agent-outperforms-90-of-human-penetration-testers-in-vulnerability-detection/ (fuente adicional)
  4. https://versprite.com/blog/ai-agents-vs-humans-in-penetration-testing-insights-from-the-artemis-study-and-risks-of-over-reliance/ (fuente adicional)
¿te gustó o sirvió lo que leíste?, Por favor, comparte.

Daily Shot: Tu ventaja táctica

Lo que pasó en las últimas 24 horas, resumido para que tú no tengas que filtrarlo.

Suscríbete para recibir cada mañana la curaduría definitiva del ecosistema startup e inversionista. Sin ruido ni rodeos, solo la información estratégica que necesitas para avanzar:

  • Venture Capital & Inversiones: Rondas, fondos y movimientos de capital.
  • IA & Tecnología: Tendencias, Web3 y herramientas de automatización.
  • Modelos de Negocio: Actualidad en SaaS, Fintech y Cripto.
  • Propósito: Erradicar el estancamiento informativo dándote claridad desde tu primer café.

Share to...