¿Por qué es tan difícil pedirle a la IA que construya scrapers?
Skyvern, una innovadora herramienta de código abierto, acaba de dar un paso revolucionario al permitir que la IA escriba y mantenga su propio código de automatización, logrando que el proceso sea 2.7 veces más económico y 2.3 veces más rápido que los métodos tradicionales.
La automatización del navegador web siempre ha sido un desafío complejo, incluso para desarrolladores experimentados. Los principales obstáculos incluyen:
- Requisitos ambiguos que incluso los humanos tienen dificultad para definir claramente
- La naturaleza caótica de internet, con elementos web que no siempre son lo que parecen
La solución: Modelos de razonamiento
El gran avance de Skyvern llegó a través de la implementación de modelos de razonamiento que proveen dos capacidades críticas:
- Mejora significativa en la precisión del agente para uso en producción
- Capacidad del agente para generar scripts que se asemejan al código que escribiría un ingeniero humano
Cómo funciona el proceso de dos fases
El sistema opera en dos modos distintos:
1. Modo Exploración
El agente aprende a navegar un sitio web para un flujo específico, generando los metadatos necesarios para futuras ejecuciones. Este proceso inicial es más lento pero fundamental para el aprendizaje.
2. Modo Reproducción
Convierte el aprendizaje en código Playwright determinístico que se ejecuta de manera rápida y económica, recurriendo al agente solo cuando encuentra situaciones nuevas o inusuales.
Beneficios tangibles en producción
Las mejoras son significativas:
- Tiempo de ejecución reducido de 278.95 segundos a 119.92 segundos
- Costo por ejecución reducido de $0.11 a $0.04
- Ejecuciones determinísticas y más confiables
Casos de uso reales
La tecnología ya está siendo implementada en diversos escenarios:
1. Descarga de facturas
Los agentes acceden a portales de proveedores y servicios públicos, navegando automáticamente para extraer facturas de miles de cuentas diferentes.
2. Automatización de compras
Equipos utilizan la herramienta para automatizar compras recurrentes, como renovaciones de licencias de software o suministros mensuales.
3. Extracción de datos legacy
El sistema navega por dashboards autenticados, extrae datos de tablas o PDFs y los estructura en bases de datos mediante webhooks.
4. Formularios gubernamentales
Maneja formularios gubernamentales extensos y complejos, adaptándose automáticamente a cambios en los procesos.
El futuro de la automatización con IA
Skyvern continúa evolucionando con mejoras planificadas:
- Análisis grupal de ejecuciones para generar código más robusto
- Optimización del cacheo de datos para extracciones más eficientes
- Expansión de capacidades a través del SDK para desarrolladores
Conclusión
La automatización web impulsada por IA está entrando en una nueva era donde la inteligencia artificial no solo ejecuta tareas, sino que también genera y mantiene su propio código. Skyvern demuestra que es posible crear sistemas de automatización más inteligentes, adaptables y económicos que pueden revolucionar cómo interactuamos con la web a escala.
Descubre cómo otros founders están implementando automatización IA en sus startups