El Ecosistema Startup > Blog > Actualidad Startup > Relvy AI: runbooks on-call automatizados con IA

Relvy AI: runbooks on-call automatizados con IA

El problema real del on-call en startups tecnológicas

Si has liderado un equipo de ingeniería, sabes exactamente lo que significa esa alerta a las 2 a.m.: un ingeniero de guardia que empieza a revisar logs manualmente, busca el runbook correcto en una wiki desactualizada y pierde minutos valiosos mientras el sistema está caído. Este escenario —repetitivo, costoso y desgastante— es el que Relvy AI, startup del batch Fall 2024 de Y Combinator, vino a eliminar.

El MTTR (Mean Time to Resolution), o tiempo medio de resolución de incidentes, es una de las métricas más críticas para cualquier equipo de producto. Cada minuto de inactividad tiene un costo directo en revenue, reputación y energía del equipo. Y aun así, la mayoría de las organizaciones siguen resolviendo incidentes de la misma manera que hace diez años: manualmente, con runbooks estáticos y diagnósticos a ciegas.

Qué es Relvy AI y cómo funciona

Relvy AI es una plataforma que automatiza la ejecución de runbooks de respuesta a incidentes usando inteligencia artificial. Su enfoque central son los debugging notebooks potenciados por IA: documentos ejecutables que combinan consultas de telemetría, visualizaciones, análisis de código y pasos de remediación en un solo lugar colaborativo.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

El sistema funciona de forma continua: se conecta a tu stack de observabilidad para monitorear logs, métricas, trazas y eventos las 24 horas del día, los 7 días de la semana, detectando anomalías sin necesidad de configurar alertas manualmente. Cuando detecta un problema, genera automáticamente un notebook listo para revisar, pre-cargado con consultas relevantes, insights, visualizaciones y los próximos pasos recomendados.

Análisis de telemetría y código: la capa inteligente

Lo que diferencia a Relvy de una simple herramienta de alertas es su capacidad para correlacionar múltiples fuentes de datos simultáneamente. La IA analiza:

  • Logs y métricas del stack de observabilidad existente.
  • Commits de código recientes para correlacionar despliegues con incidentes.
  • Historial de incidentes anteriores para detección de patrones y deduplicación de ruido.

Según datos de la propia compañía, Relvy resuelve de forma autónoma más del 70% de las alertas sin intervención humana, capturando todos los pasos del proceso para revisión posterior y mejorando con el tiempo gracias al aprendizaje histórico.

Un modelo de lenguaje propio para debugging

Un detalle técnico relevante para equipos que evalúan costos de IA: Relvy ha desarrollado un modelo de lenguaje propio (small language model) optimizado específicamente para debugging de producción. Según la empresa, este modelo iguala el rendimiento de GPT-4o en tareas de diagnóstico de incidentes, pero a una fracción del costo —lo que lo hace viable para monitoreo continuo sin disparar la factura de APIs.

Características principales de Relvy

Runbooks ejecutables en Markdown

Relvy permite centralizar los runbooks del equipo en formato Markdown ejecutable. Esto significa que los procedimientos no son solo documentación pasiva: se pueden importar runbooks existentes, mantenerlos con asistencia de IA y ejecutarlos directamente durante un incidente. Cada ejecución genera su propia visualización colaborativa, creando un registro auditado de la respuesta.

Detección autónoma de causa raíz

Una de las funcionalidades más valoradas por equipos de on-call es la detección automática de root cause. Sin necesidad de definir métricas específicas ni configurar alertas complejas, Relvy detecta y diagnostica problemas de producción en menos de 5 minutos desde la configuración inicial. El equipo puede también guiar o corregir el análisis de la IA mediante consultas de seguimiento en lenguaje natural.

Integración con Slack y herramientas existentes

Relvy se integra directamente con Slack para depurar alertas de on-call en los canales donde ya trabaja el equipo. Además, ofrece conectores personalizados para integrarse con infraestructura interna, APIs propietarias y cualquier proveedor de telemetría del stack existente. La promesa es clara: no obligarte a cambiar tu stack, sino amplificarlo con IA.

Fundadores y respaldo de Y Combinator

Relvy fue fundada por Bharath Bhat y Simranjit Singh, ambos con experiencia en ingeniería de infraestructura y operaciones a escala. La startup forma parte del batch Fall 2024 de Y Combinator, el programa de aceleración más reconocido del mundo para startups tecnológicas en etapa temprana, lo que respalda tanto la calidad técnica del equipo como la validación del problema que abordan.

Casos de uso concretos para startups tech

Relvy es especialmente relevante para startups en etapas de crecimiento donde el equipo de ingeniería es pequeño pero el producto ya está en producción con usuarios reales. Algunos escenarios donde aporta valor inmediato:

  • Equipos sin SRE dedicado: Relvy actúa como un primer respondiente automatizado, reduciendo la carga sobre ingenieros de producto que hacen on-call rotativo.
  • Post-deployment monitoring: Correlaciona automáticamente nuevos deploys con degradaciones en métricas de salud del sistema.
  • Gestión de alertas en Slack: Elimina el ruido de alertas sin contexto y entrega diagnósticos accionables directamente en el canal.
  • Estandarización de respuesta: Unifica cómo el equipo responde a cada tipo de incidente mediante runbooks ejecutables, reduciendo la dependencia del conocimiento tribal.

Por qué importa esto para el ecosistema LATAM

En el ecosistema de startups latinoamericanas, donde los equipos de ingeniería suelen ser lean y los presupuestos de infraestructura están optimizados al máximo, herramientas como Relvy representan una ventaja competitiva real. Automatizar la primera línea de respuesta a incidentes no es un lujo de grandes empresas: es una necesidad operacional para cualquier startup que tenga usuarios que dependen de su producto 24/7.

La combinación de IA con runbooks ejecutables, observabilidad continua y detección autónoma de root cause pone en manos de equipos pequeños capacidades que antes requerían un equipo dedicado de SRE o plataformas enterprise costosas.

Conclusión

Relvy AI es una propuesta concreta para uno de los dolores más persistentes de los equipos de ingeniería: la respuesta manual e ineficiente a incidentes de producción. Con su enfoque en runbooks ejecutables, análisis autónomo de telemetría y código, e integración nativa con Slack, la startup del batch YC F24 apunta a convertirse en una pieza clave del stack de operaciones de cualquier empresa tech en crecimiento.

Si tu equipo todavía resuelve incidentes revisando logs a mano o buscando runbooks desactualizados en una wiki, vale la pena explorar cómo la automatización inteligente puede devolverte tiempo de ingeniería para lo que realmente importa: construir producto.

Descubre cómo otros founders implementan IA y automatizacion en sus operaciones criticas. Unete gratis a la comunidad de Ecosistema Startup.

Unirme gratis

Fuentes

  1. https://www.relvy.ai (fuente original)
  2. https://www.ycombinator.com/companies/relvy-ai (fuente adicional)
  3. https://www.f6s.com/software/relvy (fuente adicional)
¿te gustó o sirvió lo que leíste?, Por favor, comparte.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

Daily Shot: Tu ventaja táctica

Lo que pasó en las últimas 24 horas, resumido para que tú no tengas que filtrarlo.

Suscríbete para recibir cada mañana la curaduría definitiva del ecosistema startup e inversionista. Sin ruido ni rodeos, solo la información estratégica que necesitas para avanzar:

  • Venture Capital & Inversiones: Rondas, fondos y movimientos de capital.
  • IA & Tecnología: Tendencias, Web3 y herramientas de automatización.
  • Modelos de Negocio: Actualidad en SaaS, Fintech y Cripto.
  • Propósito: Erradicar el estancamiento informativo dándote claridad desde tu primer café.

📡 El Daily Shot Startupero

Noticias del ecosistema startup en 2 minutos. Gratis, cada día hábil.


Share to...