Automatización de cadenas de herramientas SRE con Delphix y AppDynamics

Lea sobre cómo nuestra solución de integración con AppDynamics permite que los equipos empresariales reproduzcan problemas relacionados con los datos, realicen análisis de causa raíz, desarrollen y prueben soluciones y acorten drásticamente el tiempo para restaurar los servicios.

Los cortes de energía siguen siendo una amenaza aterradora para las empresas en la actualidad. Según Gartner, el costo promedio de un minuto de inactividad del sistema es de USD 5.600, que se extrapola a mucho más de USD 300.000 por hora.

Hoy en día, las empresas gastan millones en planes cada año sin abordar los problemas subyacentes en juego, es decir, una infraestructura de datos ineficaz que expone a la empresa a tiempos de inactividad y a posibles pérdidas de datos. Manejar rápidamente los cortes de energía requiere la capacidad de recrear un estado específico del entorno de la aplicación, incluidos los datos subyacentes. Esto se convierte en un gran reto, sobre todo cuando se trata de sistemas complejos e integrados.

Las empresas necesitan un proceso de creación de entornos de análisis de causa raíz (RCA) más rápido y completo que ayude a reducir el MTTR para aplicaciones de misión crítica.

Es por eso que nos hemos asociado con AppDynamics, una plataforma de observabilidad de desarrollo completo centrada en los negocios y que ayuda a las organizaciones a abordar rápidamente problemas críticos en la producción, a través de su conocimiento de aplicaciones único y capacidades de análisis de negocios.

Una vez que AppDynamics detecta un problema, puede hacer que Delphix aprovisione automáticamente las bases de datos correctas para la aplicación afectada a partir del momento adecuado. Con esta nueva solución integrada, los equipos de SRE pueden aprovechar el aprovisionamiento de datos de Delphix en entornos de prueba y CI/CD para ayudar a reproducir problemas, realizar análisis de causa raíz, desarrollar y probar correcciones y acortar drásticamente el tiempo para restaurar los servicios.

HEstos son los beneficios clave que los equipos de software empresarial pueden esperar al usar Delphix con AppDynamics.

Automatización de análisis forense de desarrollo completo

Cuando se detecta un evento de tiempo de inactividad de la producción, un ingeniero de operaciones o un ingeniero de confiabilidad del sitio debe iniciar y completar un proceso manual y prolongado para proporcionar los entornos adecuados de datos listos para resolver el problema:

  • Capturar conjuntos de datos completos, tanto antes como después de un evento

  • Copiar los datos correctos desde el momento adecuado a un entorno RCA

  • Crear un entorno integrado para permitir una revisión forense

Las tecnologías legadas o heredadas muchas veces hacen que sea imposible realizar estas acciones en primer lugar, como obtener datos de un momento específico en el tiempo. Con Delphix, los equipos pueden automatizar todos los elementos de datos de este proceso. El siguiente diagrama de arquitectura muestra cómo AppDynamics y Delphix trabajan juntos para llegar a la causa raíz de un problema.

appdynamics delphix integration

AppDynamics puede registrar un incidente y abrir un ticket en la plataforma de venta de tickets de su elección. El equipo de SRE puede ver los tickets y decidir cuándo generar uno o varios entornos de RCA.

Luego, Delphix aprovecha la información y la orquestación de la topología de la aplicación de AppDynamics para simplificar la creación de entornos de RCA y, en muchos casos, puede aprovechar un flujo de trabajo y herramientas existentes. Ciertos eventos se pueden definir para que se creen entornos de RCA automáticamente (sin necesidad de aprobación) y otros pueden necesitar control humano. Delphix optimiza el almacenamiento y el aprovisionamiento de datos y transforma la tarea que consume tiempo y recursos en un proceso rápido, paralelo y automatizado.

Solución de problemas y resolución de cuestiones de rendimiento de aplicaciones

Nunca es una tarea fácil para los equipos identificar exactamente el problema de rendimiento. Los de SRE terminan creando clones de producción manualmente para ejecutar tipos específicos de pruebas.

Sin embargo, nuestra solución de integración con AppDynamics permite que los equipos de SRE:

  1. Proporcionen entornos de datos de producción a pedido para aislar diferentes tipos de pruebas

  2. Escalen automáticamente los recursos de datos a entornos de solo lectura para mantener un nivel de servicio para los usuarios mientras se investigan posibles problemas

Acelerar la velocidad y precisión de CI/CD

Muchas empresas ya utilizan herramientas como AppDynamics en sus cadenas de herramientas de integración continua y entrega continua (CI/CD) para medir el estado anterior y posterior cuando se implementa una nueva versión. Esto ayuda a los equipos de operaciones y de SRE a comprender la implicación general de rendimiento de las nuevas funciones.

Pero en los casos en que una nueva característica se marca como una fuente potencial de degradación del servicio, a menudo pasan un tiempo insuperable para resolver problemas. Los equipos de desarrollo pasan días, semanas y, a veces, incluso meses esperando que los administradores de bases de datos y el personal de cumplimiento preparen datos nuevos y seguros para realizar pruebas.

Si bien las fallas tecnológicas y el tiempo de inactividad del sistema son inevitables, las empresas necesitan una mejor manera de rastrear la causa de los problemas y acortar el tiempo para resolverlos. El tiempo de inactividad es costoso y conduce a la pérdida de ingresos, oportunidades de captación de clientes perdidos y líneas de producción paralizadas. Los errores de datos, la pérdida de datos y la corrupción de datos también pueden generar los mismos resultados negativos.

Con Delphix y AppDynamics, los equipos empresariales pueden:

  • Utilizar datos enmascarados similares a los de producción y suministrarlos instantáneamente a los desarrolladores para su investigación

  • Asegurarse de que el entorno de prueba sea preciso y esté preparado para cuando el desarrollador esté listo para probar el código de corrección

  • Entregar todas las fuentes de datos en el proceso de CI/CD, incluso para aplicaciones integradas complejas

Pensamientos finales

Un corte de energía de 12 horas en la tienda le costó a Apple USD 25 millones, Delta Airlines perdió aproximadamente USD 150 millones durante un corte de energía de cinco horas que causó 2.000 vuelos cancelados, y Facebook sufrió una pérdida estimada de USD 90 millones debido a un corte de 14 horas. Esos son líderes de la industria, que pueden soportar una tormenta financiera de un día, pero la mayoría de las empresas no tienen la capacidad para administrar y recuperarse de las consecuencias asociadas con el tiempo de inactividad.

Con la infraestructura de datos programable y abierta de Delphix, los equipos de TI pueden entregar datos en cada punto del ciclo de vida de la aplicación, desde el desarrollo hasta las pruebas, el análisis y la ingeniería de confiabilidad de la producción. Nuestra solución de integración con AppDynamics permite que las empresas reproduzcan problemas, realicen análisis de causa raíz, desarrollen y prueben arreglos, acorten drásticamente el tiempo de restauración de servicios, reduciendo virtualmente a cero el tiempo de inactividad de las aplicaciones.

Vea aquí esta demostración para obtener más información.