Resumen
El 17 de julio de 2024, a las 5:50 a. m. UTC, se realizó una acción de mantenimiento programada en la instancia principal de la base de datos de Degreed en la región de EE. UU. en Azure. Durante este mantenimiento, la base de datos no se recuperó como se esperaba, lo que provocó un tiempo de espera al intentar acceder a la plataforma de Degreed. El sistema se restauró por completo y volvió a estar operativo a las 10:28 a. m. UTC.
Causa raíz
Nuestro equipo de Ingeniería recibió una alerta sobre un aumento en los tiempos de respuesta debido al mantenimiento aplicado con Microsoft Azure. Una vez que se identificó, el equipo de Ingeniería derivó con prontitud el problema internamente en el Soporte de Microsoft. Para restaurar los servicios rápidamente, Degreed inició una conmutación por error a nuestra región secundaria a las 10:22 a. m. UTC. El sistema principal de Degreed se recuperó correctamente poco después a las 10:28 a. m. UTC.
Planes de mejora y prevención
Para abordar esto en el futuro, el equipo de Ingeniería actualizó los procesos en cuanto al manejo de casos de conmutación por error para garantizar una recuperación más rápida en el futuro.
Actualmente, estamos a la espera de una actualización de Microsoft y esperamos recibir un análisis de causa raíz (RCA) formal en los próximos días. Una vez que este RCA esté disponible, proporcionaremos una actualización.
Lamentamos las molestias que esto pueda haberte ocasionado y agradecemos tu comprensión a medida que trabajamos continuamente para mejorar la confiabilidad y el rendimiento de nuestros sistemas.