Nos esforzamos por hacer que todos los servicios de SYSCOM estén disponibles y rápidos para usted y su equipo, todo el tiempo, y fallamos la promesa el día de hoy.
El problema ha sido resuelto y ahora estamos centrados en corregir el error que causó la interrupción, así como poner más controles y monitores en su lugar para asegurar que este tipo de problema no vuelva a ocurrir.
Si está interesado en la explicación técnica de lo que ocurrió y cómo se arregló, continue leyendo.
El Viernes trasladamos todos los servicios en línea(SYSCOM.MX) a nuevos servidores en AWS, el sábado lo servicios estuvieron funcionando sin detalles.
El Martes fue un día especial en peticiones al sitio web, el servidor de la base de datos colapsó.
El mismo martes a las 5PM incrementamos la capacidad del servidor de base de datos y las operaciones se restauraron exitosamente, pero tuvimos un detalle en las sesiones.
El Miércoles detectamos este detalle en las sesiones, a las 11AM se logró restaurar el estado para mostrar precios e inventarios correctos en las cuentas afectadas.
Medidas tomadas:
1. Aumentar la capacidad técnica del servidor de base de datos y corregir inmediatamente el detalle en las sesiones.
2. Implementar validaciones y mejores técnicas al actualizar hardware.
3. Adicionar sistema de monitoreo para la base de datos más preciso.