ingresar
¿Problemas para iniciar? Reiniciar clave
¿Aún no esta registrado?
Sobre los inconvenientes en gaea.duplika.com

El día 2 de Septiembre a las 6:05AM, uno de los discos rígidos que almacena, entre otras cosas, todas las bases de datos de los sitios, comenzó a fallar y decidimos desconectar el servidor para impedir la pérdida de datos. Aquí te explicamos qué sucedió, respondiendo a las preguntas más comunes que se generaron.

Al comenzar a generarse fallas en un disco rígido, el mismo debe ser reemplazado lo antes posible para que la información que contiene con se corrompa.
Si bien intentamos rectificar los problemas que se suscitaron con la prioridad de evitar demoras en los usuarios, esta acción no fue posible, por lo que procedimos a clonar la información del disco que fallaba otro nuevo. La parte buena de este proceso incómodo es que aprovechando la oportunidad para reemplazarlo por un disco rígido SAS, que resultan más estables.

¿Por qué demoraron tanto en solucionar el problema?

Porque, en un principio, intentamos rectificar los errores en el sistema de archivos. Avanzamos hasta casi finalizar la curación, pero la falla del disco provenía de una anomalía en su hardware, por lo que los problemas volvían a generarse. Esto obligó al reemplazo completo.

Para evitar pérdida de datos, tuvimos que utilizar nuestras copias de seguridad en conjunto con métodos de clonación. Al finalizar este proceso, se procedió a la rectificación de cualquier problema en el sistema de archivos.

¿Se ha perdido información debido a este inconveniente?

La desconexión del servidor fue realizada a las 6:05AM (GMT -3:00) por lo que, lamentablemente, es muy probable que todos los correos enviados a las casillas de correo desde ese horario a ese momento hayan sido descartados automáticamente, aunque reenviados a los remitentes con una notificación. No obstante, todos los archivos de su sitio e emails guardados se encuentran intactos. Las bases de datos MySQL fueron completamente restauradas de nuestras copias de seguridad. Si alguno de ustedes detecta algún problema, no duden en enviarnos un ticket de inmediato para revisarlo.

¿Qué medidas han tomado para evitar que esto se repita?

El disco afectado ha sido reemplazado por uno nuevo de una tecnología superior (http://es.wikipedia.org/wiki/Serial_Attached_SCSI). A su vez, tenemos planeado instalar nuevos discos rígidos y configurarlos en RAID 5 (http://es.wikipedia.org/wiki/RAID#RAID_10) para que, en caso de que alguno de los discos falle en el futuro, esto no afecte a la estabilidad del servidor y pueda ser reemplazado sin necesidad de desactivar el servidor.

Por supuesto que todos los clientes afectados tienen derecho a solicitar el crédito correspondiente por nuestra garantía de uptime. Para hacerlo, por favor envíenos un ticket a través de nuestra mesa de clientes y lo aplicaremos de inmediato. A su vez, se le ruega al usuario que aún detecte inconvenientes en su sitio que nos contacte a través de esa vía.

Le pedimos disculpas por las molestias ocasionadas, y cualquier consulta o duda, estamos a su entera disposición.

Dejanos tu comentario