Interruption de service

Sébastien le Vendredi 24 Mars 2006

WM était acessible de 12h40 jusqu'à 13h40 heure locale. Nous pensions qu'il s'agissait d'une attaque importante de type flood sur nos serveurs.

En fait le serveur SQL principal (base de données) a saturé son espace disque.
Nous avions mis en place il y a 2 semaines un système de Helper, serveurs SQL destinés à prendre le relais du serveur principal pour les requêtes en lecture (90% des requêtes).
Ce type de réplication est très gourmand en espace disque, elle a saturé les disques du serveur principal et a entrainé la chute du serveur.

Cette panne est totalement indépendante de la maintenance de cette nuit. En revanche une partie de l'intervention d'hier conserne justement l'installation de serveurs SQL.

Nous avons développé des outils de contrôle de flotte de serveur justement pour prévenir ce type de problème. Nous aurons finalisé ce tableau de côntrole au cours du mois prochain. Ajouté à l'outil d'administration de flotte que nous testons en ce moment, il nous permettra d'agir de manière préventive sur ce type de problème.

Amicalement,
l'équipe de WM