Panne du samedi 29 Octobre MAJ x9

le Dimanche 30 Octobre 2011

Nous avons subi une longue interruption de service. La panne a débuté à 19h45, les sites ont été remontés vers minuit. Nous sommes intervenus dès 19h50, mais la panne était assez grave. 

Nous avons perdu notre serveur de fichier central. Ce genre de machine est très fiable mais en cas de problème, elle est très compliquée à relancer : le reboot peut prendre plusieurs heures.

Nous ne sommes pas arrivés à relancer le serveur de fichier. Aussi, nous avons dû utiliser le serveur de fichier situé dans un autre data center en secours. Cette machine en BackUp nous sert à remonter l'architecture de WMaker en cas de grave problème.
 
Depuis début octobre, nous mettons en place une toute nouvelle architecture, les travaux seront finalisés fin novembre. Cela aurait réduit considérablement la probabilité de ce genre de panne et le temps d'indisponibilité...
 
Nous sommes désolé pour cette interruption de service, pour l'instant on se concentre sur la remise en route des +900 services de l'architecture et notamment les services de mail. 

(Maj 1) 30/10 à 4 h 00 : Le service Mail est ok.

(Maj 2) 30/10 à 6 h 00 : Certains sites n'étaient pas accessibles par leur nom de domaine DNS : problème fixé. 30/10 à 6 h 00.

(Maj 3) 30/10 à 12 h 20 : Nous avons réglé depuis ce matin plusieurs disfonctionnements.

Cette nuit :
Le principal problème que nous rencontrons actuellement c'est les VIDEO. 
Nous sommes intervenu dans la nuit dans le DataCenter de DC1 afin de redémarrer physiquement le serveur de fichier Video cela n'a pas fonctionné. Nous avons basculé sur un serveur de secours situé dans un autre DataCenter à Roubaix.

Actuellement  :
 
Il y a encore pas mal de problème sur les Videos notamment :
 
Upload Video / Photo -> service indisponible
Encodage Video -> service indisponible
Lecture des video -> lenteur épisodique 
 
On a planifier une autre intervention sur le DataCenter de DC1 dans l'après midi,  en attendant on essaie de trouver des solutions softs.

(Maj 4) 30/10 à 14 H 00 

Uplaod des Photos est Ok

(Maj 5) 30/10 à 16 H 00 

Quasiment tous le service à la normale nous avons redémarrer le Serveur fichier principal.
Nous allons essayer de mettre en service. 

(Maj 6) 30/10 à 17 h 40 

La tentative a avorté, ce qui à causé une interruption de back 30 min, revient à notre état initial mais toujours impossible d'envoyer des vidéos.

(Maj 7) 30/10 à 21 h 00 

Nous avons remonté un maximum de services.
Mais on ne peut toujours pas uploader de vidéo.
Demain matin une équipe prend la relève et réglera le problème de ce serveur de fichier avec l'aide OVH.

(Maj 8) 31/10 à 10 h 00

Nous avons profité de la nuit pour déplacer nos backups sur le nouveau serveur de fichier.
Ce serveur devait entrer en service la semaine prochaine.
Nous allons l'utiliser pour relancer les services. 

Nous pensons avoir stabilisé d'ici le début d'après midi.

(Maj 9) 31/10 à 17 h 00

Nous avons mis au point une technique sur le papier. Elle devrait nous permettre de reprendre la main sur le serveur de fichier central. On vient de commencer si cela réussis vous pourrez uploader à nouveau des videos,
en fin de soirée ou demain matin.

 



Sébastien Simoni
Fondateur de WMaker et du CampusPlex En savoir plus sur cet auteur


Vos commentaires
Du plus récent au plus ancien | Du plus ancien au plus récent

28.Posté par Emotions Tv le 31/10/2011 16:13 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour à toute l’équipe de WMAKER,

Juste pour vous soutenir dans cette galère.
Bon courage à vous tous !
Serge

27.Posté par Nathalie MONTELLE le 31/10/2011 16:13 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Je participe à un salon du numérique du 03 au 05 novembre pour faire la présentation de notre site, j'espère donc sincèrement que tous les problèmes seront réglés d'ici là! ( on a tous nos préoccupations...) Pour ma part, je vous demande simplement de ne pas choisir de couper les services la nuit chez vous, car ici à Tahiti, c'est la journée...et nous ne sommes pas en période de vacances.
En tous les cas, bon courage à toute l'équipe, et merci pour votre engagement et votre implication,
Nathalie

26.Posté par Rangement le 31/10/2011 13:38 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
On sort toujours plus fort d'une crise et vous l'avez gérée rapidement et le plus efficacement possible.
Je suis confiant sur le fait que vous saurez tirer les conséquences de cet incident.

Cela fait plaisir de voir que la majorité de vos clients vous soutiennent.
Quant à vos quelques clients qui râlent, je leur propose 3 réflexions :
1- nous sommes en période de vacances scolaires + pont, donc le trafic est plus faible que d'habitude
2- quand l'accès de vos serveurs OVH lâche, vous êtes indemnisés vous ? Pas moi !
3- qui ne fait pas d'erreur ne progresse pas. Vous êtes parfaits vous ?

Bon courage à l'équipe et merci pour le boulot réalisé ces dernières heures.

25.Posté par Yann le 31/10/2011 11:22 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Décidément cette V5.............. Bon courage à toute l'équipe

Salutations

Yann

24.Posté par chris halusiak le 31/10/2011 11:18 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour,
Après un WE d'absence pendant lequel je ne suis pas allée sur le back-office (je dirais "heureusement pour moi"), je constate effectivement les dégâts au niveau des pages vues et de nos revenus publicitaires des derniers jours. Nous sommes contrariés par les problèmes récurrents rencontrés presque depuis la mise en route de la V5. Nous imaginons le stress qui doit régner dans vos équipes et nous vous souhaitons une prompte sortie de crise.
Cordialement,

23.Posté par Flam696 le 30/10/2011 23:43 (depuis mobile) | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Courage...et pensez à vous reposer quand même... le moment venu... ;-)

22.Posté par Sébastien Simoni le 30/10/2011 22:35 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Les vidéos sont relancées sur les WebTV.
Les 4 serveurs Video des sont en service.
Elles ne sont pas très rapides au démarrage en revanche.

Mais nous réalisons des restaurations qui utilisent beaucoup de bande passante. C'est peut être la raison.
Et surtout il semble que OVH nous fourni pas la connexion 1 Gb/s entre nos 2 data center en ce moment....

21.Posté par Sébastien Simoni le 30/10/2011 21:11 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@Pilâtre c'est notre soucis numéro 1 on va régler ça demain. Je ferai un post demain en vous proposant des compensations commerciales.

20.Posté par Sébastien Simoni le 30/10/2011 21:09 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@Hervé, il s'agit des mail en pop. Le webmail n'est pas accessible. Non les mails ne sont pas perdus
Merci


19.Posté par Pilâtre le 30/10/2011 20:01 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
De mon côté plus d'affichage des vidéos sur la webtv, ce qui est pas très sérieux pour une webtv ;-)
J'espère que le problème se réglera au plus vite.
Courage

18.Posté par Hervé Le Tellier le 30/10/2011 19:50 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Pour ma part, depuis plus de 24 heures, je ne reçois plus un seul mail et le site http://webmail.wmaker.net/ est totalement inaccessible, donc je ne comprends pas le "(Maj 1) 30/10 à 4 h 00 : Le service Mail est ok." J'espère qu'aucun ne sera perdu.
Bonne chance.
Hervé

17.Posté par Essaadi tarik le 30/10/2011 19:31 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bon courage ...

16.Posté par Sébastien Simoni le 30/10/2011 19:18 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Ca fait bientôt 24 h que nous sommes devant nos écrans.
On commence vraiment à être fatigué ... tant qu'on arrive à avancer on continu.

Demain tôt, on aura du renfort pour terminer de régler les problèmes en suspend.

15.Posté par Sébastien Simoni le 30/10/2011 18:53 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Les articles étaient modérés, je viens de publier tous les commentaires.

14.Posté par Pierre MARTIAL le 30/10/2011 17:07 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour,

A cet instant, dimanche 30 octobre 17heures, nous n'avons toujours pas pu entrer sur les back office de nos différents sites internet dont notre site d'actu www.aungsansuukyi.fr
Ce qui est dur dur pour nous.
Par contre, l'accès public au site est bon.
Tenez-nous informés et bon courage à vous! On est avec vous de tout coeur!
Pierre MARTIAL

13.Posté par ve le 30/10/2011 15:58 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
pour info, si les sites son accessibles, les admin ne le sont toujours pas !!!!

12.Posté par marie-helene caillol le 30/10/2011 12:44 (depuis mobile) | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour, notre site est toujours inaccessible ce jour à 12.30. Quand ce probléme sera-t-il résolu? merci et bon courage. cordialement MH Caillol

11.Posté par Blain Kiné Formations le 30/10/2011 12:18 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour,
dure panne apparemment. Pour ma part, mes sites ne sont pas repartis. Bon courage

10.Posté par Prospert YAKA le 30/10/2011 12:09 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
L'homme créa la machine et la machine trahit l'homme. Nous vous faisons confiance et beaucoup de courage.

9.Posté par Eduardo le 30/10/2011 11:31 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
BJ, alors, pouvons nous dire que la situation est déjà normalisé? encore il y a quelques choses qui ne marchent pas bien: par exemple, les images de social bookmarkd au pied du page ou les bottons d'actions...
merci


1 2 3