Nouvelle panne électrique du «premier datacenter d'europe»

Jérôme le Dimanche 26 Mars 2006

Un mois après une première panne, le datacenter est à nouveau dans le noir.


Depuis 11h ce matin le datacenter où sont hébergées nos machines à subit de multiples coupures de courant.

Nous sommes en train de remonter nos installations et vous donnerons plus de détails dés que possible.

Voir ce lien : http://travaux.ovh.com/?do=details&id=858

19h20 : la situation chez redbus semble enfin stable, nous réactivons tous les services auxiliaires (mails, stats.. ); les newsletters en attente de départ partent petit à petit.

19h30 : La nouvelle se répand comme une trainée de poudre, il ne fait pas bon être CEO de redbus en ce moment :)  http://www.lapagedujour.com/redbus_nouvel_incident.html

20h00 : OVH (notre fournisseur de traffic) nous informe du devenir de sa collaboration avec le datacenter redbus, il est très remonté et on le comprend. Voir fichier joint de cette note.


message_ovh_panne_redbus.txt message_ovh_panne_redbus.txt  (3.14 Ko)





Vos commentaires

1.Posté par DENIS le 26/03/2006 19:44 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Redbus à vraiment un problème de fourniture d'energy sécurisée !!!
en cas de coupure EDF il devrait d'abord passer sur des stations d'energy type DC/AC incluant un systeme redondant et une capacité suffisante et n'utiliser leur groupes electrogènes qu'en dernier recour ( ces derniers étant beaucoup moins fiable pour vos applications )...maintenant si vous me dite que les batteries des stations d'energy sont à plats !!....affaire à suivre.

2.Posté par rubis2 le 26/03/2006 19:47 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
J'espere que tous sera réglé parce que les sites virutelles bug ...

3.Posté par benjamin le 27/03/2006 10:22 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
c'est une honte ce qu'il s'est passé 1 mois après l'autre panne !
http://www.amenhelp.org

4.Posté par Laurent Michelet le 27/03/2006 12:11 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Et bien dites donc, quel b.... on en parle même sur france 2 !

C'est vrai tout ce qu'il dit le Mr ci-dessous ?

En France il y a de nombreux datacenters, on peut citer Redbus, Telecity, LDcom, Interxion 1 et 2, Global Switch, Telehouse 1 et 2 ....

Pour un hébergeur le datacenter est un élément critique car il gère l'alimentation électrique et le refroidissement (clime). Si un des deux services n'est pas bien assuré c'est la cata.

L'électricité car en cas de panne il y a déjà une coupure de service et surtout les serveurs n'aiment pas du tout redémarrer. Entre les alimes qui grillent , les disques durs qui tombent en panne et aussi les systèmes de fichiers (ext3, reiserfs) qui ne fonctionne plus chaque redémarrage est particulièrement risqué. Le pire est en cas de coupures répétées, la plupart des alimentations type PC classique ou mini-pc ne supportent pas. Le système de fichers non plus car une panne de courant pendant la réparation peut causer des dégats très importants qui prennent des heures à réparer.

Pour le refroidissement l'augmentation de la température de la salle de quelques degrés augmente de façon sensible le taux de pannes des disques et alimentations. (L'an dernier LDcom a eu un incendie dans la salle des climatiseurs, la température des salles d'hébergement est montée à plus de 50 degrés en moins d'une heure.)

Redbus est bien connu des hébergeurs web car c'est le datacenter le moins cher, ils ont racheté Télécity l'an dernier. Chez Redbus on retrouve la plupart des hébergeurs "discount" et beaucoup de n'importe quoi (comme des serveurs sans boitiers, des mini-pcs entassés ....). Redbus est une sorte de poulailler à hébergeurs avec des serveurs en batterie.

Depuis 6 mois un sérieux problème se pose aux hébergeurs et datacenters, c'est la consommation électrique des machines. En général on loue une baie de 42 U avec une puissance électrique de 1 KVA (KVA = 1000 V * A). Or, le moindre dual-xeon récent de DELL consomme à lui seul 2,5 à 3 A (2,5 A => 220 * 2,5 = 0.5 KVA). En gros, on considère que maintenant dans une baie de 1 KVA on peut mettre 10 machines au maximum (4 si c'est du dual-Xeon) et la baie coute au minimum 500 Euro / mois (plus de 1200 Euro / mois si on veut 5 KVA).
Pour les hébergeurs discount notamment en serveur dédié ils sont obligés de remplir les baies au maximum ce qui cause des problèmes de chaleur et d'éléctricité.

Dans le cas de Redbus il y a eu un "manque de chance" mais surtout des erreurs grâves. Par exemple, Internet-FR fait régulièrement des tests sur l'électricité en provoquant des couputes EDF ou autre, ca leur permet de vérifier le bon fonctionnement des onduleurs (roue d'inertie pour eux) et des groupes électrogènes. Chez Redbus il n'y a jamais de tests, la preuve est que pour la première panne un groupe electrogène est tombé en panne, le pire est que il ne fonctionne toujours pas aujourd'hui (cf mail OVH).

Redbus a été victime de ses tarifs agressifs, ils ont récupéré plein d'hébergeurs qui ont consommé plus d'électricité que prévu. Tous comme Telecity et quelques autres datacenters, Redbus perd de l'argent tous les mois et ne peut donc pas facilement investir dans des équipements mieux adapter à leur activité d'hébergeur pour hébergeurs.

Interxion a toujours été bien plus cher que Redbus, il y a eu une coupure de courant il y a quelques années mais rien depuis. Aussi, ils peuvent investir dans d'autres datacenters (Interxion 2 est ouvert et le 3 est en projet).

LDcom (9 Telecom) a eu sa coupure de courant il y a quelques semaines, peu après Redbus, c'est arrivé pendant une maintenant prévue et qualifiée comme très risquée. Elle avait été repoussée plusieurs fois.

Global Switch a aussi eu sa coupure de courant il y a quelques années. Ils hébergent très peu d'ISP et préfèrent les grands comptes.

Internet-FR a aussi eu sa dose de coupures il y a plus d'un an, une fois pendant une intervention technique à risque et une fois à cause de travaux réalisés dans un plateau de bureaux du même batiment (un electricien avait relié la masse du datacenter avec la masse du batiment).

En conclusion, l'hébergeur choisi son datacenter en connaissance de cause, ce qui est arrivé à Redbus n'est pas surprenant vu les tarifs et la clientèle. Là ou on peut se poser des questions sur la responsabilité de Redbus c'est sur les 4 coupures de courant (une cinquième est prévu ce lundi).
_________________
Frédéric VANNIÈRE - Planet-Work,
Tel: 0891 024 424
Hébergement mutualisé
Serveurs dédiés


Si c'est le cas... Faut aviser ! ;o)

En tous les cas, je constate que notre site est accessible sans pb depuis hier soir, alros que d'autres hébergeurs semblent ne pas avoir redémarré... Je ne dirai donc qu'une chose : encore une fois merci à Wmaker et OVH pour avoir limité les dégats... En attendant la nouvelle panne promise lors du rmepalcmeent du disjoncteur !

5.Posté par sébastien Simoni le 27/03/2006 12:34 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Les problèmes liés au coupure de courrant dont parle cet hébergeur sont bien réel.
En revanche la description de redbus ressemble à du racolage commercial et n'est vraiment sérieuse. Redbus est la premier centre de donnée européen.

Nous avons toutes confiance en Octave Kalba directeur d'OVH il a demander à avoir accès au plan de conception du cablage électrique du data center. S'il y a un problème Octave va planifier le déménagement des 2 suites chez red bus. Voici le mail Octave nous a poster hier soir :

Bonjour,
Nous avons connu aujourd'hui 3 coupures electriques sur Redbus:
1ere : de 10:55:20 à 11:54:41
2ème : de 14:32:10 à 15:16:28
3ème : de 17:01:02 à 17:05:28
Il faut y ajouter le temps de panne pendant lequel Redbus a
deconseilé de redemarrer les installations à cause du risque de
coupure.

Nous avons essayé suivre les pannes avec les informations qui
nous arrivaient via notre équipe sur place. Vous avez tout sur
http://travaux.ovh.com/index.php?do=details&id=858

C'est une 2ème serie des pannes chez Redbus en moins d'1 mois.
On peut croire que la 1ere serie était due à un probleme humain,
on peut difficile penser la même chose aujourd'hui. Si un
datacentre peut tomber aussi souvent ce qu'il y a un defaut de
conception dans le reseau electrique.

Nous allons demander à Redbus de nous fournir les schemas de
principe concernant le reseau electrique. L'objectif pour nous
est de le faire analyser par des specialistes et avoir une
explication independante de Redbus sur les origines des pannes.
Nous pensons en effet trouver les erreurs de conception (sinon
comment expliquer autant des pannes ? puis même en cas des erreurs
humain, le reseau electrique doit continuer à fonctionner, sinon
ce n'est pas un datacentre). Si c'est effectivement le cas, nous
allons partager avec Redbus cette analyse et demander des corrections
dans leur reseau electrique. L'objectif pour nous est de connaitre
les risques actuels à fournir les services de housting en collaboration
avec Redbus et palier à ces risques dans le futur pour vous fournir
un service de qualité. A defaut de collaboration de la part de Redbus,
nous allons proposer les offres de housing avec d'autres prestateurs,
plus transparents, voir directement chez nous sur Paris19 (où nous
gerons de bout à bout toute la chaine d'alimenation electrique).

Les problemes ne sont pas resolus dans la mesure où le dijoncteur
principal ne fonctionne pas (et donc EDF est coupé), les onduleurs
sont à plat et tout fonctionne uniquement sur les groupes electrogenes
qui ont montrés déjà des serieux faiblesses dans le passé. On espere
passer la nuit sans aucune coupure puis avoir plus d'information
demain sur les delais de reparation du dijoncteur. On pense qu'il y aura
au minimum encore une coupure lors du passage des groupes electrogenes
vers EDF (lorsque le dijoncteur sera reparé).

Nous allons vous tenir au courant des informations qui nous seront fourni.

Nous sommes sincerement désolés pour les clients housing qui utilisent
nos services de location de baie avec collaboration de Redbus. Ovh
entre désormais de maniere active dans la resolution de ces problemes et
assure que tout sera fait pourque ça ne recommence plus dans le futur.
En tout cas c'est la condition pourqu'on continue à collaborer avec Redbus.

A part les clients housing, Ovh n'a pas été touché par la panne de Redbus.
En effet, nous avons notre propre datacentre où tout l'hébergement mutualisé
et dédié est assuré directement par Ovh. Le routage étant assuré par plusieurs
routeurs, nous avons enrigistré 3 coupures de 30-60 secondes sur certaines
destinations uniquement.

Amicalement
Octave


6.Posté par Stéphane le 27/03/2006 13:25 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Résultat: 40% de visites en moins pour la journée considérée. Damned

7.Posté par Jerome le 27/03/2006 13:34 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Ce n'est pas vraiment exact pour 40% de visiteurs en moins, les stats ont été un peu faussées sur cette journée bien difficile pour nous .