Dimanche 29 Janvier 2012

le Lundi 30 Janvier 2012

Dimanche 29 Janvier 2012
Depuis le milieu de la semaine dernière, nous étions en train de basculer sur notre architecture de serveur de fichiers (NAS) de production pour 2012.

L'incident du mois d'octobre nous avait poussé à acheter beaucoup de matériel :

- 40 disques SEAGATE ES (classe entreprise) garantis 5 ans et 1,2 Millions d'heures de 2 To chacun pour les NAS.
- 20 Disques Intel SSD de 600 Go à 1000 € pièces garanties 5 ans également, afin de disposer d'un pool ultra rapide.
- 2 serveurs HP utilisés comme tête de NAS 16 Core et 64 Go de mémoire vive avec 2 liens 10 Gb/s
- 1 Baie HP de 24 disques 2 1/2" P2000 interface 4 x 10 Gb/s

Mardi

Nous avons réparti les 20 SSD dans Sandy 1 (NAS 1) et Sandy 2 (NAS 2), ils sont x 100 plus rapide que des disques à plateau. Nous avons changé tous les disques de Sandy 2 par 20 disques SEAGATE ES de 2 To.

Jeudi

Nous avons mis en production un pool de 10 Disques sur Sandy 1, nous avons gagné en moyenne +30% en rapidité. Nous avons également lancé les synchronisations de données sur Sandy 2.

Tout ce weekend nous avons surveillé la synchronisation afin de doser le transfert de données pour ne pas ralentir les sites. Tous devait être fini pour lundi car Sandy 2 devait être mis en production lundi dans l'après midi.

Dimanche

Mais aujourd'hui nous avons perdu 4 disques SSD Intel 600 Go vers 16 h le système était capable de supporter la perte de 2 disques pas 4. Nous disposions d'un back up J-1. Nous pensions pouvoir tout de même exploiter le snapshot de la journée de samedi mais les données ne sont pas exploitables. Pour les articles publiés le vendredi 27 janvier après 13h 55, il vous faudra uploader les photos à nouveau, en revanche aucun souci sur les vidéos.


Dans notre malheur nous avons eu un peu de chance car 2 des disques se sont remis à fonctionner pendant quelques minutes. Nous avons immédiatement effectué un snapshot des données ce qui nous a permis de récupérer le différentiel de données, donc aucune perte.

HP et INTEL

Nous avions pris beaucoup de précautions depuis le mois d'octobre, mobilisés plusieurs personnes à plein temps sur ce projet. Mais c'était sans compter sur la légèreté de HP et de INTEL !!!

HP

HP a mis 1 mois et demi à nous répondre qu'il était normal d'avoir un débit de 700 Mb/s alors que la doc technique de la baie nous annonce 1600 Mb/s. Et je parle pas des serveurs pour qui il nous a fallu 1 mois à détecter un bug sur le système d'économie d'énergie qui faisait rebooter les serveurs pendant la nuit. Si HP veut des infos à ce sujet on peut leur en donner car leurs serveurs sont en mode efficiency quand la charge est trop basse. Ce qui est scandaleux c'est d'acheter pour 100 000 € de matériel et d'avoir un support digne d'une machine à laver.

INTEL

Nous avons acheté 20 disques à 1000 €/pièce chez INTEL. Ils postent une alerte sur les disques en disant qu'il faut mettre à jour leur fireware car sinon nous risquons un Bug. INTEL est (était) la meilleure marque de disques SSD. OVH nous avait confirmé qu'il n'utilise que cette marque pour des raisons de fiabilité. Ces disques sont 30% plus cher au Go. Et bien hier en fin d'après midi, malgré le Fireware à jour censé corriger le bug et les 5 ans de garantie 3 disques ont perdus leurs données.

Pour conclure :

Je n'essaie pas de nous dédouaner mais franchement HP et INTEL ne sont pas des constructeurs de second rang et d'ailleurs ils font payer fort cher leur Marque. Nous avons remonté très provisoirement WMaker sur un Pool SSD que nous allons désactiver dès que les back Up sur les disques à plateau seront finis (lundi fin journée).

Lundi nous allons faire une demande de prix à NetApp qui à la réputation d'être la Rolls Royce des NAS. Nous allons probablement être obligé pour notre santé mentale de passer par eux...

L'année commence bien + 1,6 % de TVA et minimum 60 000 € supplémentaires pour 2 NAS de chez NetApp....

On va pas se laisser abattre, nous avons plein de superbes nouveautés à publier en février, on continue !!


Sébastien Simoni
Fondateur de WMaker et du CampusPlex En savoir plus sur cet auteur


Vos commentaires
Du plus récent au plus ancien | Du plus ancien au plus récent

36.Posté par MARCEL LEVY le 01/02/2012 16:29 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour
Petit bémol sur Qnap... Je pourrais vous en parler longuement, je suis en panne depuis 15 jours avec la "Roll Royce" des NAS.Ils sont parfaits pour vendre les produits mais le SAV français est loin d'être à la hauteur !
Désolé Mr Girard mais la galère que nous traversons ne plaide pas en ce moment pour QNAP, au contraire même. Mais croyez moi je serais heureux d’écrire le contraire si des solutions existent.
Amitiés
Marcel Lévy

35.Posté par Nathalie MONTELLE le 31/01/2012 22:33 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour êtes-vous obligés de fermer tous les back office? ne peut-on bénéficier d'une petite marge de manoeuvre supplémentaire à Tahiti ( on est en plein boulot!)
merci

34.Posté par Yann le 31/01/2012 10:53 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour,
A quand un retour normal de la plateforme ? Notamment les feuilles de style css qui plantent.
Cdt

33.Posté par FCrozier le 31/01/2012 10:33 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@32 Jérôme.
C'est parti pour 3 de nos sites dans les supports concernés. Comme vous pourrez le constater, les feuilles de style css plantent.

Bon courage et merci pour votre feed-back.

Fabrice

32.Posté par Jerome PIETRI le 31/01/2012 09:15 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@31 FCrozier
Merci de passer par le support de fournir les explications nécessaires et captures d'écran car nous ne voyons rien de particulier sur votre site.

31.Posté par FCrozier le 31/01/2012 08:34 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Gros gros problèmes d'affichages encore ce matin... On peut avoir une mise à jour sur ce qui se passe pour répondre quelque chose à nos clients ??

Merci

30.Posté par Sébastien Simoni le 31/01/2012 01:14 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@29 Nous avons relancé plusieurs serveurs web trop chargés.
cela a du causer des soucis sur l'ajout d'image, mais l'image doit apparaitre quand même au bout de 10s. Je pense qu'il ne sert à rien de re-uploader.

29.Posté par Nathalie MONTELLE le 31/01/2012 00:48 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Non, il y a vraiment un problème avec l'upload des photos, là, je viens de recommencer 6 fois la manip et la photo ne monte pas dans l'article...( cela m'a fait pareil pour l'article précédent)

28.Posté par Sébastien Simoni le 30/01/2012 21:06 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@26 Nous avons programmé une intervention dans la nuit de mardi à mercredi vers 1h00 du matin heure de Paris. Probablement coupure pendant 1 h 00 des backs office. Un message dans les backs office vous avertira de l'heure exacte.

@27 n'y a pas de problème upload de photo pour nous.

27.Posté par Nathalie MONTELLE le 30/01/2012 20:19 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
le problème avec le upload des photos recommence...ça marche plus...

26.Posté par Nathalie MONTELLE le 30/01/2012 18:38 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
je n'avais pas trouvé le twitter et j'avoue que j'ai eu un dimanche stressant...surtout qu'à Tahiti vos nuits sont nos jours...merci pour le boulot que vous faites, juste un truc, le problème est-il réglé ou est-on encore dans une situation provisoire et va-t'on encore subir des clash?
merci

25.Posté par Jerome Granados le 30/01/2012 13:55 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@19 : la récupération est en cours

@20 & 23 : merci de passer par le support de vos sites respectifs pour nous interroger à ce sujet. Par le support, nous avons beaucoup plus d'outils à notre disposition pour analyser la situation.

24.Posté par Paris Tribune le 30/01/2012 13:30 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Twitter
Je viens de créer une nouvelle template pour faire un test : la partie "affecter cette template" prend en compte l'affectation indiquée. Le design suit moins. En revanche, le contenu de la partie dans la colonne qui a été ajoutée ne s'affiche pas : webservices, conteneur, video.

23.Posté par girard le 30/01/2012 13:02 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
La rolls royce, c'est QNAP...!
Plus sérieusement, n'hésitez pas à me contacter pour me faire part de vos besoins et savoir éventuellement en quoi QNAP peut vous aider à compenser HP et Intel.
La nouvelle gamme TX-X79 peut certainement vous aider avec en plus bcp d'autres services inclus.

Pierre Girard
QNAP Country Manager

22.Posté par Paris Tribune le 30/01/2012 12:51 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Twitter
J"ai également créé pleins de nouvelles templates de samedi à dimanche, juste avant le problème. Les pages internes du site sont horribles, sauf la page d'accueil et les pages des articles (excepté les brèves). Dans le back-office, les templates sont bien là avec les spécifications indiquées mais l'affichage ne correspond pas aux templates. Faut-il tout refaire ?
Au sujet du site d'information d'un journal national, il a bien été indisponible comme nous tous dès 15h45 puis il s'affichait de nouveau et la rédaction a pu mettre en ligne ses articles. Quel est cet hébergement spécifique ?

21.Posté par Stéphane Larue le 30/01/2012 12:31 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Facebook
Pareil, tout le nouveau design que j'ai effectué ce week end a été effacé !

le site ne ressemble à rien ! dois je retravailler des heures pour récupérer ou faut il attendre ?

www.stephanelarue.com

20.Posté par Ravallec le 30/01/2012 12:14 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bonjour,
J'ai 2 questions :

1) j'ai effectué des changements de design samedi et dimanche sur http://www.fashiondog.com. Le site actuellement en ligne ne correspond pas du tout à mes changements et est "horrible". Mes changements ont-il été "zappés" par le problème rencontré dimanche ?
2) J'ai créé un nouveau site samedi et dimanche "dogcuisine". Le site dimanche à 14H était en ligne. En me reconnectant ce matin, impossible de retrouver le site, ni même l'interface d'administration... Ne me dites pas SVP qu'il a été effacé...
J'ai passé mon WE à bosser sur wmaker et ca me ferait "mal" que tout soit effacé...
Merci pour une réponse rapide.
Jonathan

19.Posté par T.Essaadi le 30/01/2012 11:45 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Solidaires avec Wmaker
Bon courage

18.Posté par Jerome Granados le 30/01/2012 11:11 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
@7 : pouvez-vous refaire un essai d'upload ? De notre coté, tout est ok. Si pbm, merci d'ouvrir un thread.

@12 : merci, on va corriger l'orthographe ;)

@14 : le webmail fonctionne à nouveau voir le tweet

@16 : oui, c'est revenu brièvement pendant un instant, on en a profité pour faire une sauvegarde. Pour le site d'information, il dispose d'un hébergement spécifique

17.Posté par Paris Tribune le 30/01/2012 10:25 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Twitter
Une erreur de frappe dans mon précédent message : la plus grande joie c'était à 17h45 quand tout était rentré dans l'ordre et la plus grosse déception, c'était à 18h20 lorsque plus rien de fonctionnait.

1 2