Une nuit mouvementée...

le Mercredi 15 Juin 2016

Cette nuit nous étions 5 sur le pont, réveil  difficile en pleine nuit. Quoiqu'il en soit Greg / PIerre-Laurent / Dumè / Seb et moi même étions debout à 2h du mat jusqu'à 4h suite un incident BGP.

Quand le BGP tombe en panne

La principale particularité d'Internet est d'être un réseau capable de se reconfigurer seul en cas de rupture d'une connexion. Cette fonctionnalité, héritée de la jeunesse militaire du réseau, visait à lui permettre d'être toujours fonctionnel. Pour se faire, chaque routeur annonce à ceux avec qui il communique la liste des réseaux qu'il est capable d'atteindre ou de gérer : C'est le protocole BGP (Border Gateway Protocol).

Dans la nuit de Mardi à Mercredi, notre fournisseur réseau OVH a réalisé une maintenance sur ses routeurs consistant à retirer de ceux-ci les règles BGP obsolètes ou devenues inutiles. Gregory Giannoni commente :

Il est des grandes pannes réseau comme des enquêtes de police, et il est difficile d'avoir les détails tant que l'affaire n'est pas close, mais le ménage réalisé dans les configurations des routeurs a été un peu trop corrosif, si bien que les chemins informatiques menant à nos réseaux ont été supprimées, isolant ainsi nos serveurs du reste du monde.
Pierre Laurent Medori qui ne s'est toujours pas couché, acquiesce !

Il aura fallu une heure en pleine nuit pour que le système soit à nouveau en grande partie fonctionnel, mais il reste encore à l'heure actuelle quelques problèmes de connectivité avec certains fournisseurs d'accès où quelques pays, et les problèmes sont en cours de résolution. Nous sommes toujours en contact étroit avec le support housing de notre fournisseur.

Maintenance matinale

Et oui nous avions également une maintenance matinale programmée de 7h à 10h qui n'avait rien a voir. Nous avons hésité en pleine nuit a l'annuler mais il fallait la faire, elle s'est bien passé et s'est terminée à 9h30. Il s'agit de deux choses bien distinctes: la maintenance n'a rien a voir avec la panne, et s'est bien déroulée.

Les symptômes jusqu'à la résolution définitive

- Problèmes sur le webmail, mais vous pouvez relever vos comptes emails en pop ou imap avec un client mail ou depuis votre téléphone.
- Problèmes de paiement, les prélèvements de la nuit n'ont pas pu avoir lieu et vous ne pouvez pas régler de facture si vous en avez une en attente, n'essayez pas de payer votre abonnement aujourd'hui.
- Problèmes avec certains flux RSS qui peuvent entraîner des lenteurs.

Voila nous essayerons de communiquer dès que "l'enquête" sera finie :)




Vos commentaires

1.Posté par Jérome Pietri le 15/06/2016 17:00 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
OVH viens de nous signaler que tout est réparé, nous les remercions pour leur réactivité.

"Comme vu ensemble lors de mon appel, je me permets de vous informer que la situation a été corrigée."

2.Posté par Chris Halusiak le 17/06/2016 10:53 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Bravo à toute l'équipe pour votre réactivité et pour votre constant investissement.
Quelques difficultés à relever le courrier et quelques lenteurs du back office et de l'affichage mais apparemment pas d'autres problèmes majeurs pour ABCfeminin.com suite à ces grandes manœuvres d'OVH.
Bonne fin de semaine et bon week-end,
Chris Halusiak

3.Posté par Chauveau le 17/06/2016 19:45 | Alerter
Utilisez le formulaire ci-dessous pour envoyer une alerte au responsable du site concernant ce commentaire :
Annuler
Un grand merci. Bravo pour votre efficacité et votre rapidité à réagir. On ne vous le dit pas souvent mais on est très heureux de faire partie de l'aventure WMaker. Les incidents sont rares et lorsque cela se produit, vous savez apporter les solutions adéquates.
Sachez que nous savons apprécier vos efforts. Merci encore.
Gil Chauveau