Rédigé par le Lundi 5 Décembre 2011

Rappel : RDV OpenCampus
N'oubliez pas l'OpenCampus de ce mercredi 7 décembre !

De 9h à 13h, nous serons pas moins de 7 pour vous rencontrer, vous présenter les nouveautés de la fin de l'année et celles pour l'année à venir.

Voici le programme de la matinée :






Rédigé par le Vendredi 2 Décembre 2011

Les nouveautés du player vidéo
Le player vidéo des Web TV vient de recevoir une mise à jour de taille. Plusieurs nouveautés ont été mises en production. Elles touchent notamment au design, aux fonctions d'export et de partage, aux pages de paramétrage ainsi qu'à la sécurité.

Voyons cela en détails :






Rédigé par le Lundi 21 Novembre 2011

OpenCampus le 7 décembre à Paris
Le 7 décembre prochain nous vous donnons rendez-vous à Paris pour un OpenCampus.

Un OpenCampus, c'est l'occasion de se rencontrer en chair et en os !

Six personnes de WMaker seront disponibles pour répondre à toutes vos questions. 

Date : 7 décembre de 9h à 13h
Lieu : La Cantine, 12 galerie Montmartre, 151 rue Montmartre, passage des Panoramas, 75002 Paris Voir sur une carte

Cet évènement est ouvet à tous. Afin de nous permettre de l'organiser au mieux, prenez soin de vous inscrire en remplissant le formulaire ci-dessous.






Rédigé par le Mercredi 9 Novembre 2011

J'ai testé les pages G+ pour les entreprises
Réclamées dès le lancement de Google+, les pages entreprises sont désormais disponibles.

Nous avons testé. Voici la page Google+ de WMaker.

Quelques mots sur ce que Google propose comme interaction avec cette page :

1/ Faire du +1
S'ils sont fans de vous, vous users peuvent le montrer avec un +1
Ils montrent leur soutient mais ne veront pas dans les mises à jours que vous faites sur la page quand ils surfent sur G+

2/ Ajouter aux cercles
S'ils sont encore plus fans, vos users peuvent ajouter votre page dans un de leurs cercles. Ils verront alors passer les billets que vous postez sur votre page.
En retour, si et seulement si ils vous ont ajouté, vous pourrez les ajouter dans un de vos cercles. Google vous propose par défaut 4 cercles : VIP, Clients, Equipe, Personnes suivies.






Nous avons mis en place un formulaire, permettant à nos utilisateurs de demander une compensation soit financière soit en service additionnel. Ce formulaire est accessible dans votre back office via URL de la forme :
http://www.votre-domaine.com/admin/refund/  ou par la page Mon abonnement.

Cette compensation est liée à l'incident de la nuit du 29 au 30 Octobre et aux dysfonctionnements qui ont suivis, notamment au niveau de l'upload des videos.

 

Cas n°1 : Compensation financière :

 

Remboursement 1 mois d'abonnement pour les utilisateurs CMS & WebTV.

 

Cas n°2 : Compensation en service gratuit :

 

Doublement durant 3 mois du quota de données transférées (Bande Passante) CMS et WebTV.

Doublement durant 3 mois du quota d’envois de Newsletter pour les utilisateur du produit CMS.

 

Nous sommes en train d'opérer de nombreux changements dans notre architecture, je vous rendrai compte ici de l'évolution de notre travail. Comme je vous le disais dans ma note d'hier 5 Personnes travaillent à plein temps sur l'architecture WMaker.

 

A la fin du mois je publierai un schéma décrivant la nouvelle architecture finalisée.

Merci pour votre confiance renouvelée par vos nombreux messages ici sur le blog et via d'autres canaux.







Rédigé par le Dimanche 6 Novembre 2011

Nous venons de faire une maintenance ce dimanche matin afin de gêner le moins possible. Nous avions programmé la fermeture des Backs Office entre 10 h à 12 h 00 mais cela à pris un peu plus de temps. Ils sont de nouveau accessibles depuis 14 h 00. Durant la maintenance les sites étaient accessibles.
 
Je vous fais un compte rendu, c'est technique mais pour ceux qui veulent comprendre, je rentre dans les détails. 
 
En quoi consistait cette maintenance :
 
1) Test de reboot
 
Cette maintenance consistait à effectuer des tests de reboot sur le serveur de base de données principal, le "Master". Cette machine est un  HP 16 Core avec 64 Go de RAM ECC. Elle possède 8 disques SSD Intel de 120 Go et un disque de Boot interne. Nous avons retiré par prévention le disque de boot interne vendredi dernier, car nous craignons qu'il soit un point faible de la machine. On devient Parano ... avec l'architecture de serveur. Résultat 3 reboots réussis, la machine se comporte bien :-)
 
2) Restauration des Machines Virtuelles sur RAID iSCSI
 
Depuis mi-octobre nous testions une nouvelle manière de répartir les machines virtuelles. Au lieu de mettre la moitié des Machines Virtuelles sur le serveur de fichier n°1 et l'autre moitié sur le serveur de fichier n°2, ce qui est à l'origine de l'indisponibilité durant 4 heures dans la nuit de samedi 29. Nous avions monté une machine virtuelle en Raid 1 en iSCSI. Ainsi en cas de panne d'un des gros serveurs de fichiers, elle continue à fonctionner avec un seul disque sur le second serveur. C'est validé, ça marche. L'incident du 29 nous l'a prouvé sur les machines concernées. En revanche nous avons profité de cette maintenance pour procéder à la réparation du Raid. Résultat, même si ça évite la panne à chaud, ça ne fait que la reporter.... mauvaise piste :-/
 
Intervention lundi dans Data Center :
 
1) Serveur de fichier n°1
 
Jeudi dernier, nous avons réussi à resynchroniser les disques de notre serveur de fichier n°1. Il était tombé en panne samedi 29. Lundi, Jérôme retirera les derniers disques WD Green qui restent dans la machine et qui sont à l'origine de la panne. Maintenant la  machine semble à nouveau bien tourner mais nous n'avons plus totalement confiance. Cette intervention devrait être sans incidence la machine n'étant plus en production.
 
On a contacté SUN / Oracle afin de changer la carte mère et toutes les cartes contrôleurs de ce serveur de fichiers. Si ce n'est pas possible, on mettra la machine au rencard. 
 
Ce genre de machine coute quand même 30 000 euros pièce.... même si je pense que notre erreur a été d'utiliser des disques basse consommation d'énergie. Il n'est pas normal que lorsqu'un disque sur 48 lâche, l'ensemble de la machine plante, normalement le RAID c'est fait pour cela .....
 
2) Back up et réseau
 
Le serveur de video était doublé par un autre serveur dans un second data center. Normalement il nous aurait suffit de changer les points de montage et les vidéos seraient reparties. Mais nous avons rencontré un problème sur le réseaux OVH entre Roubaix et Paris qui nous a limité la bande passante à 100 M/s au lieu 1 Gb/s. Du coup les vidéos étaient servies lentement. Nous n'avons pas eu de réponse du support OVH pendant le weekend de la Toussaint. En fin de compte j'ai contacté le patron d'OVH qui a reconnu le problème et m'a expliqué comment contourner cette limite de 100 Mb/s.
 
Comme vous l'a expliqué Samir dans les commentaires, nous allons mettre en place un troisième niveau de back up sur le Cloud Amazon. En cas de perte du serveur de fichier Vidéo, le relais sera pris automatiquement sans coupure, puisque le player est devenu intelligent. Cela sera pleinement fonctionnel dans les toutes prochaines semaines. 
 
Pour finir ...
5 Personnes travaillent à plein temps sur l'architecture WMaker avec 2 points quotidiens de reporting. A la fin du mois on publiera un schéma décrivant les modifications apportées à l'architecture. Conscients de la gêne que cela vous a  procuré, nous avons élaboré les compensations que nous allons vous proposer dès demain. 






Je vais vous expliquer les choses techniquement et de la manière le plus exhaustive possible. En tout cas, de la façon dont j'aimerais qu'on me les explique en tant que client.
 
Nous rencontrons plusieurs problèmes qui, cumulés, nous compliquent la tâche.
 
Up-load vidéo :
Nous avons trouvé une solution pour rétablir l'up-load vidéo. Cela nécessite la modification de l'application ; ça prendra la journée. Une fois la modification effectuée, les vidéos pourront être lues depuis plusieurs serveurs. Actuellement, les vidéos sont lues depuis le serveur de back-up chez OVH. Cela nous permettra de réparer les volumes de disques défectueux du serveur de fichiers n°1. Nous disposons sur place d'une quarantaine de disques neufs dans leurs emballages (Seagate ES 2To). Adieu les disques Green de WesternDigital qui sont la cause de tous nos problèmes...
 
Opération data center / technicien OVH :
Cette nuit, nous avons demandé au technicien d'OVH d'intervenir sur notre architecture afin de rétablir l’up-load sur les vidéos. L'opération consistait à retirer un ensemble de plusieurs pools de disques afin de permettre à la machine de redémarrer. Etant donné qu'il s'agit de très grosses machines (48 disques), les checks de disque empêchaient le redémarrage.
 
Nous disposons de deux gros serveurs de ce type, un dans chaque baie, identifié par des étiquettes en façade et sur le panneau arrière. L'opérateur d'OVH n'a pas retiré les disques dans le bon serveur, mais dans le serveur de fichiers n°2. :-( 
 
Cela a eu pour conséquence de nous couper de notre deuxième serveur de fichiers central. Nous nous en sommes rendus compte quasiment immédiatement, nous avons pu contacter le technicien au téléphone qui a reconnecté les disques. Cela a provoqué une coupure du service de 15 minutes vers 0h40 cette nuit. Il y a eu ensuite beaucoup de travail pour l'équipe car nous avons dû remonter des machines virtuelles et surtout traiter un gros problème SQL…
 
Resynchronisation base de donnée :
Un défaut sur un serveur de données a entrainé une perte de désynchronisation sur l'ensemble des serveurs SQL. En temps normal, 6 de serveurs de base de données sont en réplication mutuelle, avec les mêmes données partout. Cette nuit, l'application était en ligne, mais les données n'étaient plus cohérentes d'une base à l'autre. Nous avons à l’heure actuelle, relancé 3 serveurs de base de données, on continu... Cette situation est assez exceptionnelle, cela nous est arrivé une fois en 2006 pendant la nuit de Noël. Pour se prémunir de ce genre de risque, une photo de la base est faite tous les jours à 6h00 du matin ; nous stockons ces images de la base chaque jour avec 1 mois d'historique. 
 
Nous avons pu garder les sites actifs. Seuls les back-offices ont été mis en maintenance de 4h00 à 6h30 du matin. Heureusement, nous n'avons pas eu besoin d'utiliser ce back-up. L'un des serveurs de bases de données avait été mis en stand-by hier à 19h00. Nous sommes repartis de cette base pour remonter des serveurs de base de données cohérents.  En revanche,  les modifications (Article, Photo ...) entre 19h00 et 3h00 du matin n’ont pas été sauvegardé . Tout le reste est en ligne.
 
Pour finir :
Nous avons bien conscience que cela fait beaucoup d'incidents en trois jours. Nous faisons le maximum pour revenir à une situation stable. Nous avons organisé un roulement des équipes pour résoudre au plus vite les problèmes. Une fois cet épisode terminé, nous allons modifier plusieurs aspects de notre organisation. Le seul point positif, c'est que nous avons réussi à limiter l'interruption de service à 15 minutes, cette nuit. Nous pensons raisonnablement rouvrir l'up-load des vidéos d'ici mercredi matin. Une fois que nous serons venus à bout de tout cela, je vous proposerai une compensation commerciale. Mais là on se concentre  totalement sur les problèmes techniques. Je ferai un point en début d’après midi.

Maj 15h30 01/11 :
- Site : Temps de génération moyen des pages sous les >500 ms, c'est un peu plus lent que d'habitude mais la valeur s'approche de la normale. 
- WebTV : le lancement des videos est toujours lent, système Uplaod progress bien samir donnera des détails en commentaire de la note. 

Merci pour vos soutiens nombreux, On lache rien !!!! 

Maj 00h00 01/11 :
- Site : temps de génération moyen des pages 280 ms.
- WebTV : Lancement des videos est normal, Upload des videos actif si vous avez votre propre domaine !!!
 






Rédigé par le Dimanche 30 Octobre 2011

Nous avons subi une longue interruption de service. La panne a débuté à 19h45, les sites ont été remontés vers minuit. Nous sommes intervenus dès 19h50, mais la panne était assez grave. 

Nous avons perdu notre serveur de fichier central. Ce genre de machine est très fiable mais en cas de problème, elle est très compliquée à relancer : le reboot peut prendre plusieurs heures.

Nous ne sommes pas arrivés à relancer le serveur de fichier. Aussi, nous avons dû utiliser le serveur de fichier situé dans un autre data center en secours. Cette machine en BackUp nous sert à remonter l'architecture de WMaker en cas de grave problème.
 
Depuis début octobre, nous mettons en place une toute nouvelle architecture, les travaux seront finalisés fin novembre. Cela aurait réduit considérablement la probabilité de ce genre de panne et le temps d'indisponibilité...
 
Nous sommes désolé pour cette interruption de service, pour l'instant on se concentre sur la remise en route des +900 services de l'architecture et notamment les services de mail. 

(Maj 1) 30/10 à 4 h 00 : Le service Mail est ok.

(Maj 2) 30/10 à 6 h 00 : Certains sites n'étaient pas accessibles par leur nom de domaine DNS : problème fixé. 30/10 à 6 h 00.

(Maj 3) 30/10 à 12 h 20 : Nous avons réglé depuis ce matin plusieurs disfonctionnements.

Cette nuit :
Le principal problème que nous rencontrons actuellement c'est les VIDEO. 
Nous sommes intervenu dans la nuit dans le DataCenter de DC1 afin de redémarrer physiquement le serveur de fichier Video cela n'a pas fonctionné. Nous avons basculé sur un serveur de secours situé dans un autre DataCenter à Roubaix.

Actuellement  :
 
Il y a encore pas mal de problème sur les Videos notamment :
 
Upload Video / Photo -> service indisponible
Encodage Video -> service indisponible
Lecture des video -> lenteur épisodique 
 
On a planifier une autre intervention sur le DataCenter de DC1 dans l'après midi,  en attendant on essaie de trouver des solutions softs.

(Maj 4) 30/10 à 14 H 00 

Uplaod des Photos est Ok

(Maj 5) 30/10 à 16 H 00 

Quasiment tous le service à la normale nous avons redémarrer le Serveur fichier principal.
Nous allons essayer de mettre en service. 

(Maj 6) 30/10 à 17 h 40 

La tentative a avorté, ce qui à causé une interruption de back 30 min, revient à notre état initial mais toujours impossible d'envoyer des vidéos.

(Maj 7) 30/10 à 21 h 00 

Nous avons remonté un maximum de services.
Mais on ne peut toujours pas uploader de vidéo.
Demain matin une équipe prend la relève et réglera le problème de ce serveur de fichier avec l'aide OVH.

(Maj 8) 31/10 à 10 h 00

Nous avons profité de la nuit pour déplacer nos backups sur le nouveau serveur de fichier.
Ce serveur devait entrer en service la semaine prochaine.
Nous allons l'utiliser pour relancer les services. 

Nous pensons avoir stabilisé d'ici le début d'après midi.

(Maj 9) 31/10 à 17 h 00

Nous avons mis au point une technique sur le papier. Elle devrait nous permettre de reprendre la main sur le serveur de fichier central. On vient de commencer si cela réussis vous pourrez uploader à nouveau des videos,
en fin de soirée ou demain matin.

 







Rédigé par le Mercredi 12 Octobre 2011

Une bonne nouvelle n'arrive jamais seule
Nous avons été assez déçus par le changement de moteur de base de donnée.
La nouvelle base est bien plus robuste, mais nous attendions de meilleures performances.
En fait les gains ont été assez minimes, de l'ordre de 20 %.

Aussi pendant l'été nous avons cherché à optimiser dans les moindres détails le code du CMS.
Mais les améliorations n'ont influé que faiblement sur les résultats en production. Jusqu'à ce qu'on se rende compte que notre architecture de test au CampusPlex se comportait parfois de manière très différente par rapport à la prod.






Rédigé par le Jeudi 29 Septembre 2011

cc flickr by Jordiet
Depuis lundi dernier, pour les utilisateurs de www.wmaker.tv nous avons mis en ligne une nouvelle fonctionnalité: la publication différée ... et je n'en parle que maintemant sur le blog ? Pourquoi ? A cause d'une chose dont on vous parle peu souvent, les aides en ligne.

Lors de l'élaboration de la Web TV, nous avions cherché à optimiser au maximum le formulaire de publication des vidéos. L'enjeu était de charger l'interface au minimum dans la partie supérieure du formulaire. Au moment de l'ajout du statut publication différée, on s'est retrouvé en manque de place. il n'y avait plus trop d'endroit disponible pour afficher les champs de sélection de la date et de l'heure de publication. Nous avons alors retravaillé la page en s'inspirant de la page article du CMS en V5. Nous avons libéré de la place en haut du formulaire en déplaçant la saisie des tags en bas de page.






1 ... « 20 21 22 23 24 25 26 » ... 99