Problèmes de la soirée du 5 octobre 2006

Thursday 05 October 2006
Comme vous l’aurez surement remarqué, nos services ont été injoignables durant une bonne partie de cette soirée. Voici donc un résumé :

  • 17h11 : remplacement du noyau du NAS pour amélioration des performances. Suite à une erreur dans la configuration de celui-ci, la machine reste bloquée au boot
  • 17h13 : Redbus est alertée pour procéder à un redémarrage manuel de la machine sur un autre noyau
  • 17h46 : sans réponse de Redbus ni retour à la normal du service, nous relancons ces derniers en les priant de bien vouloir nous rappeler au plus vite sur nos portables
  • 17h55 : toujours aucune nouvelles de Redbus. Nous déclenchons une astreinte chez notre prestataire IP pour que l’un de ses techniciens interviennent
  • 18h15 : le technicien de notre prestataire nous rappelle et nous signal un problème d’alimentation sur la machine concernée
  • 20h00 : nous arrivons sur place (100 km + les bouchons de Paris participent à aller vite)
  • 20h15 : retour à la normal et retour de l’intégralité des services
    Nous profitons de notre présence sur place pour retirer l’un des disques durs du serveur hôte des serveurs virtuels : il est marqué comme défaillant et sera donc envoyé en SAV.
  • 21h30 : alors que nous sommes sur le chemin du retour, un technicien de Redbus nous appelle fièrement pour nous dire qu’il vient de relancer la machine mais qu’elle bloque au démarrage ; le technicien poétisant sur les circonstances l’ayant amené à intervenir vers 21h sans demande de notre part et refusant de réintervenir (le ton monte), nous joingons le directeur technique de notre prestaire pour débloquer la situation
  • 21h35 : un technicien de notre prestataire nous rappelle pour nous confirmer le retour à la normale de la situation

L’ensemble des services fonctionnent normalement.

Lassés des problèmes devenant de plus en plus récurrent en provenance de Redbus (et qui fait baisser notre taux de disponibilité : > 99.995% sans les problèmes de Redbus, < 99.995% avec) nous allons commencé à collecter différents devis en vue d’une migration potentielle de la plateforme d’hébergement vers un nouveau datacenter.