Maintenance sur les baie de stockage Résolu
Priorité - Basse Concerne : Système - RNS

Une opération de maintenance sur nos baies de stockage (remplacement des contrôleurs par des modèles plus récents et plus performants) sur le data-center de Rennes (RNS) est prévue du 16/04 à 18:30 au 17/04 à 01:00 (UTC+2) pour vous fournir une qualité de service toujours meilleure.

Du fait de la résilience de notre infrastructure, vos services resteront accessibles, mais un léger impact de performance pourrait être sporadiquement rencontré.

 

 

Incident câbles sous-marin Résolu
Priorité - Moyenne Concerne : Système - Réseau Réunion

Nos opérateurs à la Réunion nous rapportent un incident en cours sur le câble sous-marin SAT-3, et les consortiums gérants les câbles rapportent que WACS, ACE, MainOne, Seacom, EIG) et AAE1 connaissent aussi des incidents.

Les connexions entre les îles de l'Océan indien et le reste du monde pourraient être perturbées de manière sporadiques. Les connexions internes ou inter-îles ne sont pas impactées.

Cela peut aussi affecter vos accès à votre espace client qui est hébergé dans l'UE continentale pour des questions de redondance.

Nous nous excusons pour la gêne occasionnée, et nous ne manquerons pas de vous prévenir de l'évolution de la situation.


MAJ 20/03 : Le câblier Léon Thévenin vient de quitter son port d'attache, Cape Town, pour mettre le cap sur le lieu identifié de l'incident du SAT-3 (au large de la Côte d'Ivoire). Son arrivée prévue sur site est à la fin du mois. Le retour à la normale est prévu vers le 4 avril.


MAJ 29/03 : Le câblier Léon Thévenin vient d'arriver à Abidjan et va mettre le cap sur le lieu précis de l'incident du SAT-3. Les opérations devraient durer jusqu'à mi-avril.


MAJ 15/04 : Le câblier Léon Thévenin a quitté la zone de l'incident pour retourner à Abidjan. Nous fermons donc cette remontée d'incident même si les autres câbles coupés seront réparés plus tard car les câbles concernant la Réunion sont désormais réparés.

Incident serveur web Résolu
Priorité - Haute Concerne : Serveur - RUN1

cPanel a décidé de passer les certificats SSL de Sectigo à LetsEncrypt, mais le renouvellement du certificat du domaine principal (run1.hodi.host) ne se déroule pas comme prévu, ce qui a pu causer des difficultés d'accès à certains sites. Nous avons mis en place un correctif en attendant que le certificat se renouvelle comme attendu.

Le problème de renouvellement de certificat est actuellement escaladé chez cPanel.

Les accès à cPanel par l'espace client sont actuellement indisponibles du fait du non renouvellement du certificat, il vous faut utiliser l'accès direct.

Nous nous excusons pour la gêne occasionnée.


MAJ 9:35 : La situation est revenue à la normale pour les accès cPanel.


MAJ 13:35 : Nous avons, de manière préventive, déployé l'action corrective sur les autres serveurs de notre architecture.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN2

15/02 10:56 : Nous n'arrivons plus à joindre ce serveur.


15/02 11:12 : La situation est revenue à la normale, nous gardons le serveur sous surveillance.


16/02 10:57 : Nous avons rencontré le même problème, la situation va revenir à la normale dans 5 à 10 minutes.


16/02 11:50 : Après des analyses plus poussées grâce à la surveillance rapprochée du serveur, le composant PHP X-Ray semble poser problème. Nous le retirons quelques jours pour vérifier cela.


17/02 10:57 : Nous avons de nouveau un incident, nous collectons davantage de traces, et nous allons redémarrer le serveur. La situation va revenir à la normale dans une dizaine de minutes.


18/02 10:57 : L'incident s'est reproduit, le service Apache semble la cause du dysfonctionnement avec une augmentation soudaine de sa consommation CPU. La situation va revenir à la normale dans une dizaine de minutes. Nous procéderons lundi au déplacement des sites qui le désirent sur un autre hébergement web le temps de stabiliser celui-ci.


18/02 11:37 : Nous sommes encore en train de collecter des informations pour mieux isoler la cause des dysfonctionnements.


18/02 16:45 : Nous sommes en train d’analyser les différentes traces collectées.


19/02 08:10 : Nous avons modifié la configuration du serveur suite à l'analyse d'hier, nous continuons l'analyse ce matin et gardons le serveur sous étroite surveillance.


19/02 11:45 : Aucun problème n'a été rencontré aujourd'hui sur le serveur RUN2 suite aux changements apportés. Nous poursuivrons ceci dit la surveillance demain.


22/02 15:30 : Après plusieurs jours de surveillance, la situation est revenue à la normale.

Mise à jour firewall Réunion Résolu
Priorité - Haute Concerne : Système - Réseau Réunion

Fortinet a publié l'avis de sécurité concernant la vulnérabilité critique CVE-2024-21762 affectant le VPN SSL de FortiOS. Cette vulnérabilité permet à un attaquant non authentifié de provoquer une exécution de code arbitraire à distance. Fortinet indique que cette vulnérabilité serait potentiellement exploitée.

Une mise à jour de nos deux clusters de firewall Fortinet à la Réunion est planifiée ce lundi 12/02/24 à 21h : Passage de la version FortiOS 7.2.6 à FortiOS 7.2.7, ce qui causera une coupure de 10 à 15 minutes environ.

Plus d'informations : https://cert.ssi.gouv.fr/alerte/CERTFR-2024-ALE-004/

 

Incident câbles sous-marin Résolu
Priorité - Moyenne Concerne : Autre - Réseau Réunion

Un de nos opérateurs à la Réunion nous rapporte deux incidents qui sont en cours sur les câbles sous-marin :

  • sur le câble EIG depuis le 3/01/24, au large de Djeddah (Arabie Saoudite) ; la réparation est annoncée entre le 25 février et le 6 mars 2024.
  • sur le câble SAFE-SAT-3 depuis le 9/01, et les investigations sont en cours pour identifier la localisation exacte de la panne ; le démarrage de la réparation est annoncé pour le 17 janvier 2024.

Les connexions entre les îles de l'Océan indien et le reste du monde pourraient être perturbées de manière sporadiques. Les connexions internes ou inter-îles ne sont pas impactées.

Cela peut aussi affecter vos accès à votre espace client qui est hébergé dans l'UE continentale pour des questions de redondance.

Nous nous excusons pour la gêne occasionnée, et nous ne manquerons pas de vous prévenir de l'évolution de la situation.

 

Sécurité - Patch de vulnérabilité Résolu
Priorité - Critique Concerne : Système - Espace client

A 4:50, nous avons reçu une notification de l'éditeur du logiciel que nous utilisons pour l'espace client qu'une vulnérabilité critique avait été découverte :

The issue pertains to a specific function that allowed customers to upload image files (PNG, JPG, SVG, and GIF) when logged into the WHMCS client area. This function used PHP MIME type checks to ensure only these image formats could be uploaded. However, we have discovered that the MIME function’s security measures are not entirely foolproof.

It has come to our attention that skilled hackers could exploit this function. They could bypass the intended restrictions by executing a particular URL, allowing them to upload a PHP file. This vulnerability poses a significant security risk.

We want to assure you that this function was never utilized in the Lagom Client Theme. As a precautionary measure, we have completely removed this function from the addon files to eliminate any potential risk.

Our team has conducted a thorough investigation of all addon files to search for any other vulnerabilities. We are pleased to report that no additional significant security issues have been found. However, as part of our commitment to continually enhance the security and integrity of our products, we plan to release further security improvements in the upcoming 2.2.4 version of our product, scheduled for release in February.

Nous avons vérifié l'espace client et aucun signe de téléversement de fichier malveillant n'a été détecté, et déployé le patch en production vers 7:15.

Redémarrage prévu Résolu
Priorité - Moyenne Concerne : Serveur - RUN2

Le serveur RUN2 sera redémarré le 18/10 vers 21:00 (heure Réunion) pour procéder à une maintenance préventive. Le redémarrage prendra quelques minutes, pendant lesquelles vos services seront inaccessibles.

Pour éviter de perdre des emails, les emails à destination du serveur RUN2 seront redirigés vers un serveur secondaire le temps de l'opération, et ce serveur se chargera de les rediriger vers le serveur RUN2 une fois le redémarrage terminé.


MAJ 21:15 : Les opérations se sont correctement déroulées et les services sont revenus à la normale.

 

Cyclone Belal Résolu
Priorité - Moyenne Concerne : Autre - PCA

En raison du passage du cyclone Belal sur la Réunion aujourd'hui, nous avons mis en place notre Plan de Continuité d'Activité qui nous permet de continuer nos services de support et d'infogérance, en gardant nos équipes en sécurité, qui travaillent depuis leur domicile.

Nous suivons de près la situation dans nos trois data-centers réunionnais et ne manquerons pas de vous indiquer si nous rencontrons des difficultés sur l'un d'eux. Soyez rassurez, ceci-dit, que vos données sont sauvegardées sur au moins deux autre data-centers, dont un en dehors de la Réunion, et que nous avons des réserves en carburant pour pallier des coupures d'alimentation électrique.


MAJ 17/01 à 9:30 : Nous n'avons eu aucun incident sur notre infrastructure, l'ensemble de nos services étaient opérationnels comme en temps normal.

Connexion cPanel Résolu
Priorité - Haute Concerne : Autre - cPanel

La connexion en un clic entre l'espace client et cPanel a été interrompue mais un ingénieur est intervenu pour réparer le dysfonctionnement. Les accès directs à cPanel sans passer par l'espace client sont restés opérationnels pendant la durée de l'incident.

Redémarrage prévu Résolu
Priorité - Moyenne Concerne : Serveur - RUN1

Le serveur RUN1 sera redémarré le 22/12 vers 21:00 (heure Réunion) pour procéder à une maintenance préventive. Le redémarrage prendra quelques minutes, pendant lesquelles vos services seront inaccessibles.

Pour éviter de perdre des emails, les emails à destination du serveur RUN1 seront redirigés vers un serveur secondaire le temps de l'opération, et ce serveur se chargera de les rediriger vers le serveur RUN1 une fois le redémarrage terminé.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

Un incident sur le serveur web RUN1 a été détecté causant une indisponibilité du service. Nous sommes en train d'intervenir.


MAJ 14h36 : La situation est revenue à la normale, mais nous gardons ce serveur sous surveillance rapprochée pour vérifier sa stabilité.


MAJ 21h : Nous avons réalisé une opération pour améliorer la stabilité. Nous gardons demain le serveur sous surveillance rapprochée.


MAJ 14/11 à 17h55 : Tous les signaux sont au vert, nous nous excusons pour la gêne occasionnée.

Redémarrage prévu Résolu
Priorité - Moyenne Concerne : Serveur - RUN1

Le serveur RUN1 sera redémarré le 13/10 vers 22:00 (heure Réunion) pour procéder à une maintenance préventive. Le redémarrage prendra quelques minutes, pendant lesquelles vos services seront inaccessibles.

Pour éviter de perdre des emails, les emails à destination du serveur RUN1 seront redirigés vers un serveur secondaire le temps de l'opération, et ce serveur se chargera de les rediriger vers le serveur RUN1 une fois le redémarrage terminé.


MAJ 22:15 : Les opérations se sont correctement déroulées et les services sont revenus à la normale.

Augmentation de la latence à la Réunion Résolu
Priorité - Haute Concerne : Système - Réseau Réunion

Notre supervision a détecté une augmentation de la latence sur certains de nos serveurs (dont run1.hodi.host). Il n'y a pas de perte de paquets, mais les accès pourraient être ralentis. Nous avons ouvert un ticket chez l'opérateur concerné et reviendrons vers vous dès que nous aurons plus d'informations.


MAJ 13:00 : le problème est résolu.

Indisponibilité réseau Résolu
Priorité - Critique Concerne : Serveur - RUN2

Le firewall Fortinet de RUN2 a dû être mis à jour d'urgence en raison d'une vulnérabilité critique, mais la connexion réseau ne revient pas. L'administrateur réseau d'astreinte est en train de travailler sur le sujet.

MAJ 5:30 : Le problème est réglé.

Incident câble sous-marin Résolu
Priorité - Moyenne Concerne : Système - Réseau Réunion

Notre opérateur à la Réunion nous signale un incident technique sur le SAT-3 ce dimanche 6/08 et des travaux sur le câble LION-2 pouvant causer des ralentissements sur les accès hors Réunion / Océan Indien à vos serveurs à la Réunion. Les réparations sont en cours mais nous n'avons pas de délai de résolution pour le moment.

Cela peut aussi affecter vos accès à votre espace client qui est hébergé dans l'UE continentale pour des questions de redondance.

Nous nous excusons pour la gêne occasionnée, et nous ne manquerons pas de vous prévenir de l'évolution de la situation.


MAJ 8/08 : Le retour à la normale pour le câble LION-2 est prévu vers le 13/08, mais le retour à la normale pour le câble SAT-3 n'est pas encore prévu.


MAJ 10/08 : Le câblier Léon Thévenin doit d'abord finir les travaux sur le câble LION-2 avant de mettre le cap sur le lieu de l'incident du SAT-3 (entre le Congo et le Cameroun).


MAJ 11/08 15h15 : La maintenance sur le câble LION-2 est terminée, la situation n'est pas encore de retour à la normale mais les choses vont s'améliorer pour les connexions hors Réunion.


MAJ 15/08 - 15h : Notre supervision a repéré une forte perte de paquets (> 50%) vers l'Afrique du Sud depuis un peu moins d'une heure, nous avons escaladé auprès de l'opérateur car la latence vers l'Europe ne rencontre pas ce problème. Les accès vers/depuis des services hébergés en Afrique du Sud et dans la zone Océan Indien sont donc fortement pertubés pour le moment (hors Emtel à Maurice avec qui nous sommes connectés directement). 18h : La perte de paquet importante vers l'Afrique du Sud a causé des problèmes sur la résolution DNS au niveau du serveur pouvant causer des échecs sur des appels d'API ou des retards de livraison de mails vers l'extérieur, nous sommes donc passés sur un autre opérateur pour la résolution DNS.


MAJ 18/08 - 13h : Notre supervision a repéré une forte perte de paquets (> 75%) vers l'Afrique du Sud depuis un peu moins d'une heure comme le 15/08, nous avons escaladé auprès de l'opérateur. Les accès vers/depuis des services hébergés en Afrique du Sud et dans la zone Océan Indien sont donc fortement pertubés pour le moment (hors Emtel à Maurice avec qui nous sommes connectés directement), ceux vers le reste du monde sont aussi moyennement pertubés. 15h45 : Notre opérateur confirme l'incident situé sur la liaison terrestre en Afrique du Sud et indique un délai de retour à la normale "sous quelques jours". 16h30 : Du fait des instabilités, nous avons eu un problème de courte durée sur le serveur web en raison du nombre de requêtes en attentes, nous avons augmenté la capacité de traitement du serveur web. 16h35 : Notre supervision repère un retour à la normale, nous attendons la confirmation côté opérateur.


MAJ 24/08 - 16h50 : Le câblier qui doit réparer le câble SAT-3 vient de quitter son port d'attache (Cape Town) après avoir chargé du câble de rechange. Il est prévu d'arriver au large du Congo, région de l'incident, le 30/08 à 16h (heure Réunion). Les équipes à bord devront ensuite procéder à la réparation du câble lui même.


MAJ 28/08 - 14h15 : Des instabilités du fait de ces problèmes ont été rencontrées sur le serveur web vers 14h07, nous avons fait des modifications pour que le service revienne à la normale vers 14h12.


MAJ 4/09 - 8h15 : Le câblier est arrivé sur le site de la coupure du câble SAT-3. Nous n'avons pas eu de date de fin de travaux communiquée par notre opérateur mais Telecom Namibia impacté par le même incident a annoncé un retour à la normale le 8/09.


MAJ 7/09 - 13h00 : Nos outils de supervision et des mesures manuelles semblent indiquer un retour à la normale, mais nous attendons la confirmation côté opérateur.

 

Ralentissements sporadiques Résolu
Priorité - Haute Concerne : Serveur - RUN1

Nous remarquons des ralentissements sporadiques sur run1.hodi.host pouvant causer des erreurs 503. Nous allons procéder à une opération de maintenance pour corriger cela vers 18h30, ce qui causera un redémarrage du serveur.


MAJ 7/09 12:50 : L'opération de redémarrage s'est déroulée avec succès, et la supervision montre que les problèmes de ralentissement sporadiques sont réglés.

Saturation sporadique de /tmp Résolu
Priorité - Haute Concerne : Serveur - RUN1

Nous avons reçu une alerte de la saturation temporaire de l'espace disque temporaire (/tmp) sur ce serveur. Après analyse, il s'agit de fichiers temporaires utilisés par le WAF, fichiers présents en plus grand nombre que d'habitude en raison du problème sur le câble sous-marin. Nous avons d'abord purgé les fichiers temporaires mais comme le problème revenait de manière sporadique nous avons augmenté l'espace disque.

 

Redémarrage prévu Résolu
Priorité - Moyenne Concerne : Serveur - RUN1

Le serveur RUN1 sera redémarré le 20/07 vers 22:00 (heure Réunion) pour procéder à une maintenance préventive. Le redémarrage prendra quelques minutes, pendant lesquelles vos services seront inaccessibles.

Pour éviter de perdre des emails, les emails à destination du serveur RUN1 seront redirigés vers un serveur secondaire le temps de l'opération, et ce serveur se chargera de les rediriger vers le serveur RUN1 une fois le redémarrage terminé.


MAJ 22:05 : Le serveur n'est pas reparti après la maintenance, nous avons donc annulé la modification réalisée et nous sommes en train d'investiguer sur la cause du non redémarrage.


MAJ 23:00 : Aucune cause évidente n'a été trouvée, nous allons travailler avec l'éditeur dans les jours qui viennent (nous avons récupéré les fichiers journaux et autres éléments) pour trouver la cause et replanifier cette maintenance. Nous nous excusons pour le contre-temps.


MAJ 21/07 11:50 : Nous avons eu une piste pour contourner le problème, nous allons retenter un redémarrage dans la nuit de lundi à mardi vers 22h.


MAJ 25/07 16:00 : Vu l'incident d'hier, nous avons reprogrammé la dernière étape de la maintenance préventive qui consiste en un redémarrage le 31/07 vers 22h. Le service sera interrompu quelques minutes.


MAJ 31/07 22:18 : Le redémarrage s'est déroulé avec succès, l'opération de maintenance préventive est désormais terminée.

 

Incident en cours Résolu
Priorité - Critique Concerne : Serveur - RUN1

Nous avons un incident en cours sur le serveur RUN1. Nos équipes sont en train d'intervenir pour le résoudre.


MAJ 11:35 : Nous sommes en train de restaurer une sauvegarde de la nuit dernière, nous vous tenons au courant d'ici midi dès que nous avons une heure prévue de retour à la normale.


MAJ 12:00 : Le stockage du serveur est corrompu, et la restauration complète est en cours et devrait se terminer vers 15h30. En parallèle, nous sommes en train de tenter des opérations pour réparer le stockage corrompu pour réduire le temps d'indisponibilité. Nous vous tenons au courant si cela donne quelque chose.


MAJ 14:00 : La restauration est toujours en cours au même rythme (fin prévue vers 15h30). Nous avons terminé des étapes d'analyse du stockage pour continuer les opérations de réparation en parallèle.


MAJ 15:25 : La restauration est terminée, nous faisons quelques tests rapides pour voir si grâce à cette restauration nous pouvons relancer le serveur actuel ou pas et dans le cas contraire nous relançons la sauvegarde.


MAJ 15:45 : La sauvegarde est redémarrée, mais certains services ont du mal à repartir. Nous vérifions cela.


MAJ 16:45 : Nous sommes toujours sur le sujet et nous restons mobilisés jusqu'à sa résolution. En parallèle, nous avons vérifié les données de la sauvegarde et tout est OK, il n'y a pas eu de corruption de données.


MAJ 17:15 : Nous avons apporté des modifications pour régler le problème, nous lançons un redémarrage.


MAJ 17:20 : Le service est revenu à la normale, nous supervisons que tout se passe bien. Si vous avez des problèmes, n'hésitez pas à quitter et relancer votre navigateur et/ou logiciel de messagerie. Les données créées/modifiées entre 22h hier (la sauvegarde) et 11h aujourd'hui (l'incident) ont été perdues pour le moment, mais nous continuons les opérations pour essayer de récupérer des données sur le stockage corrompu.


MAJ 25/07 17:35 : Nous travaillons toujours sur la récupération du stockage. Nous vous communiquerons aussi un rapport d'incident complet dans les prochains jours.


MAJ 27/07 09:40 : Nous sommes au regret de vous annoncer que malgré les différentes tentatives de récupération du stockage, aucune des données impactées n'ont pu être récupérées. Nous finalisons le rapport d'incident pour le début de semaine prochaine, mais nous tenons déjà à vous rassurer qu'il s'agit d'un incident exceptionnel et que nous avons mis en place des procédures de remédiation pour éviter que cela se reproduise.

 

Difficulté des envois de mail, notamment vers Microsoft 365 Résolu
Priorité - Haute Concerne : Système - SpamExperts

Nous avons repéré une hausse des emails en erreur et, après investigation, il s'agit d'un prestataire (SpamHaus) qui a décidé de dégrader la réputation de certaines IP de SpamExperts que nous utilisons pour sécuriser l'envoi de vos emails.

SpamHaus est notamment utilisé par Microsoft 365 donc certains mails à destination de Microsoft 365 on pu ne pas arriver correctement à destination.

Si vous avez reçu un mail d'erreur ressemblant au message ci-dessous, vous devrez renvoyer votre mail :

This message was created automatically by mail delivery software.

A message that you sent could not be delivered to one or more of its
recipients. This is a permanent error. The following address(es) failed:

[email protected]
host exemple.mail.protection.outlook.com [104.47.17.74]
SMTP error from remote mail server after RCPT TO:<[email protected] >:
550 5.7.1 Service unavailable, Client host [185.201.16.35] blocked using Spamhaus. To request removal from this list see spamhaus.org/query/ip/185.201.16.35 AS(1440) [DB8EUR05FT058.eop-eur05.prod.protection.outlook.com 2023-06-05T08:07:52.587Z 08DB64E430EF8B14]

Après consultation avec SpamExperts, ils travaillent à la résolution de ce problème et nous vous tiendrons informés de l'évolution de la situation.


MAJ 12:15 : la situation est en train de revenir à la normale progressivement.


MAJ 13:30 : la situation est revenue à la normale, les emails sont désormais livrés correctement.


MAJ 6/06 11:45 : certains emails restent plus longtemps que la normale en liste d'attente donc vous pouvez recevoir des emails avec comme sujet "Warning: message 1q5wWt-0006kT-73 delayed 24 hours" ; en attendant que SpamExperts résolve la situation nous l'avons désactivé pour éviter des retards dans la livraison de vos emails.


MAJ 7/06 12:00 : SpamExperts nous a informé être en relation très étroite avec Spamhaus suite à cet incident pour éviter que ça se ne reproduise, et travailler à livrer les emails qui sont encore en file d'attente (ceux pour lesquels vous recevez un message avec un sujet comme "Warning: message 1q5wWt-0006kT-73 delayed 24 hours"). Nous vous tiendrons au courant dès que tous les messages auront bien été délivrés et nous maintenant la désactivation de SpamExperts pour éviter que vos nouveaux mails ne soient retardés.


MAJ 9/06 11:00 : Après différents communications avec SpamExperts et des tests que nous avons effectués sur notre infrastructure de pré-production, le problème est réglé et nous allons réactiver SpamExperts lundi prochain.


MAJ 12/06 16:50 : Nous avons bien réactivé SpamExperts et nous surveillons l'évolution de la situation.


MAJ 13/06 17:15 : Tous les voyants sont au vert et aucun problème de livraison n'est à constater. Nous nous excusons pour la gêne occasionnée sur cet incident qui était hélas hors de notre contrôle.

 

Incident accueil téléphonique Résolu
Priorité - Critique Concerne : Système - Téléphonie

Un incident est en cours sur notre plateforme téléphonique et le fournisseur concerné travaille à la résolution.

Nous vous invitons à nous joindre par chat ou par email en attendant le retour à la normale. Nous nous excusons pour la gêne occasionnée.

Changement du système de sauvegarde Résolu
Priorité - Basse Concerne : Système - Sauvegarde

Après différents tests, nous avons décidé de changer de système de sauvegarde pour passer de Acronis vers JetBackup progressivement. Ce système permet notamment des sauvegardes et des restaurations plus rapides, tout en gardant la flexibilité d'une restauration totale ou partielle selon vos besoins. Les sauvegardes JetBackup seront stockées dans l'Union Européenne.

Bien entendu, les sauvegardes Acronis resteront disponibles en parallèle le temps que JetBackup dispose de 30 jours d'historique de sauvegarde.

Nous mettrons à jour ce message une fois que tous les serveurs seront basculés avec succès vers JetBackup, et une fois que Acronis sera retiré 30 jours après la bascule.


MAJ 3/04 : environ 50% des clients ont été basculés avec succès ce weekend, le reste des clients sera basculé le weekend prochain.


MAJ 11/04 : tous les clients ont bien été basculés avec succès vers JetBackup. Les sauvegardes Acronis seront supprimées le 11/05/2023. Vous pouvez dores-et-déjà consulter notre FAQ pour restaurer les sauvegardes JetBackup.

 

Redémarrage prévu Résolu
Priorité - Moyenne Concerne : Serveur - RUN1

Le serveur RUN1 sera redémarré le 25/04 vers 21:30 (heure Réunion) pour procéder à l'augmentation de ses capacités. Le redémarrage prendra quelques minutes.


MAJ 14:00 : Suite à l'incident et au redémarrage, les capacités ont été augmentées. Cette opération est donc annulée.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

Un incident sur le serveur web RUN1 a été détecté causant des indisponibilités de vos sites web. Un ingénieur est en cours d'analyse.


MAJ 14:00 : L'incident est résolu après redémarrage du serveur, nous en avons donc profité pour réaliser l'opération d'augmentation des capacités initialement prévue à 21:30 aujourd'hui.

Incident câble sous-marin Résolu
Priorité - Moyenne Concerne : Système - Réseau Réunion

Notre opérateur à la Réunion nous signale un incident sur les câbles sous-marins pouvant causer des ralentissements sur les accès hors Réunion à vos serveurs à la Réunion. La date prévue pour le retour à la normale est le 30/04.

Cela peut aussi affecter vos accès à votre espace client qui est hébergé hors Réunion pour des questions de redondance.

Nous nous excusons pour la gêne occasionnée, et nous ne manquerons pas de vous prévenir de l'évolution de la situation.


MAJ 25/04 : La situation est revenue à la normale.

Information "Transfert terminé" erronée Résolu
Priorité - Basse Concerne : Système - Noms de domaine

Cette nuit, certains domaines en cours de transfert ont été indiquées comme "terminés" de manière erronée et les clients concernés ont reçus des emails les informant, par erreur, que leur nom de domaine était bien transféré. Notre équipe analyse la situation et nous vous invitons à vérifier le statut de vos domaines sur votre espace client en cas de doute.


MAJ 17:25 : Nous avons trouver la cause du problème qui a été résolue.

Attaque DDoS en cours Résolu
Priorité - Critique Concerne : Système - Espace client

Nous subissons une attaque par déni de service distribué (DDoS) sur notre site Internet et sur notre espace client. Nous sommes rapidement intervenus pour bloquer l'attaque mais nous surveillons la situation de près. L'accès à votre espace client pourrait être sporadiquement ralenti.


MAJ 15:15 : Tous les indicateurs sont au vert. Nous clôturons l'alerte.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

10:20 : Un incident sur le serveur web RUN1 a été détecté. Une intervention est en cours.


MAJ 10:35 : L'incident a été réglé vers 10:30 et est lié à un pic de consommation anormal sur MySQL. Nous allons analyser pour voir comment réguler ce genre de consommation.

Ajout d'un anti-spam sortant Résolu
Priorité - Basse Concerne : Autre - Serveurs mutualisés

Le 13/03, nous allons rajouter un anti-spam sortant sur l'ensemble des serveurs mutualisés afin d'améliorer la sécurité générale de notre infrastructure et la délivrabilité de vos emails. Cela permet aussi d'éviter qu'un script mal configuré puisse envoyer des spams et donc réduire la réputation de vos noms de domaine. Cet anti-spam sortant est inclus sans coût supplémentaire sur votre hébergement.

Les tests sur nos environnements de test ont été concluants.

L'article 12 des nos Conditions Générales de Service a été mis à jour pour correspondre à cette nouvelle pratique.


MAJ 13/03 à 11:32 : La mise en service de l'anti-spam sortant a été réalisée avec succès vers 11:18 et la supervision des envois d'email n'a pas détecté de problème.

Maintenance prévue sur les serveurs de stockage Résolu
Priorité - Basse Concerne : Système - Serveurs de stockage

Une opération de maintenance est prévue le 8 mars entre 11h et 19h (heure Réunion) sur les serveurs de stockage FTP (cela ne concerne pas les hébergements mutualisés). Durant cette période, une coupure de quelques minutes sera à prévoir. Le service reviendra automatiquement à la normale et aucune donnée ne sera perdue.

Nous nous excusons pour la gêne occasionnée.


L'opération de maintenance est terminée depuis 17:17.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

Un incident sur le serveur web RUN1 a été détecté causant des ralentissements de vos sites web, voire des indisponibilités sporadiques. Un ingénieur est rapidement intervenu pour stabiliser la situation une dizaine de minutes après le début de l'incident et les services sont revenus à la normale.


MAJ 19:30 : Après analyse, l'incident était lié à un dysfonctionnement sur MySQL qui a occasionné une augmentation anormale de l'utilisation des ressources sur le serveur. L'origine du problème a été corrigée vers 19:30 pour prévenir un futur dysfonctionnement. Nous nous excusons pour la gêne occasionnée.

 

Incident sauvegarde Acronis Résolu
Priorité - Haute Concerne : Système - Acronis

Un incident est en cours au niveau des sauvegardes Acronis. Les sauvegardes ne sont actuellement plus réalisées, et il n'est pas possible de restaurer les anciennes sauvegardes.

Les sauvegardes Veeam continuent normalement et ne posent pas de problèmes : vos données sont donc en toute sécurité.


MAJ 10:12 : Les sauvegardes passées ne sont pas endommagées, c'est juste l'accès aux sauvegardes qui est impossible pour le moment (en lecture et en écriture).


MAJ 10/02 13:06 : Le problème est résolu. Nous allons lancer une sauvegarde manuelle vers 19h.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

Nous rencontrons un incident sur le serveur web RUN1 qui cause des inaccessibilités à vos services. Un ingénieur est en train d'intervenir pour régler la situation.


MAJ 17:17 : La situation est revenue à la normale mais nous allons procéder dans quelques instants à un redémarrage du serveur pour augmenter ses performances.


MAJ 19:15 : Nous rencontrons un problème au redémarrage, et nous sommes en lien avec l'éditeur du composant logiciel qui pose problème.


MAJ 20:27 : Le problème est réglé et la situation est revenue à la normale. Nous nous excusons pour la gêne occasionnée.

 

Saturation sporadique de /tmp Résolu
Priorité - Haute Concerne : Serveur - RUN1

Nous avons reçu une alerte de la saturation temporaire de l'espace disque temporaire (/tmp) sur ce serveur. Après analyse, il s'agit de fichiers laissés par le WAF, et nous ne remarquons pas ce problème sur nos autres serveurs. Un ticket a été ouvert chez le fournisseur du WAF pour analyse. Les fichiers temporaires ont, entre temps, été supprimés par l'administrateur d'astreinte.


MAJ 20/01 à 9:25 : Le fournisseur du WAF a bien pris en compte le problème et en train de regarder ce qui se passe.


MAJ 20/01 à 13:05 : Le fournisseur du WAF a déployé un correctif qui devrait régler la situation. Nous allons vérifier dans les prochains jours si le comportement est correct.


MAJ 23/01 à 08:25 : Le comportement est correct, le WAF ne laisse plus de fichiers temporaires superflus dans /tmp.

 

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - NBG1

Un incident est en cours sur NBG1 et nos ingénieurs travaillent à sa résolution. Le service devrait revenir à la normale sous peu.


MAJ 16h10 : L'incident est résolu et la situation est revenue à la normale.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - NBG1

Un incident a été détecté sur NBG1 qui a causé une inaccessibilité temporaire des sites Internet qui y sont hébergés. Un ingénieur est intervenu rapidement pour relancer le service impacté vers 13h50. La cause première a été identifiée et un correctif est en cours de déploiement pour prévenir ce genre d'incidents à l'avenir.


MAJ 15:20 Le correctif a été débloyé.

Mise à jour de l'infrastructure Résolu
Priorité - Basse Concerne : Système - Data-center Saint-Denis

Une opération de mise à jour sur notre infrastructure sur le data-center de Saint-Denis (Université) est prévue du 28/11 au 07/12 pour vous fournir une qualité de service toujours meilleure.

Du fait de la résilience de notre infrastructure, ces mises à jour n'auront pas d'impact sur l'accès ou les performances de vos services, et aucune interruption de service n'est prévue.

Ajout des routeurs sur la page de statut Résolu
Priorité - Basse Concerne : Autre - Hyperping

Nous venons d'ajouter nos différents routeurs sur la page de statut de notre infrastructure (https://status.hodi.host/) pour vous aider à savoir si un éventuel problème est uniquement sur votre service ou plus global.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

Un incident sur les services web hébergés sur RUN1 a eu lieu vers 10:00 et un ingénieur est rapidement intervenu pour le résoudre moins de dix minutes plus tard. Nous nous excusons pour la gêne occasionnée.

Nous sommes en train d'investiguer la cause première de l'incident.


MAJ 10:50 : Il y a eu un pic sur l'utilisateur du CPU sur le serveur donc nous allons augmenter les ressources du serveur vers 21:00, ce qui occasionnera un reboot.


MAJ 22:00 : Les ressources ont bien été ajoutées et, après vérifications, tous les services sont bien repartis après le redémarrage.

Augmentation des capacités I/O Résolu
Priorité - Basse Concerne : Serveur - RUN1

Nous avons augmenté les capacités I/O de votre hébergement, sans coupure de service. Le seul impact est que les tâches I/O intensives que vous exécutiez seront désormais plus rapides à s'exécuter.

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - NBG1

Un incident sur les services web hébergés sur NBG1 a eu lieu à 16:10 et un ingénieur est rapidement intervenu pour le résoudre une quinzaine de minute plus tard. Nous nous excusons pour la gêne occasionnée.

 

Incident interface de restauration des sauvegardes Résolu
Priorité - Basse Concerne : Serveur - NBG1

Un incident est en cours sur l'interface de restauration des sauvegardes dans cPanel qui vous empêche de restaurer vos sauvegardes.

Les sauvegardes sont correctement effectués, et notre support est à votre disposition pour restaurer manuellement des sauvegardes si besoin.

Nous sommes en contact avec Acronis pour la résolution de cet incident.


MAJ : La situation est revenue à la normale.

Redémarrage prévu Résolu
Priorité - Basse Concerne : Serveur - RUN1

Le serveur RUN1 sera redémarré pour procéder à l'augmentation de ses capacités. Le redémarrage prendra quelques minutes.


MAJ : L'opération a été réalisée avec succès, et le redémarrage n'a pas été nécessaire.

Vérification de disponibilité des .RE et .FR Résolu
Priorité - Critique Concerne : Autre - AFNIC

Suite à maintenance de l'AFNIC qui gère les .RE et les .FR, la vérification de disponibilité indiquait par erreur que les domaines .RE et .FR étaient indisponibles même si ce n'était pas le cas. Le problème a été corrigé par nos équipes.

Incident interface de restauration des sauvegardes Résolu
Priorité - Basse Concerne : Serveur - NBG1

Un incident sur l'interface des restauration des sauvegardes (Acronis) est en cours et va nécessiter un redémarrage du serveur pour le résoudre. Ce redémarrage est prévu pour lundi matin à 7h. Les sauvegardes sont correctement effectués, il s'agit seulement de l'interface vous permettant de restaurer les sauvegardes qui ne fonctionne pas correctement.


MAJ 12 septembre à 8h30 : l'équipe d'astreinte a procédé au redémarrage et tout est revenu dans l'ordre.

Migration RUN1 vers un nouveau data-center Résolu
Priorité - Moyenne Concerne : Serveur - RUN1

Dans le cadre de l'amélioration de nos services, nous avons décidé de migrer RUN1 vers un nouveau data-center en plusieurs étapes pour limiter les impacts sur votre service. Ce nouveau data-center est bien entendu aussi à la Réunion. Cela nous permettra d'améliorer la qualité des services que nous vous proposons. Ce changement occasionnera un changement d'adresse IP pour votre hébergement : 185.161.10.160.

La recopie initiale des données est terminée et nos équipes ont vérifié que tout fonctionne normalement dans le nouveau data-center.

La bascule est prévue ce mercredi 7 septembre de 22h à 23h (heure Réunion). Les accès au serveur seront coupés le temps de la recopie des données modifiées depuis la dernière recopie, et seront redémarrés à la fin des opérations.

Aucun email ne sera perdu lors de la migration car ils seront reroutés vers un serveur secondaire le temps de la coupure, avant d'être redirigés vers votre serveur une fois que celui-ci sera accessible.

Nos équipes s'occuperont de modifier les entrées DNS de vos hébergements sauf si la zone DNS n'est pas hébergée sur nos serveurs. Si la zone DNS n'était pas hébergée sur nos serveurs, nous vous recommandons de modifier votre zone DNS pour utiliser un enregistrement CNAME vers run1.hodi.host.

Notre support technique se tient à votre disposition si besoin.


MAJ du 7 septembre à 9h47 : Les dernières étapes pré-bascules (changement TTL, recopie des données modifiées, reboot et vérification du bon lancement des services) ont été réalisées avec succès.


MAJ du 8 septembre à 00h42 : La dernière recopie a été réalisée avec succès, et l'ensemble des services est revenu à la normale. La supervision post-bascule n'a pas révélé de problèmes.


MAJ du 8 septembre à 11h25 : Nous constatons un dysfonctionnement où le serveur ne peut pas effectuer des appels HTTPS vers lui même, nous sommes en train d'investiguer le problème.


MAJ du 8 septembre à 11h49 : Nous avons une solution de contournement au dysfonctionnement de 11h25. Si vous êtes impactés par ce problème, il vous suffit de contacter notre support technique qui la mettra en place, en attendant la résolution définitive.


MAJ du 8 septembre à 15h32 : Le dysfonctionnement de 11h25 a été réglé de manière définitive.


MAJ du 9 septembre à 08h00 : Nous avons remarqué un dysfonctionnement nécessitant un redémarrage pour prévenir une interruption de service dans la journée, nous procédons au redémarrage qui prendra quelques minutes.


MAJ du 9 septembre à 09h15 : Nous considérons désormais la migration totalement terminée, les quelques ajustements nécessaires suite à cette migration ayant tous été traités. Les TTL ont été remis à 3600s. Merci pour votre compréhension !

 

Incident service d'envoi de mails Résolu
Priorité - Critique Concerne : Serveur - RUN1

Un incident sur le service d'envoi de mails hébergé sur RUN1 a eu lieu vers 15:25 pour les utilisateurs utilisant le port 587. L'équipe technique est intervenue rapidement pour régler la situation qui est revenue à la normale vers 15:45.

Si vous aviez toujours des difficultés, nous vous invitons à relancer votre logiciel de messagerie.



 

 

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - NBG1

Un incident sur les services web hébergés sur NBG1 a eu lieu vers 3:50 causant certains certificats SSL comme étant invalides. L'équipe d'astreinte a rapidement mis en place un correctif pour contourner le problème mais avec une baisse possible des performances.

La résolution définitive est intervenue vers 9:05 avec la mise en place d'un autre correctif restaurant les performances nominales.

Si vous aviez toujours une erreur de certificat SSL, nous vous invitions à vider le cache de votre navigateur.

 

Incident réseau à la Réunion Résolu
Priorité - Basse Concerne : Serveur - RUN1

Un incident a été détecté par notre supervision vers 23:43 et après intervention notre équipe d'astreinte a vu qu'il s'agissait d'un problème réseau qui a été résolu vers 23:58. Nous nous excusons pour la gêne occasionnée.

 

Maintenance prévue à la Réunion Résolu
Priorité - Moyenne Concerne : Système - Réseau Réunion

Notre opérateur à la Réunion nous signale une opération de maintenance sur son infrastructure :

Dans le cadre de la maintenance et la mise à jour de notre infrastructure, une opération de mise à jour d'équipements réseau est prévue le mercredi 29 juin
2022 à partir de 22h00 à 00h00.

Des perturbations du service Internet peuvent être ressenties durant cette opération.

Nous vous présentons toutes nos excuses pour la gêne éventuelle occasionnée

Nous vous remercions pour vote compréhension.

Cela peut causer des ralentissements voire des coupures sporadiques des accès vers vos serveurs sur la plage horaire indiquée.


MAJ 30/06 : L'opération est terminée et notre équipe d'astreinte n'a pas remarqué de problèmes sur lors de l'opération de maintenance.

 

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - NBG1

Un incident sur les services web hébergés sur NBG1 a eu lieu à 05:49 et l'équipe d'astreinte est rapidement intervenue pour le résoudre une quinzaine de minute plus tard. Nous nous excusons pour la gêne occasionnée.

 

Maintenance prévue sur l'espace client Résolu
Priorité - Basse Concerne : Système - Espace client

Une maintenance de routine est prévue sur votre espace client qui pourra le rendre inaccessible sporadiquement à partir de 22h. La maintenance est prévue pour terminer vers 22h30. Les autres services ne seront pas impactés.

 

Incident serveur web Résolu
Priorité - Critique Concerne : Serveur - RUN1

Un incident sur les services web hébergés sur RUN1 a eu lieu à 06:56 et l'équipe d'astreinte est rapidement intervenue pour le résoudre une quinzaine de minute plus tard. Nous nous excusons pour la gêne occasionnée.

Incident opérateur Résolu
Priorité - Critique Concerne : Serveur - NBG1

Notre opérateur en Europe nous signale un incident en cours sur son architecture, et travaille à la résolution de l'incident. Nous vous tenons informés dès que nous avons de nouvelles informations.


MAJ 11:45 : La situation est revenue à la normale. Nous nous excusons pour la gêne occassionée.

Redémarrage prévu Résolu
Priorité - Basse Concerne : Serveur - NBG1

Le serveur NBG1 sera redémarré pour procéder à l'installation de nouveaux composants logiciels. Le redémarrage prendra quelques minutes.

Redémarrage prévu Résolu
Priorité - Basse Concerne : Serveur - RUN1

Le serveur RUN1 sera redémarré pour procéder à l'installation de nouveaux composants logiciels. Le redémarrage prendra quelques minutes.

 

 

Incident câble sous-marin Résolu
Priorité - Haute Concerne : Système - Réseau Réunion

MAJ 29/04 à 16:43 : Notre opérateur nous informe que les réparations sont terminées.


Notre opérateur à la Réunion nous signale une alerte sur les câbles sous-marins :

A la suite de l'opération de maintenance d'hier, une casse sur le câble sous-marin a été localisée sur le continent africain.

Les réparations sont en cours chez note fournisseur. Nous n'avons, pour le moment, pas de délai de résolution à annoncer.

De fortes perturbations de service Internet pourront être ressenties.

Nous vous présentons toutes nos excuses pour la gêne éventuelle occasionnée

Cela peut causer des ralentissements voire des coupures pour les accès hors Réunion à votre serveur à la Réunion, ou depuis la Réunion vers votre serveur en Europe. Les accès de la Réunion vers la Réunion ne sont pas impactés.

Maintenance câble sous-marin Résolu
Priorité - Moyenne Concerne : Système - Réseau Réunion

MAJ : Suite à la maintenance, il semblerait que des ralentissements se poursuivent sur la journée, nous attendons plus d'éléments de la part de l'opérateur.


Notre opérateur à la Réunion nous signale une alerte sur les câbles sous-marins :

Une maintenance d'urgence aura lieu, sur nos câbles sous-marins, cette nuit, mercredi 20/04/2022 à 01h00 et prendra fin à 10h00.

De fortes perturbations de service Internet sot prévues durant cette tranche horaire.

Nous vous présentons toutes nos excuses pour la gêne éventuelle occasionnée

Nous vous remercions pour vote compréhension.

Cela peut causer des ralentissements voire des coupures pour les accès hors Réunion à votre serveur à la Réunion, ou depuis la Réunion vers votre serveur en Europe. Les accès de la Réunion vers la Réunion ne sont pas impactés.

Redémarrage prévu Résolu
Priorité - Basse Concerne : Serveur - NBG1

Le serveur NBG1 sera redémarré pour augmenter ses capacités. Le redémarrage prendra quelques minutes.

État des serveurs

Le tableau ci-dessous affiche l'état de nos serveurs. Vous pouvez consulter cette page pour vérifier l'état des services disponibles sur le serveur.

Serveur HTTP FTP MAIL Info PHP Charge du serveur Uptime
MRU1
RNS1
RUN1
RUN2

Voir l'historique de la disponibilité de nos serveurs

Découvrez nos offres d’hébergement

Hodi plus cher que OVH ?

C’est vrai, les offres Hodi sont effectivement légèrement plus onéreuses.
Mais achetez-vous réellement la même chose ?

Des serveurs basés
à La Réunion

Nos serveurs se trouvent en majorité à la Réunion et assurent un chargement 4 fois plus rapide en local et 2 fois plus rapide depuis Mayotte, Maurice et Madagascar

De vraies gens pour vous parler !

Notre équipe vous accompagne et vous aide en direct par mail, téléphone ou par chat

Hodi s’engage dans l’hébergement raisonné

Hodi vous aide à nettoyer vos datas et travaille sur la réduction de la consommation électrique de ses serveurs

Une entreprise locale innovante

Contribuez au développement de l’économie et de l’innovation à La Réunion et dans l’Océan indien

Une réactivité inégalée !

Notre équipe s’engage à vous répondre en moins de 2h en cas de problème