Nous avons récemment constaté qu’une fonctionnalité développée pour la surveillance des sites web manquait cruellement concernant le monitoring serveurs.
C’est pourquoi la mise à jour d’aujourd’hui propose de corriger ce problème et nous allons vous l’expliquer.
Monitoring de site web
Lorsque nos robots surveillent vos sites web, ils effectuent des tests à partir de sondes situées un peu partout dans le monde comme nous vous l’avons expliqué précédemment.
Comme nos sondes ne sont pas infaillibles, il se peut que l’une d’elles rencontre des difficultés passagères comme un problème de résolution DNS ou des ralentissements réseau.
Pour éviter de vous alerter sans raison dans le cas où le problème proviendrait de la sonde, nos robots vont effectuer de nouveaux tests avant de conclure, le cas échéant, que votre site web est hors service.
C’est ce que nous appelons chez nous le contrôle des tests “faux positifs”. Cette règle explique que vous puissiez constater parfois plusieurs tests à la même heure dans vos rapports de disponibilités.
Monitoring de serveur
Le cas le plus flagrant pour illustrer le problème de faux positifs pour le monitoring serveur est lorsque le seuil d’alerte du CPU était trop bas.
Dans cette situation, il suffit qu’au moment de la collecte des données l’utilisation du CPU dépasse temporairement la limite pour qu’une alerte soit envoyée. Or lors du test suivant, l’utilisation du CPU étant de nouveau sous le seuil, l’anomalie sera alors levée.
Pour limiter les alertes intempestives, une option de double vérification a été ajoutée et peut être activée comme ceci :
- Connectez-vous à votre manager Hitflow
- Rendez-vous dans la liste des serveurs via la rubrique “Surveillance > Serveurs”.
- Éditez un serveur en cliquant sur le bouton “modifier”.
- Rendez-vous dans la partie “Paramétrage des alertes” où vous pourrez cocher la case “Double vérification” pour activer l’option.
- Sauvegardez les changements.
À partir de maintenant, il faudra deux rapports avec un seuil dépassé pour considérer que le serveur ne fonctionne pas correctement.
Dans le cas d’un site web, le contrôle des faux positifs n’est pas une option. Toutefois, pour les serveurs, nous préférons vous laisser juge de la situation.
En effet, alors qu’un test de site web est initié par nos robots, dans le cas du monitoring des ressources de vos serveurs, c’est votre serveur qui doit envoyer les informations.
C’est donc à vous de trancher si vous voulez ou non attendre un deuxième rapport avant d’envoyer une alerte.