Définir et personnaliser les seuils d’alerte dans Dartware InterMapper

Lorsque vous monitorez un serveur, vous voulez probablement pouvoir avoir plusieurs compteurs personnalisés qui reflètent les services installés sur la machine. Par exemple, le monitoring d’un serveur SQL Server sera optimisé si l’on n’oublie pas de monitorer le port 1433 (par défaut) et tous les services relatifs à ce SGBD.

Pour cet article, on décide de monitorer des instances Tomcat réparties sur les ports 8080, 9990 et 8181 via les probes HTTP fournies. Vous pourrez personnaliser ces probes en indiquant une URL bien précise et vérifier la présence d’une chaîne de caractère (par exemple pour déterminer un uptime…) ainsi que le port utilisé, donc.

Ici, on constate le monitoring de deux instances Tomcat qui servent trois sites. Si InterMapper ne nous le dit pas directement, une rapide connexion au serveur nous informe que xitim (8080) et Dev (9990) utilisent Tomcat 4.1 et Preprod (8181) Tomcat 5. La raccourci est facile à faire : apparemment, Tomcat 4.1 charge plus que Tomcat 5

L’intérêt de cette illustration réside dans le fait que deux des trois triggers répondent assez mal au poll. En effet, un temps de réponse supérieur à 3 secondes pour une application intranet locale semble déraisonnable. Ce qu’il y a de bien avec InterMapper, c’est que vous pouvez le monitorer mais surtout le chiffrer et le grapher dans le temps. Ainsi, vous pourrez par exemple aller voir votre pôle développement et lui argumenter que tous les jours à partir de 14h, les applications montent en charge. Trop de connexions simultanées ? Une machine sous-dimensionnée pour deux instances Tomcat servant trois sites ? Quelle que soit la cause du mauvais temps de réponse au poll, vous aurez les premiers éléments indispensables pour espérer résoudre votre problème. En tous cas, le rôle d’InterMapper s’arrête là.

Maintenant, vous pouvez personnaliser les seuils d’alerte de vos triggers. Imaginez que vos alarmes associées – quand bien même vous leur demanderiez une répétition toutes les demi-heures seulement – vous abreuvent de nombreuses alertes e-mail ou SMS, ne serait-il pas préjudiciable d’être noyé sous ces alarmes « maîtrisées » qui vous feraient peut-être louper d’autres problèmes plus critiques ? La réponse est probablement si, c’est pour cela qu’on peut customiser les seuils (thresholds) et affiner un trigger pour qu’il corresponde avec l’évolution de notre connaissance du parc et des services installés.

Personnaliser un seuil d’alerte

L’opération est très simple. Cliquez droit sur la probe monitorée (par exemple HTTP 8080) puis naviguez dans le menu Set Info > Set Thresholds…

Ne reste plus qu’à décocher la case Use Map defaults et renseigner les valeurs que vous avez empiriquement constatées. Les deux instances de test Tomcat qui nous intéressent ne répondent apparemment jamais au-dessus de 3500 msec. Il est donc intéressant de mettre la première échelle d’alertes (Warning) à la valeur 3500 et ainsi constater que notre sensation est bonne, mais aussi qu’elle n’omet pas un problème plus grave où le temps de réponse monterait à 4500 msec 1h par jour. Bref, on peut imaginer tous les soucis, vous l’avez compris, le tout étant de ne rien laisser au hasard et ainsi d’éviter les surprises.

Il faut également savoir que chaque trigger que l’on place possède ses particularités propres. Ainsi, les options de personnalisation qui existent pour la probe HTTP sont assez différentes de celles d’une probe SNMP standard comme illustré ci-dessous.

  1. Poster un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :