Supervision uptime : les outils

Savoir que son site est tombé avant ses utilisateurs est essentiel. Les outils de supervision uptime externe vérifient continûment l'accessibilité du service et alertent dès la première anomalie.

Pourquoi externe

Le monitoring interne (depuis les serveurs eux-mêmes) ne voit pas un datacenter entièrement hors ligne. Seul un monitoring depuis l'extérieur, idéalement depuis plusieurs points du monde, permet de confirmer qu'un service est réellement accessible pour les utilisateurs.

Les grands acteurs

UptimeRobot : gratuit jusqu'à 50 sites avec vérification toutes les 5 minutes. Better Uptime : moderne, interface soignée, fonctionnalités avancées. Pingdom : historique, orienté performance avec données détaillées. StatusCake : bon rapport qualité/prix. Datadog, New Relic intègrent la supervision dans des suites plus larges. Certaines solutions plus orientées professionnel comme monitoring de site offrent des vérifications depuis plusieurs points du globe et des notifications multi-canaux.

Les types de vérifications

HTTP/HTTPS simple : le serveur répond-il en 200 ? TCP : le port est-il ouvert ? Ping ICMP : le serveur répond-il ? Contenu : la page contient-elle le mot-clé attendu ? API : la réponse JSON a-t-elle la forme attendue ? Adapter selon ce qu'on souhaite valider.

La fréquence

Toutes les 5 minutes : suffisant pour la plupart des sites, inclus dans les offres gratuites. Toutes les minutes : mieux pour des services critiques, souvent payant. Toutes les 30 secondes : pour les API transactionnelles. Plus fréquent ne sert à rien : les vraies pannes durent plus que ça.

Les notifications

Email, SMS, appel téléphonique, notifications mobiles, Slack, Discord, Microsoft Teams, webhook. Les outils modernes proposent tous ces canaux. Pour les services critiques, privilégier SMS et appels qui interrompent même la nuit.

Les status pages

Une page publique qui affiche l'état de vos services en temps réel. StatusPage (Atlassian), Instatus, Statuspal. Utile pour la communication externe pendant les incidents et pour rassurer les utilisateurs sur la fiabilité globale.

L'astreinte structurée

PagerDuty, OpsGenie : outils qui gèrent la rotation d'astreinte, les escalades automatiques si personne ne répond, les conf calls en cas d'incident majeur. Indispensables pour les équipes ops qui opèrent des services critiques.

Gérer les faux positifs

Un monitoring trop sensible crée des alertes inutiles qui finissent par être ignorées. Configurer : vérification depuis 2 ou 3 localisations avant alerte, tolérance de quelques échecs consécutifs, seuils ajustés à la réalité. Moins d'alertes, mais des alertes qui comptent.

Au-delà de l'uptime

L'uptime seul ne suffit pas : un site peut être accessible mais très lent. Monitorer aussi les temps de réponse, les performances réelles (Core Web Vitals). Coupler uptime et APM donne une vision complète. Pour plus d'informations, consultez nos articles performance et monitoring d'hébergement et guide complet de l'hébergement.