Cum funcționează monitorizarea uptime-ului site-urilor web în 2026
Un serviciu care atinge 99,99% uptime este offline mai puțin de 53 de minute pe an. Scade la 99,9% și pierzi peste opt ore. Monitorizarea uptime-ului este acea mică bucată de infrastructură care surprinde acele minute chiar în momentul în care se întâmplă. Acest ghid explică modul în care funcționează, ce să monitorizezi, cât de des să verifici și greșelile care transformă un instrument util în zgomot de fundal.
Ce face de fapt un monitor de uptime
Un monitor de uptime rulează o mică buclă. De pe un server aflat undeva pe internetul public, trimite o cerere către o țintă pe care o desemnezi. Înregistrează răspunsul, codul de stare și cât a durat dus-întorsul. Apoi așteaptă intervalul ales și încearcă din nou.
Sonda trăiește în afara infrastructurii tale intenționat. Dacă ai monitoriza din interiorul propriei rețele, nu ai surprinde căderile care arată bine din interior, dar afectează utilizatorii reali. Aceasta este diferența dintre monitorizarea sintetică (un sondor extern) și monitorizarea utilizatorilor reali (telemetrie de la vizitatorii reali). Majoritatea echipelor folosesc ambele. Monitorizarea uptime-ului este partea sintetică.
Ce poți monitoriza efectiv
Instrumentele moderne de uptime acoperă mai mult decât HTTP. Cele nouă tipuri de sonde pe care le vei vedea pe piață răspund toate la o întrebare ușor diferită.
- HTTP verifică returnează un cod de stare și un timp de răspuns pentru orice URL.
- Ping (ICMP) verifică dacă o gazdă răspunde la nivel de rețea.
- SSL verifică câte zile au mai rămas din certificatul tău.
- DNS verifică dacă înregistrările A, AAAA, MX, TXT sau NS încă se rezolvă la valorile așteptate.
- Port TCP verifică dacă un serviciu ascultă pe un port dat sau dacă unul care ar trebui să fie închis este brusc deschis.
- WHOIS urmărește expirarea înregistrării numelui tău de domeniu.
- Blacklist verifică dacă IP-ul tău de trimitere a ajuns pe Spamhaus, SORBS sau liste similare.
- Heartbeat inversează relația: job-ul tău trimite ping monitorului, iar tu primești alertă când se oprește.
Cât de des să verifici
Frecvența de verificare este un compromis între acuratețe și zgomot. O cadență mai rapidă surprinde căderi mai scurte, dar produce mai multe rezultate fals pozitive din cauza fluctuațiilor tranzitorii ale rețelei. O cadență mai lentă atenuează zgomotul, dar ratează căderile scurte care totuși contează pentru bugetul tău de erori.
O valoare implicită pragmatică: 60 de secunde pentru HTTP și ping la servicii importante, 5 minute pentru pagini cu prioritate scăzută, 15 minute pentru SSL, orar pentru WHOIS. Coboară la 30 de secunde doar pentru servicii unde timpul de nefuncționare te costă măsurabil bani pe minut. Coborârea sub 30 de secunde rareori îți îmbunătățește rezultatul și produce adesea oboseală de alertă.
Direcționarea alertelor fără zgomot
O alertă pe care nu o citește nimeni este mai rea decât lipsa unei alerte. Trei reguli acoperă majoritatea echipelor.
- Trimite DOWN către un singur canal în mod implicit, ideal cel pe care echipa ta îl verifică deja (Slack, Discord, Telegram sau e-mail).
- Folosește o regulă de prag de cel puțin 3 eșecuri consecutive înainte de a trimite o alertă. O verificare ratată este zgomot. Trei la rând sunt semnal.
- Direcționează serviciile critice către un instrument de paging (PagerDuty, Opsgenie) printr-un webhook semnat. Direcționează restul către chat. Confirmă incidentele pentru a opri pager-ul odată ce un om se ocupă de ele.
Greșelile care ucid programele de uptime
Prima greșeală este să monitorizezi doar pagina de pornire. O pagină de pornire funcțională nu îți spune aproape nimic despre fluxul de checkout sau despre API-ul cu care vorbește aplicația ta mobilă. Adaugă monitoare HTTP specifice pentru URL-urile care contează cel mai mult pentru venituri sau pentru încărcarea suportului tău.
A doua greșeală este distribuirea silențioasă. Fiecare monitor declanșează fiecare canal, apoi fiecare membru al echipei le dezactivează pe cele zgomotoase, iar incidentul real apare într-un canal dezactivat. Definește o singură rută implicită, direcționează excepțiile către persoane specifice și revizuiește-ți regulile trimestrial.
O configurare de început în 10 minute
Dacă pornești de la zero, secvența practică este scurtă. Creează un monitor HTTP pe URL-ul tău principal cu un interval de 60 de secunde. Creează un monitor SSL pe același nume de gazdă cu o fereastră de avertizare de 30 de zile. Creează o regulă de notificare care direcționează DOWN către chat-ul echipei tale. Adaugă o pagină de stare dacă ai utilizatori externi cărora le pasă de uptime. Adaugă heartbeat-uri pentru job-urile cron care rulează facturarea, rapoartele și backup-urile. Acum ești înaintea operatorului median.
Încearcă MonitorAH gratuit
Trei monitoare, alerte în mai puțin de un minut, fără card de credit. Acoperă un site web și un job cron în timpul în care citești acest paragraf.
Începe monitorizareaArticole conexe
How Much Does Website Downtime Cost? A Practical Calculator
How to calculate the real cost of downtime for your business, with a framework that does not require pretending to be Amazon.
SOC 2 Audit Logging for Monitoring Tools: What Auditors Look For
What SOC 2 auditors actually look for in monitoring tools, what to log, and how to demonstrate the controls that pass the audit.