← Toate articolele
Primii pași · 8 min de citire

Cum funcționează monitorizarea uptime-ului site-urilor web în 2026

Server racks in a data center with status lights showing active monitoring.

Un serviciu care atinge 99,99% uptime este offline mai puțin de 53 de minute pe an. Scade la 99,9% și pierzi peste opt ore. Monitorizarea uptime-ului este acea mică bucată de infrastructură care surprinde acele minute chiar în momentul în care se întâmplă. Acest ghid explică modul în care funcționează, ce să monitorizezi, cât de des să verifici și greșelile care transformă un instrument util în zgomot de fundal.

Ce face de fapt un monitor de uptime

Un monitor de uptime rulează o mică buclă. De pe un server aflat undeva pe internetul public, trimite o cerere către o țintă pe care o desemnezi. Înregistrează răspunsul, codul de stare și cât a durat dus-întorsul. Apoi așteaptă intervalul ales și încearcă din nou.

Sonda trăiește în afara infrastructurii tale intenționat. Dacă ai monitoriza din interiorul propriei rețele, nu ai surprinde căderile care arată bine din interior, dar afectează utilizatorii reali. Aceasta este diferența dintre monitorizarea sintetică (un sondor extern) și monitorizarea utilizatorilor reali (telemetrie de la vizitatorii reali). Majoritatea echipelor folosesc ambele. Monitorizarea uptime-ului este partea sintetică.

Ce poți monitoriza efectiv

Instrumentele moderne de uptime acoperă mai mult decât HTTP. Cele nouă tipuri de sonde pe care le vei vedea pe piață răspund toate la o întrebare ușor diferită.

  • HTTP verifică returnează un cod de stare și un timp de răspuns pentru orice URL.
  • Ping (ICMP) verifică dacă o gazdă răspunde la nivel de rețea.
  • SSL verifică câte zile au mai rămas din certificatul tău.
  • DNS verifică dacă înregistrările A, AAAA, MX, TXT sau NS încă se rezolvă la valorile așteptate.
  • Port TCP verifică dacă un serviciu ascultă pe un port dat sau dacă unul care ar trebui să fie închis este brusc deschis.
  • WHOIS urmărește expirarea înregistrării numelui tău de domeniu.
  • Blacklist verifică dacă IP-ul tău de trimitere a ajuns pe Spamhaus, SORBS sau liste similare.
  • Heartbeat inversează relația: job-ul tău trimite ping monitorului, iar tu primești alertă când se oprește.

Cât de des să verifici

Frecvența de verificare este un compromis între acuratețe și zgomot. O cadență mai rapidă surprinde căderi mai scurte, dar produce mai multe rezultate fals pozitive din cauza fluctuațiilor tranzitorii ale rețelei. O cadență mai lentă atenuează zgomotul, dar ratează căderile scurte care totuși contează pentru bugetul tău de erori.

O valoare implicită pragmatică: 60 de secunde pentru HTTP și ping la servicii importante, 5 minute pentru pagini cu prioritate scăzută, 15 minute pentru SSL, orar pentru WHOIS. Coboară la 30 de secunde doar pentru servicii unde timpul de nefuncționare te costă măsurabil bani pe minut. Coborârea sub 30 de secunde rareori îți îmbunătățește rezultatul și produce adesea oboseală de alertă.

Direcționarea alertelor fără zgomot

O alertă pe care nu o citește nimeni este mai rea decât lipsa unei alerte. Trei reguli acoperă majoritatea echipelor.

  • Trimite DOWN către un singur canal în mod implicit, ideal cel pe care echipa ta îl verifică deja (Slack, Discord, Telegram sau e-mail).
  • Folosește o regulă de prag de cel puțin 3 eșecuri consecutive înainte de a trimite o alertă. O verificare ratată este zgomot. Trei la rând sunt semnal.
  • Direcționează serviciile critice către un instrument de paging (PagerDuty, Opsgenie) printr-un webhook semnat. Direcționează restul către chat. Confirmă incidentele pentru a opri pager-ul odată ce un om se ocupă de ele.

Greșelile care ucid programele de uptime

Prima greșeală este să monitorizezi doar pagina de pornire. O pagină de pornire funcțională nu îți spune aproape nimic despre fluxul de checkout sau despre API-ul cu care vorbește aplicația ta mobilă. Adaugă monitoare HTTP specifice pentru URL-urile care contează cel mai mult pentru venituri sau pentru încărcarea suportului tău.

A doua greșeală este distribuirea silențioasă. Fiecare monitor declanșează fiecare canal, apoi fiecare membru al echipei le dezactivează pe cele zgomotoase, iar incidentul real apare într-un canal dezactivat. Definește o singură rută implicită, direcționează excepțiile către persoane specifice și revizuiește-ți regulile trimestrial.

O configurare de început în 10 minute

Dacă pornești de la zero, secvența practică este scurtă. Creează un monitor HTTP pe URL-ul tău principal cu un interval de 60 de secunde. Creează un monitor SSL pe același nume de gazdă cu o fereastră de avertizare de 30 de zile. Creează o regulă de notificare care direcționează DOWN către chat-ul echipei tale. Adaugă o pagină de stare dacă ai utilizatori externi cărora le pasă de uptime. Adaugă heartbeat-uri pentru job-urile cron care rulează facturarea, rapoartele și backup-urile. Acum ești înaintea operatorului median.

Încearcă MonitorAH gratuit

Trei monitoare, alerte în mai puțin de un minut, fără card de credit. Acoperă un site web și un job cron în timpul în care citești acest paragraf.

Începe monitorizarea

Articole conexe