- 모니터링, 시스템의 성능과 상태를 실시간으로 추적하고 분석하는 활동
- 인프라나 어플리케이션의 성능을 적절히 유지하고, 문제가 발생하기 전 사전 조치를 취하거나, 문제 발생 시 대응하기 위한 방안
분류
- 모니터링은 크게 두 가지로 나눌 수 있는데, 인프라 모니터링과 어플리케이션 모니터링으로 나눌 수 있다
Infrastructure Monitoring
- 인프라 모니터링은 어플리케이션이 동작하는 서버, 네트워크, 데이터베이스, 클라우드 같은 리소스들의 상태와 성능을 추적한다
주요 지표
- CPU 사용량 : 서버의 중앙 처리 장치가 얼마나 사용되고 있는지
- 메모리 사용량 : 서버가 메모리를 얼마나 사용하고 있는지
- 디스크 사용량 : 시스템 저장소가 얼마나 사용 중인지
- 네트워크 상태 : 네트워크 트래픽, 지연 시간, 패킷 손실은 얼마나 있는지
관련 Tool
Datadog
Application Monitoring
- 어플리케이션 모니터링은 어플리케이션의 내부 상태와 성능 측정을 목표로 한다
주요 지표
- 응답 시간 : 사용자가 요청을 보낸 시점부터 응답을 받기까지의 걸리는 시간
- 처리량 : 어플리케이션이 주어진 시간 내 처리할 수 있는 요청 갯수
- 오류 비율 : 시스템에서 발생한 에러, 오류의 비율