목록으로

Programming Notes

모니터링이 정말로 잘 작동하고 있나요? 모니터링 커버리지(Monitoring Coverage)의 새로운 소식

모니터링은 올바른 신호가 수집되고, 적절한 경고(Alert)가 설정되어 있으며, 팀이 필요할 때 데이터가 실제로 흐르고 있을 때만 유용합니다. 대규모 Azure 환경에서 모든 VM과 AKS 클러스터에 대해 이 세 가지를 확인하는 작업은 여전히 많은 수동 작업이 필요할 수 있습니다.

Microsoft Ignite에서 Microsoft는 Azure 리소스 전체의 커버리지 공백을 찾아내고 권장되는 VM 및 컨테이너 모니터링을 대규모로 활성화할 수 있는 중앙 집중식 프리뷰 환경인 Azure Monitor의 '모니터링 커버리지(Monitoring Coverage)'를 도입했습니다. 이번 Microsoft Build에서는 모니터링을 더 쉽게 운영할 수 있도록 돕는 두 가지 새로운 기능인 **데이터 흐름 상태(data flow status)**와 VM 및 AKS를 위한 대규모 권장 경고 활성화 기능을 추가하여 해당 환경을 확장했습니다.

이러한 업데이트를 통해 팀은 단순히 모니터링이 구성되었는지 묻는 수준을 넘어설 수 있습니다. 이제 권장 모니터링이 활성화되었는지, 중요한 경고 커버리지가 누락되지는 않았는지, 그리고 구성 문제로 인해 모니터링 데이터가 목적지에 도달하지 못하고 있는 것은 아닌지를 직접 확인할 수 있습니다.

 

권장 사항 및 데이터 흐름 상태가 포함된 모니터링 커버리지 개요 권장 사항 및 데이터 흐름 상태가 포함된 모니터링 커버리지 개요.

모니터링 커버리지란 무엇인가요?

Azure Monitor의 모니터링 커버리지는 지원되는 Azure 리소스 전체에서 권장 모니터링 설정을 검토할 수 있는 단일 지점을 제공합니다. 개요(Overview) 페이지는 선택한 범위의 커버리지를 요약하여 보여주고, Azure Advisor의 관측성(Observability) 권장 사항을 표시하며, 권장 모니터링 설정을 활성화할 수 있는 빠른 작업을 제공합니다.

커버리지는 기본(Basic), 부분(Partial), 향상(Enhanced) 모니터링으로 그룹화되어 리소스가 기본 모니터링만 사용 중인지, 아니면 Microsoft에서 권장하는 구성이 활성화되어 있는지 신속하게 파악할 수 있습니다. 여기에서 '모니터링 세부 정보(Monitoring Details)' 탭으로 이동하여 개별 리소스를 검토하고 조치를 취할 수 있습니다.

신규 기능: 데이터 흐름 상태

모니터링을 활성화한 후 가장 중요한 질문은 단순합니다. "데이터가 흐르고 있는가?"입니다. 데이터 흐름 상태 기능은 모니터링 커버리지 화면에서 이 질문에 직접 답해 줍니다.

새로운 데이터 흐름 상태 요약은 주의가 필요한 리소스, 초기 검사를 통과한 리소스, 유효성 검사가 구성되지 않은 리소스가 각각 몇 개인지 보여줍니다. 또한 주의가 필요한 상위 리소스를 강조 표시하여 운영자가 가장 중요한 문제부터 먼저 처리할 수 있도록 돕습니다.

리소스에 대한 데이터 흐름 상태를 열면 Azure Monitor는 다음과 같은 영역에 대해 유효성 검사를 수행합니다.

  • 리소스 구성
  • 데이터 수집 규칙(DCR) 연결
  • 네트워크 연결
  • 구성된 목적지로의 데이터 흐름

감지된 문제는 세부 정보 창 상단에 우선순위에 따라 표시되며, 각 유효성 검사 항목에는 권장 조치 사항이 포함됩니다. 수정한 후에는 유효성 검사를 다시 실행하여 데이터 흐름 문제가 해결되었는지 확인할 수 있습니다.

 

유효성 검사 및 권장 조치가 포함된 데이터 흐름 상태 세부 정보 유효성 검사 및 권장 조치가 포함된 데이터 흐름 상태 세부 정보.

 

데이터 흐름 시각화 및 문제 식별 또는 데이터 흐름을 시각화하여 문제를 식별할 수도 있습니다.

신규 기능: 대규모 권장 경고 활성화

이제 모니터링 커버리지는 경고 공백을 메우는 데도 도움을 줍니다. 개요 페이지에서 'VM 권장 경고 활성화' 및 'AKS 권장 경고 활성화'와 같은 권장 사항을 확인한 후, '적용(Apply)'을 선택하여 중앙 집중식 흐름에서 권장 경고 규칙을 구성할 수 있습니다.

가상 머신의 경우, 전체 구독에 대해 경고를 활성화하거나 선택한 리소스에 대해서만 활성화할 수 있습니다. 구독 범위는 선택한 구독의 향후 VM을 포함하여 경고가 광범위하게 적용되기를 원할 때 유용합니다. 선택한 리소스 범위는 특정 VM 세트에 대해 경고 규칙을 활성화하려는 경우 더 세밀한 제어를 제공합니다.

활성화 프로세스를 통해 권장 경고 규칙을 검토하고, 임계값을 조정하며, 이메일, Azure Resource Manager 역할 알림, Azure 모바일 앱 알림 또는 기존 액션 그룹과 같은 알림 옵션을 구성할 수 있습니다. 일부 VM에는 이미 경고가 구성되어 있을 수 있으며, 새로운 규칙은 기존 경고와 중복되지 않도록 설계되었습니다.

AKS의 경우, 모니터링 커버리지는 권장 경고 공백을 찾아내고 동일한 안내 패턴을 시작합니다. 영향을 받는 리소스를 검토하고, 권장 경고 설정을 구성한 후 '검토 + 활성화'를 사용하여 경고 규칙을 생성합니다.

 

VM 권장 경고 활성화 VM 권장 경고 활성화

후속 조치를 위한 리소스 중심 뷰

'모니터링 세부 정보(Monitoring Details)' 탭은 커버리지와 데이터 흐름을 동일한 리소스 목록으로 가져옵니다. 특히 '모니터링 커버리지'와 '데이터 흐름 상태'라는 두 개의 열이 분류 작업에 유용합니다. 두 값 중 하나를 선택하면 리소스 수준의 세부 정보가 열립니다.

모니터링 커버리지 세부 정보에는 VM 인사이트, 권장 경고, 데이터 수집 규칙, 데이터 소스, 목적지 및 사용 가능한 경우 에이전트 버전 등 리소스에 구성된 내용이 표시됩니다. 데이터 흐름 세부 정보는 유효성 검사 결과와 권장 수정 단계를 보여줍니다. 이를 통해 상위 수준의 공백 확인에서 주의가 필요한 특정 리소스 및 구성으로 쉽게 이동할 수 있습니다.

시작하기

모니터링 커버리지는 Azure Portal에서 프리뷰로 제공됩니다. Monitor를 열고 '모니터링 커버리지(프리뷰)'를 선택한 후 검토하려는 구독과 리소스를 선택하세요.

개요 페이지에서 다음을 수행할 수 있습니다.

  • VM 및 AKS 리소스 전체의 커버리지 검토
  • 권장 사항을 적용하여 VM 인사이트, 컨테이너 모니터링 및 권장 경고 활성화
  • 데이터 흐름 상태를 사용하여 모니터링 데이터에 주의가 필요한 리소스 찾기
  • 리소스 수준의 커버리지 및 유효성 검사 결과를 위해 모니터링 세부 정보 열기

프리뷰 관련 참고 사항: 활성화 작업은 한 번에 최대 100개의 리소스까지 포함할 수 있으며, 모니터링 또는 경고 규칙을 활성화하면 데이터 수집 규칙이 생성되거나 Azure Monitor 에이전트 배포, 목적지 구성 또는 경고 규칙 생성이 이루어질 수 있습니다. 데이터 수집, 작업 영역 수집 및 경고 규칙에는 활성화한 설정에 따라 비용이 발생할 수 있습니다.

자세한 내용은 Azure Monitor의 모니터링 커버리지(프리뷰)를 참조하세요.

향후 전망

모니터링 커버리지는 Azure Monitor를 대규모로 더 쉽게 운영할 수 있도록 만들기 위한 지속적인 노력의 일환입니다. 저희는 팀이 모니터링 공백을 찾는 데 시간을 덜 쓰고, 신뢰할 수 있고 검증된 신호를 바탕으로 행동하는 데 더 많은 시간을 할애하기를 바랍니다.

이러한 새로운 Build 업데이트를 사용해 보시고, 지원 리소스 유형을 확장해 나가는 과정에서 여러분의 피드백을 기다리겠습니다. Azure Portal의 피드백 옵션을 사용하거나 Microsoft 계정 팀을 통해 피드백을 공유해 주세요.