오퍼링 > 소프트웨어 테크놀로지 서비스 > 오픈소스 SW > OS > 자료실

오픈소스 SW 자료실 - OS

오픈소스 OS 관련 기술서비스 정보 및 자료를 제공합니다.

High CPU load detected 이벤트가 발생합니다

2021.02.25

Question.


메시지 로그에 아래와 같이 High CPU load detected 이벤트가 자주 발생합니다.

High CPU load detected 이벤트가 자주 발생

 

Answer.


해당 이벤트는 클러스터에서 해당 노드에 대한 높은 Load Average 로 인해 노드에서 작업을 조절하고 있음을 나타내는 이벤트입니다.
Load Average 가 높아져 throttle_mode 가 high 가 되는 경우 Pacemaker 에서 수행되는 작업을 1개로 제한합니다.
클러스터에서 발생되는 작업에 대한 Delay 가 발생할 경우 리소스 Timeout 으로 인한 Fail Over 발생 할 수 있습니다.

Load Average 로 인해 노드에서 작업을 조절하고 있음을 나타내는 이벤트

throttle_mode(high, medium, low) 의 load threshold 계산 방식은 아래와 같습니다.

throttle_mode(high, medium, low) 의 load threshold 계산 방식
[참고]
https://github.com/ClusterLabs/pacemaker/blob/master/daemons/controld/controld_throttle.c

throttle_load_target 값은 load-threshold 를 100으로 나눈 수치이며,
# pcs property show --all | grep threshold 명령을 통해 현재 설정된 수치 확인이 가능합니다.
Default 값은 load-threshold: 80% 입니다.

Default 값은 load-threshold: 80% 입니다.

따라서, 1분간의 Load Average 가 throttle_mode HIGH 값을 초과할 경우 High CPU throttling 에 걸리게됩니다.
이때 시스템 부하가 발생하는 근본적인 원인을 찾아 해결 한 뒤 클러스터 서비스에 영향이 없도록 조치하는 것을 권고드립니다.