open-falcon硬件監控插件腳本:hwcheck

wb26 9年前發布 | 44K 次閱讀 hwcheck

硬件狀態監控插件腳本

使用dell的srvadmin工具等組件實現硬件監控,需要安裝falcon-agent

僅支持dell物理機,可以監控的指標有:

cpu 內存 陣列卡 物理磁盤 虛擬磁盤 陣列卡電池 BIOS 主板電池 風扇 電壓 主板溫度 cpu溫度

如何安裝

  1. 配置dell官方repo,安裝srvadmin等依賴包
#參考: http://linux.dell.com/repo/hardware/latest/
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

yum install srvadmin-omacore srvadmin-omcommon srvadmin-storage-cli smbios-utils-bin lm_sensors dmidecode cronie
# 啟動srvadmin服務
/opt/dell/srvadmin/sbin/srvadmin-services.sh enable
/opt/dell/srvadmin/sbin/srvadmin-services.sh restart
# 配置lm-sensors
echo yes | /usr/sbin/sensors-detect

你也可以打包rpm來簡化部署

git clone https://github.com/51web/hwcheck hwcheck-0.2
tar czf hwcheck-0.2.tar.gz hwcheck-0.2
rpmbuild -tb hwcheck-0.2.tar.gz

如何使用

參數說明

直接執行hwcheck不帶參數默認會打印出詳細的監控數據

hwcheck -d      # 打印metrics信息,即是push到falcon-agent的數據
        -p      # push數據到falcon-agent
        -s      # 設置push數據中的STEP數值,表示監控頻率,默認值是600秒
        -m      # 指定單個metric

配置crontab

配置cron來定期檢測,如:

cat /etc/cron.d/hwcheck
PATH=/sbin:/bin:/usr/sbin:/usr/bin:/opt/dell/srvadmin/sbin:/opt/dell/srvadmin/bin
SHELL=/bin/bash

18 * * * * root /usr/bin/hwcheck -s 3600 -p >/dev/null 2>&1 &

表示每個小時執行一次檢測,相應的STEP值被設置為3600

falcon-portal中配置報警策略

hwcheck push到falcon-agent的metric均以 hw 打頭,如hw.cpu_temp,除溫度是實際的數值外,

其他metric的value中 0表示故障,1表示警告,2表示OK,例如在portal中配置如下策略:

metric/tags/note condition max P
hw.bios [BIOS中C1E/Cstate未禁用] all(#2)<2 1 4
hw.board_temp [主板溫度過高] all(#3)>=35 1 4
hw.cmos_bat [主板電池有問題] all(#3)<2 1 4
hw.cpu [CPU可能故障] all(#2)==1 1 4
hw.cpu [嚴重: CPU嚴重故障] all(#2)==0 2 0
hw.fan [風扇出現故障] all(#3)<2 1 4
hw.memory [內存可能故障] all(#1)==1 1 4
hw.memory [嚴重: 內存嚴重故障] all(#1)==0 2 0
hw.pdisk [嚴重: 物理盤嚴重故障] all(#1)==0 2 0
hw.raidcard [陣列卡出現警告] all(#2)==1 1 4
hw.raidcard [嚴重: 陣列卡嚴重故障] all(#1)==0 2 0
hw.raidcard_bat [陣列卡電池出現警告] all(#2)==1 1 4
hw.raidcard_bat [嚴重: 陣列卡電池嚴重故障] all(#2)==0 2 0
hw.vdisk [磁盤陣列出現警告] all(#2)==1 1 4
hw.vdisk [嚴重: 磁盤陣列嚴重故障] all(#2)==0 2 0

項目主頁:http://www.baiduhome.net/lib/view/home/1440056979176

 本文由用戶 wb26 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!