open-falcon硬件監控插件腳本:hwcheck
硬件狀態監控插件腳本
使用dell的srvadmin工具等組件實現硬件監控,需要安裝falcon-agent
僅支持dell物理機,可以監控的指標有:
cpu 內存 陣列卡 物理磁盤 虛擬磁盤 陣列卡電池 BIOS 主板電池 風扇 電壓 主板溫度 cpu溫度
如何安裝
- 配置dell官方repo,安裝srvadmin等依賴包
#參考: http://linux.dell.com/repo/hardware/latest/ wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash yum install srvadmin-omacore srvadmin-omcommon srvadmin-storage-cli smbios-utils-bin lm_sensors dmidecode cronie # 啟動srvadmin服務 /opt/dell/srvadmin/sbin/srvadmin-services.sh enable /opt/dell/srvadmin/sbin/srvadmin-services.sh restart # 配置lm-sensors echo yes | /usr/sbin/sensors-detect
你也可以打包rpm來簡化部署
git clone https://github.com/51web/hwcheck hwcheck-0.2 tar czf hwcheck-0.2.tar.gz hwcheck-0.2 rpmbuild -tb hwcheck-0.2.tar.gz
如何使用
參數說明
直接執行hwcheck不帶參數默認會打印出詳細的監控數據
hwcheck -d # 打印metrics信息,即是push到falcon-agent的數據 -p # push數據到falcon-agent -s # 設置push數據中的STEP數值,表示監控頻率,默認值是600秒 -m # 指定單個metric
配置crontab
配置cron來定期檢測,如:
cat /etc/cron.d/hwcheck PATH=/sbin:/bin:/usr/sbin:/usr/bin:/opt/dell/srvadmin/sbin:/opt/dell/srvadmin/bin SHELL=/bin/bash 18 * * * * root /usr/bin/hwcheck -s 3600 -p >/dev/null 2>&1 &
表示每個小時執行一次檢測,相應的STEP值被設置為3600
falcon-portal中配置報警策略
hwcheck push到falcon-agent的metric均以 hw 打頭,如hw.cpu_temp,除溫度是實際的數值外,
其他metric的value中 0表示故障,1表示警告,2表示OK,例如在portal中配置如下策略:
metric/tags/note | condition | max | P |
---|---|---|---|
hw.bios [BIOS中C1E/Cstate未禁用] | all(#2)<2 | 1 | 4 |
hw.board_temp [主板溫度過高] | all(#3)>=35 | 1 | 4 |
hw.cmos_bat [主板電池有問題] | all(#3)<2 | 1 | 4 |
hw.cpu [CPU可能故障] | all(#2)==1 | 1 | 4 |
hw.cpu [嚴重: CPU嚴重故障] | all(#2)==0 | 2 | 0 |
hw.fan [風扇出現故障] | all(#3)<2 | 1 | 4 |
hw.memory [內存可能故障] | all(#1)==1 | 1 | 4 |
hw.memory [嚴重: 內存嚴重故障] | all(#1)==0 | 2 | 0 |
hw.pdisk [嚴重: 物理盤嚴重故障] | all(#1)==0 | 2 | 0 |
hw.raidcard [陣列卡出現警告] | all(#2)==1 | 1 | 4 |
hw.raidcard [嚴重: 陣列卡嚴重故障] | all(#1)==0 | 2 | 0 |
hw.raidcard_bat [陣列卡電池出現警告] | all(#2)==1 | 1 | 4 |
hw.raidcard_bat [嚴重: 陣列卡電池嚴重故障] | all(#2)==0 | 2 | 0 |
hw.vdisk [磁盤陣列出現警告] | all(#2)==1 | 1 | 4 |
hw.vdisk [嚴重: 磁盤陣列嚴重故障] | all(#2)==0 | 2 | 0 |
本文由用戶 wb26 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!