Zabbix是一個企業級的開源分布式監控解決方案,由一個國外的團隊持續維護更新,軟件可以自由下載使用,運作團隊靠提供收費的技術支持贏利
歷史來源Nagios全名為(Nagios Ain’t Goona Insiston Saintood),最初項目名字是NetSaint。它是一款免費的開源IT基礎設施監控系統,其功能強大,靈活性強,能有效監控Windows、Linux、VMware和Unix主機狀態,交換機、路由器等網絡設置等。一旦主機或服務狀態出現異常時,會發出郵件或短信報警第一時間通知IT運營人員,在狀態恢復后發出正常的郵件或短信通知。Nagios結構簡單,可維護性強,越來越受中小企業青睞,以及運維和管理人員的使用。同時提供一個可選的基于瀏覽器的Web界面,方便管理人員查看系統的運行狀態,網絡狀態、服務狀態、日志信息,以及其他異常現象.
Ganglia是UCBerkeley發起的一個開源集群監視項目,設計用于測量數以千計的節點。Ganglia的核心包含gmond、gmetad以及一個Web前端。主要是用來監控系統性能,如:cpu、mem、硬盤利用率,I/O負載、網絡流量情況等,通過曲線很容易見到每個節點的工作狀態,對合理調整、分配系統資源,提高系統整體性能起到重要作用。看下ganglia監控的一個圖:可以很只直觀的觀察系統的各個指標,特別是對于分布式系統來說,無疑非常重要,而且Hadoop,Hbase提供了集成了ganglia的配置文件。
Ganglia是一個監控服務器,集群的開源軟件,能夠用曲線圖表現最近一個小時,最近一天,最近一周,最近一月,最近一年的服務器或者集群的cpu負載,內存,網絡,硬盤等指標。 Ganglia的強大在于:ganglia服務端能夠通過一臺客戶端收集到同一個網段的所有客戶端的數據,ganglia集群服務端能夠通過一臺服務端收集到它下屬的所有客戶端數據。這個體系設計表示一臺服務器能夠通過不同的分層能夠管理上萬臺機器。這個功能是其他mrtg,nagios,cacti所不能比擬。
開源軟件,UC Berkeley可擴展的分布式監控系統可以監控多個集群和節點使用多種協議傳輸信息使用開源標準XML,XDR,RRDTool APR Apache Httpd server PHP web前端組成部分Gmond在被監控節點上采集信息Gmetad收集gmond采集的信息,存入RRD中,為前端提供查詢服務ApachehtttpdServer+php頁面展示特點Multicast模式下,集群中所有的gmond節點都可以接收/發送監控信息.
一、介紹Nmon工具是IBM提供的免費的在AIX與各種Linux操作系統上廣泛使用的監控與分析工具。該工具可將服務器的系統資源耗用情況收集起來并輸出一個特定的文件,并可利用excel分析工具nmonanalyser進行數據的統計分析。并且,nmon運行不會占用過多的系統資源,通常情況下CPU利用率不會超過2%。針對不同的操作系統版本,nmon有相應版本的程序。以下介紹AIX版本下的nmon的使用二、安裝首先下載nmon工具,下載時需注意要下載對應的系統版本。我們這里以AIX為例,下載的是nmon4aix_11e.tar.gz版本。
經研究, IAAS與PAAS的監控整合是有可行性的,可在同一套zabbix監控體系中監控IAAS與PAAS。
Ganglia 已經被廣泛應用于服務器集群的狀態和性能監視。它簡單易用的部署和集成、優雅簡潔的 Web 圖形界面、方便的可定制性等特性,在分布式集群產品和服務領域,已經被證明是快速構建產品完整性和測試專業性的很好的工具。 在我們的 BigData 產品開發中,特別是產品原型開發、驗證以及 Demo 中,應該充分快速地利用類似 Ganglia 這樣的開源工具來構建產品的完整性,提供一定程度的可管理性。在分布式系統的系統測試中,特別是系統性能測試,以及面向用戶展示產品的過程中,使用這類工具不僅會使測試數據更加易于呈現,而且更體現其專業性。
安裝 nagios + nagios-plugin + nrpe
Opennms能夠幫助IT管理部門持續的監控分布式的異構系統和網絡設備的運行狀態,它可以支持SNMP網絡管理協議確保管理的擴展性,并且提供非常靈活的定制功能從而有利于管理范圍的伸縮。它內置的故障事件管理以提供故障事件的記錄和分析的能力,快速隔離非根源事件并迅速發現故障原因。Opennms 良好的設計可以快速部署實施,簡單友好的圖形界面能夠使得用戶迅速掌握,從而降低操作的復雜度,提高IT管理效率。
Ganglia是一個跨平臺可擴展的,高 性能計算系統下的分布式監控系統,如集群和網格。它是基于分層設計,它使用廣泛的技術,如XML數據代表,便攜數據傳輸,RRDtool用于數據存儲和可 視化。它利用精心設計的數據結構和算法實現每節點間并發非常低的。它已移植到廣泛的操作系統和處理器架構上,目前在世界各地成千上萬的集群正在使用。它已 被用來連結大學校園和世界各地,可以處理2000節點的規模。<br>Ganglia項目是由加州大學發起的,為了支持依賴計算機進行數據分析的科學研究,Ganglia網站首頁這樣描述的該項目:“努力創建無處不在的、連續不斷的、國家級計算基礎架構:網格”。但目前我們只關心Ganglia監視和顯示關于集群的信息。 注意:與術語集群類似,術語網格用于描述大量的計算系統,它來自科學研究團體,通常被用于描述多個獨立管理的地理上分散的計算集群,使用這個定義,一個網格可以包括一個集群,但一個集群不能包括一個網格,對于網格和集群而言,它們都是并行計算環境。
nagios安裝請參看:Nginx平臺安裝Nagios監控服務 下面是我添加linux監控機的過程,如有錯誤或者不當的地方請指出: 測試環境: 監控主機:nagios+nagios插件+nrpe+網站平臺 192.168.1.210
linux設備/主機性能監測:mrtg----》》》監控流量,cup負載,tcp連接數,磁盤空間等等一般用來做流量監控,配置簡單nagios--->>>>用來監控主機與服務存活狀態,也可以監控負載與磁盤空間等等,帶郵件與短信告警,配置稍微復雜點。cacti----》》》(仙人掌)CPU負載,內存占用,運行進程數,磁盤空間,網卡流量等各種數據信息監測,強大的繪圖功能,十分漂亮,插件無數,可監控幾乎所有內容,缺點是安裝配置復雜,但現在有一鍵安裝盤,方便的很。
Cacti是一種利用RRDtool、snmp、PHP、mysql、apache多種工具而成的一種監控軟件,其源代碼基于PHP腳本編寫并公開。Cacti基于RRDtool存儲監控數據,在查詢指定時間段的監控數據時候不用瀏覽整個數據文件,和mrtg的文本log相比具有更高的效率。監控曲線圖片的生成并不想mrtg那樣和數據采集同步并定時成生,而是通過RRDtool提供的圖片生成工具使用PHP腳本來生成動態web圖片。
基于centos的cacti系統的安裝
Nagios是一款非常優秀的網絡主機管理軟件,它在開源社區的影響力是非同尋常的。但很可惜的是,它的界面及操作使用過程中采用了英語的語言提示與源程序緊密結合使得這款軟件的漢化界面遲遲不能推出,影響了它在中文區的使用。
Cacti+nagios監控配置