1、監(jiān)控系統(tǒng)概念
監(jiān)控系統(tǒng)應(yīng)用在監(jiān)控硬件、軟件和業(yè)務(wù)上,并及時(shí)獲取相應(yīng)的數(shù)據(jù)并分析保存數(shù)據(jù),發(fā)送報(bào)警通知管理者,并自動(dòng)做出相應(yīng)的處理,通過接口展示以利于運(yùn)維人員分析,保證業(yè)務(wù)的正常運(yùn)行。
2、運(yùn)維監(jiān)控系統(tǒng)具備以下幾個(gè)模塊:
采樣:從被監(jiān)控主機(jī)上周期性地獲取某個(gè)關(guān)注指標(biāo)相關(guān)的數(shù)據(jù),常見獲取數(shù)據(jù)通道有:ssh/telnet、agent、IPMI、SNMP、JMX等等
存儲(chǔ):用于存儲(chǔ)被監(jiān)控主機(jī)采樣的數(shù)據(jù)和分析的數(shù)據(jù),利于調(diào)用和分析,常用的有mysql、mariadb等數(shù)據(jù)庫
數(shù)據(jù):分析被監(jiān)控主機(jī)采樣數(shù)據(jù),計(jì)算出歷史數(shù)據(jù)、趨勢(shì)數(shù)據(jù)、速率、最大最小值等等。
展示:將被監(jiān)控主機(jī)的數(shù)據(jù)通過圖表方式展現(xiàn)出來,利于觀察比對(duì),常見的展示接口有:webGUI、GUI、APP等等。
報(bào)警:當(dāng)被監(jiān)控主機(jī)發(fā)生異常時(shí),系統(tǒng)用于通知相關(guān)人員的報(bào)警媒介。常用的報(bào)警媒介有:郵件、短信、微信或通過腳本實(shí)施。
3、被監(jiān)控對(duì)象: 主機(jī)、服務(wù)器、交換機(jī)、路由器、ups等
NMS:網(wǎng)絡(luò)監(jiān)控主機(jī)NMS是移動(dòng)通信網(wǎng)中的網(wǎng)絡(luò)管理系統(tǒng),它的管理對(duì)象可以包括網(wǎng)絡(luò)中所有的實(shí)體,如:網(wǎng)絡(luò)設(shè)備、應(yīng)用程序、服務(wù)器系統(tǒng)、路由器、交換機(jī)、HUB、輔助設(shè)備(如UPS電源)等,給網(wǎng)絡(luò)系統(tǒng)管理員提供一個(gè)全系統(tǒng)的網(wǎng)絡(luò)視圖。
4、監(jiān)控系統(tǒng)采取的數(shù)據(jù)通道
ssh/telnet:安全傳輸協(xié)議
agent方式:代理方式,由監(jiān)控主機(jī)(master)和安裝代理進(jìn)程的被監(jiān)控主機(jī)(agent)組成
ipmi:因特爾智慧平臺(tái),硬件監(jiān)控接口
snmp:簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議,版本有 v1,v2(community ,pulic)v3
JMX:java管理擴(kuò)展
jvm:監(jiān)控java虛擬機(jī)
5、儲(chǔ)存系統(tǒng)
歷史數(shù)據(jù) :每次采樣的結(jié)果。保存時(shí)長較短
趨勢(shì)數(shù)據(jù): 聚合數(shù)據(jù),保存時(shí)長較長周期內(nèi)的數(shù)據(jù)
存儲(chǔ)系統(tǒng):
關(guān)系型數(shù)據(jù)庫: mysql pgsql oracle
rrd: roudrobin database
nosql:redis、mongo、時(shí)間序列數(shù)據(jù)庫