如何利用大數(shù)據思維實現(xiàn)無死角運維監(jiān)控？
來源：湖北國菱計算機科技有限公司-荊州網站建設-荊州軟件開發(fā)-政府網站建設公司時間：2018-01-17

羅列出數(shù)據源

主要有工程數(shù)據，業(yè)務數(shù)據。所有的數(shù)據源都有一個共性，就是日志。無論文本的也好，二進制的也好。所以日志是整個信息的源頭。日志包含的信息足以讓我們追查到下面幾件事情：

日志挖掘指標

指標可以再進行分類：

如何統(tǒng)一實現(xiàn)

Storm(或第一幅圖的SparkStreaming)做兩件事情：

需要開發(fā)的地方只有兩個點，有一個是一次性的，有一個則是長期。

先說說一次性的，其實就是大盤展示系統(tǒng)。這個就是從HBase里取出數(shù)據做展示。這個貌似也有開源的一套，ELK。不過底層不是用的HBase存儲，而是ES。

長期的則是SparkStreaming(淘寶是使用Storm，我建議用SparkStreaming,因為SparkStreaming可以按時間窗口，也可以按量統(tǒng)一做計算)，這里你需要定義日志的處理邏輯，生成上面提到的各項指標。

這里有一個什么好處呢，就是平臺化了，對新的監(jiān)控需求響應更快了，開發(fā)到上線可能只要幾個小時的功夫。如果某個系統(tǒng)某天需要一個新的監(jiān)控指標，我們只要開發(fā)個SparkStreaming程序，丟到平臺里去，這事就算完了。

現(xiàn)在，如果你想要監(jiān)控一個系統(tǒng)是不是存活，你不在需要去寫腳本找他的pid看進程是不是存在，系統(tǒng)發(fā)現(xiàn)在一定的周期內沒有日志，就可以認為它死了。而系統(tǒng)如果有異常，比如有大量的慢查詢，大盤一定能展示出來。

大數(shù)據思維

對于運維的監(jiān)控，利用大數(shù)據思維，需要分三步走：

所有系統(tǒng)最可靠的就是日志輸出，系統(tǒng)是不是正常，發(fā)生了什么情況，我們以前是出了問題去查日志，或者自己寫個腳本定時去分析?，F(xiàn)在這些事情都可以整合到一個已有的平臺上，我們唯一要做的就是定義處理日志的的邏輯。

Technology Services ｜技術服務