|
價格: |
面議 |
起批量: |
1 件起批 |
區域: |
福建 福州 倉山區 |
關鍵詞: |
|
聯系人: |
不* 先生 |
在線交流: |
 |
立即詢價查看聯系方式 |
|
|
c獨立經營福州,福州,福州,電信高防機房
高防服務器咨詢扣扣:1451169449 一四五一一六九四四九 福州高防服務器線路穩定 無視CC攻擊 高防服務器租用
TEL:18559161223 一八五五九一六一二二三
服務器“異常”的幾個可能性預警請重視!
提到服務器宕機檢測,大家會想到,宕機能夠很快知道,這個有什么可做的?實際上,很多時候服務器宕機,并不總是被及時感知。服務器宕機,ping或者ssh這是**簡單的做法,但**的工程實踐,沒這么簡單。
想要獲知服務器宕機怎么辦?可以通過服務器宕機實時檢測:
1)發現宕機
2)提前告警。
3)告知宕機的詳細原因,如硬件故障,內核bug,網絡異常等等。
4)自動報修生成工單。
我們知道,進行全網物理機宕機準確探測與實時發現,可以給宕機分析提供**現場,獲取**現場的日志。也可以盡早將宕機數據推送給業務或運營感知并處理,如自動報修,業務遷移等,從而盡可能將業務影響降到**。
更重要的是,準確的宕機發現數據可以為宕機預測提供準確的標注數據,為后期宕機預測提供數據基礎,并且這些數據提供給運營部門進行整體分析,提升處理效率。
那么,如何可以準確發現宕機,減少誤報呢?我們可以有以下操作,比如:
心跳源檢測異常
顧名思義,通過心跳源,初步發現異常。通常心跳變化會有三類消息,update消息,delete消息和insert消息。心跳邏輯在于,正常情況下SA服務端與NC建立長連接,每數秒緩存一次心跳,每幾分鐘打包上報一次,但當NC異常時,長連接感知后,立即上報異常,并修改路由表。所以心跳異常做到秒級感知。
update消息,在有心跳發生變化情況下都會有,心跳異常和心跳恢復正常時都會發起,是主要的心跳來源。
delete消息,在心跳異常,并且SA判斷ping不通,且ssh不通情況下發起,刪除該條消息,避免延遲太長。
insert消息,在新增加機器, 或者重裝后重新上位的機器發起,該消息對宕機發現價值不大,配合uptime使用。
心跳源檢測任務邏輯,主要是**并緩存uptime消息,同時避免時間窗內多次消息沖突,導致信息被覆蓋。
異常排除
|
福建陸陸陸網絡科技有限公司 |
聯系人: |
不* 先生  |
電話: |
|
手機: |
 |
傳真: |
|
郵箱: |
1451169449@qq.com |
聯系地址: |
福建福州 |
郵編: |
|
小貼士: |
|
|