原標(biāo)題:深信服能監(jiān)控 超融合690向未來更進(jìn)一步
隨著新一輪AI熱潮的到來,越來越多的目光聚焦到了AI上。云計(jì)算作為數(shù)字化轉(zhuǎn)型的基石之一,其本身需要借助先進(jìn)技術(shù)不斷強(qiáng)化自身能力,AI技術(shù)的融入,將讓用戶的數(shù)字化轉(zhuǎn)型更加順暢。
深信服基于AI First理念將AI能力在自身產(chǎn)品全面推廣,通過對(duì)智能算法模型進(jìn)行深度訓(xùn)練構(gòu)筑技術(shù)中臺(tái),根據(jù)運(yùn)維、性能、安全方面的能力需求,衍生出了三大技術(shù)分支:AIOps、AIRun、AISec。以深信服超融合690版本為例,在AI能力的加持下,超融合不再是單純承載業(yè)務(wù)的基礎(chǔ)設(shè)施,而是助力用戶數(shù)字化轉(zhuǎn)型的強(qiáng)力支持。
AIOps:簡化運(yùn)維,提高運(yùn)維人效比
變革創(chuàng)新的車輪滾滾向前,IT基礎(chǔ)設(shè)施的運(yùn)維手段也在不斷進(jìn)化。從手工運(yùn)維、流程化標(biāo)準(zhǔn)化運(yùn)維、平臺(tái)自動(dòng)化運(yùn)維,再到如今的AIOps,每一次模式的創(chuàng)新與變革都意味著能力和效率的提升。
相比于傳統(tǒng)IT基礎(chǔ)設(shè)施復(fù)雜的運(yùn)維流程,深信服AIOps率先將ITOM與AI技術(shù)結(jié)合,打造出O2O場景下的AI運(yùn)維引擎——天工引擎。將AI能力注入超融合690的運(yùn)維業(yè)務(wù),用更高的人效比和更快的響應(yīng)速度,幫助用戶將運(yùn)維工作化繁為簡,實(shí)現(xiàn)“人人皆可運(yùn)維”。如今,超融合690憑借天工引擎可提前7~30天預(yù)測故障風(fēng)險(xiǎn),預(yù)測精準(zhǔn)度超過90%,1分鐘及時(shí)發(fā)現(xiàn),3分鐘快速定位。
為了將業(yè)務(wù)風(fēng)險(xiǎn)消除于萌芽之中,天工引擎采集了log、trace、metric等與故障有強(qiáng)關(guān)聯(lián)性的硬件資源數(shù)據(jù),借助深度學(xué)習(xí)的Attention機(jī)制分別建立故障專屬預(yù)測模型。在模型上通過CNN因果卷積網(wǎng)絡(luò)、Transformer機(jī)制提取并挖掘故障發(fā)生的時(shí)間規(guī)律,實(shí)時(shí)對(duì)照系統(tǒng)內(nèi)正常工作的軟硬件參數(shù),在故障發(fā)生前提前預(yù)測風(fēng)險(xiǎn)。
故障預(yù)測流程圖
為了避免用戶在海量預(yù)警下錯(cuò)過關(guān)鍵信息,天工引擎采用NLP算法、分詞運(yùn)算、熵值算法等智能算法,根據(jù)模式特征將海量告警信息收斂為關(guān)鍵告警,幫助用戶將精力聚焦在關(guān)鍵業(yè)務(wù)。同時(shí)為了幫助用戶更快消減故障帶來的停機(jī)風(fēng)險(xiǎn),天工引擎可將故障產(chǎn)生的異常數(shù)據(jù)導(dǎo)入因果推理模型,綜合根因定位模擬并生成異常事件的溯源鏈路,直觀的展示異常在指標(biāo)間的傳播效應(yīng),幫助運(yùn)維人員快速、精準(zhǔn)的定位問題根因。
根因分析流程圖
AIRun:性能優(yōu)化,助跑架構(gòu)實(shí)現(xiàn)高性能
隨著越來越多的業(yè)務(wù)上云,多業(yè)務(wù)混合部署已經(jīng)成為當(dāng)下云環(huán)境常態(tài)。多業(yè)務(wù)部署在同一臺(tái)主機(jī)的方式雖然能在一定程度上節(jié)省資源成本,但也加劇了不同業(yè)務(wù)系統(tǒng)間的資源搶奪。
為了更好的保障用戶核心業(yè)務(wù)的正常運(yùn)轉(zhuǎn),深信服AIRun可基于業(yè)務(wù)畫像分析引擎捕捉虛擬機(jī)資源指標(biāo)與業(yè)務(wù)性能的關(guān)聯(lián)性信息,并根據(jù)性能需求的差異性將平臺(tái)內(nèi)運(yùn)行的業(yè)務(wù)體系分為計(jì)算密集型、訪存密集型、IO密集型等類別。
同時(shí),采用的CPU智能調(diào)度算法就像一名擁有“上帝視角”的調(diào)度員,在對(duì)底層資源全局調(diào)控的同時(shí),精準(zhǔn)識(shí)別核心業(yè)務(wù)的資源需求,根據(jù)業(yè)務(wù)類別把運(yùn)算資源優(yōu)先分配給核心業(yè)務(wù),保障業(yè)務(wù)的流暢運(yùn)行。在不綁定硬件的前提下,進(jìn)一步提高資源利用率,實(shí)現(xiàn)平臺(tái)的高性能運(yùn)轉(zhuǎn)。
AISec:告警梳理,實(shí)現(xiàn)業(yè)務(wù)上線即安全
得益于AI中臺(tái),超融合的安全能力未來將不止作用于單一的虛擬化。為了更好的應(yīng)對(duì)未知的安全風(fēng)險(xiǎn),打造安全省心的業(yè)務(wù)環(huán)境,AISec可根據(jù)用戶云平臺(tái)過往的告警數(shù)據(jù)進(jìn)行時(shí)序建模,實(shí)時(shí)學(xué)習(xí)并利用業(yè)務(wù)基線過濾告警,為用戶梳理海量的告警信息,優(yōu)先解決緊急的安全事件。
AISec安全運(yùn)營流程圖
同時(shí),對(duì)于結(jié)果導(dǎo)向不明確的安全線索,AISec可根據(jù)圖分析和中心性算法評(píng)估告警信息的準(zhǔn)確性,對(duì)安全事件進(jìn)行深度挖掘并及時(shí)定性。在檢測層面將安全事件的誤報(bào)漏報(bào)下降一個(gè)數(shù)量級(jí),做到提前預(yù)警、精準(zhǔn)預(yù)警。而在安全事件的處置層面,運(yùn)維人員無需具備專業(yè)的安全知識(shí),即可對(duì)安全事件進(jìn)行定位、分析、排障,用不斷進(jìn)化的AI能力,實(shí)現(xiàn)云平臺(tái)業(yè)務(wù)上線即安全。
備注:市場有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://m.fishbao.com.cn/