chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TECS資源池上報BFD會話DOWN和網(wǎng)絡(luò)流量異常告警的問題處理

中興文檔 ? 來源:中興文檔 ? 2023-06-07 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

某資源池TECS上報BFD會話DOWN告警和網(wǎng)絡(luò)流量異常告警,持續(xù)時間1秒至6分鐘不等,如下圖所示。

4feac93c-0485-11ee-90ce-dac502259ad0.png

同時,業(yè)務(wù)側(cè)反饋,該資源池ISBG業(yè)務(wù)網(wǎng)元產(chǎn)生指標(biāo)下降等異常情況,但已快速恢復(fù)。

物理節(jié)點(diǎn)上的虛擬機(jī)都通過業(yè)務(wù)面網(wǎng)卡和節(jié)點(diǎn)外部通信。當(dāng)流量異常時,業(yè)務(wù)網(wǎng)卡上會出現(xiàn)很多丟棄包。

系統(tǒng)周期性采樣網(wǎng)卡所有收發(fā)包總數(shù)和丟棄包總數(shù),當(dāng)丟棄包占比數(shù)連續(xù)多次超過門限時,則上報告警;當(dāng)連續(xù)幾個采樣周期的丟棄包占比數(shù)低于門限,則恢復(fù)告警。

虛擬網(wǎng)絡(luò)上出現(xiàn)較重負(fù)荷,造成報文丟棄率超過給定閾值。短暫的指標(biāo)下降異常情況可能和資源相關(guān),例如CPU、內(nèi)存、網(wǎng)絡(luò)資源不足,或者硬盤的IO讀寫過低導(dǎo)致延遲。

問題分析過程如下:

1.觀察到異常情況后,對告警內(nèi)容展開分析。執(zhí)行dvs show-dpifstats命令,找到對應(yīng)端口,查看overrun和drop統(tǒng)計項(xiàng)是否在增加。

2.觀察到計算服務(wù)器NFV-D-XXX-SRV-15業(yè)務(wù)bond子接口均上報了網(wǎng)絡(luò)流量異常告警,分析可能是端口丟包。

3.登錄服務(wù)器查看DVS日志,端口丟包量在告警時刻出現(xiàn)上漲,如下圖所示。

500e8836-0485-11ee-90ce-dac502259ad0.png

4.登錄云平臺查看NFV-D-XXX-SRV-15承載業(yè)務(wù),該主機(jī)承載虛機(jī)四臺,其中包含ISBG的XX-isbg-OMPIPI_2_L虛機(jī)。分析可能為DVS接收丟包影響到虛機(jī)業(yè)務(wù)。

5.分析SAR日志,確認(rèn)DVS的綁定核在故障期間出現(xiàn)被占用的情況,時間點(diǎn)與網(wǎng)卡丟包基本一致,認(rèn)定為DVS核占用導(dǎo)致的DVS物理網(wǎng)卡丟包,如下圖所示。

5030ab3c-0485-11ee-90ce-dac502259ad0.png

6.分析BMC黑盒子日志,該時間(+8)在日志中大量出現(xiàn)ECC內(nèi)存錯誤,內(nèi)存定位DIMM11,如下圖所示。

504fd5ac-0485-11ee-90ce-dac502259ad0.png

7.ECC錯包出現(xiàn)的時間點(diǎn)與DVS網(wǎng)卡丟包時間點(diǎn)(DVS轉(zhuǎn)發(fā)核被占用的時間點(diǎn))基本重合,認(rèn)定內(nèi)存ECC錯誤與DVS的丟包強(qiáng)相關(guān)。

8.根據(jù)日志顯示報錯信息,ECC內(nèi)存錯誤觸發(fā)的內(nèi)存槽位為DIMM11。

1.登錄管理頁面,選擇“云平臺管理-計算-實(shí)例”,選中該臺主機(jī)上虛擬機(jī),完成主機(jī)上虛擬機(jī)的熱遷移,如下圖所示。

507207b2-0485-11ee-90ce-dac502259ad0.png

2.完成遷移后,選擇“云平臺管理-計算-主機(jī)”,選中這臺主機(jī),設(shè)置維護(hù)模式,如下圖所示。

5093f0d4-0485-11ee-90ce-dac502259ad0.png

3.下電服務(wù)器完成內(nèi)存更換,完成后上電,取消“設(shè)置維護(hù)模式”。

4.遷移回虛擬機(jī),測試正常。

5.內(nèi)存ECC錯誤為此次異常故障根因。內(nèi)存ECC錯誤影響DVS轉(zhuǎn)發(fā)分析:

l在內(nèi)存ECC錯誤故障期間,現(xiàn)有的BIOS配置會為每一個內(nèi)存ECC錯誤產(chǎn)生一個SMI中斷。

如果產(chǎn)生ECC風(fēng)暴,那么影響CPU處理性能。

SMI中斷在內(nèi)核感知為NMI,不受內(nèi)核控制,從硬件描述看內(nèi)核是無法屏蔽此類中斷的。內(nèi)存ECC默認(rèn)不告警。

SMI中斷導(dǎo)致CPU進(jìn)入SMM模式,該模式對于OS是透明的。

因此SMI中斷是硬件和固件(BIOS)共同處理的,其對于CPU處理流程的打斷,對OS而言是不可感知的,不會出現(xiàn)在OS的統(tǒng)計項(xiàng)里面。

只有當(dāng)BIOS處理SMI后,并以SCI中斷通知OS時,OS才能感知到SCI中斷。但是BIOS是否觸發(fā)SCI中斷也不是OS所能控制的。

總之,SMI中斷對于DVS處理核的影響是硬件和固件的行為。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SAR
    SAR
    +關(guān)注

    關(guān)注

    3

    文章

    448

    瀏覽量

    48052
  • BIOS
    +關(guān)注

    關(guān)注

    6

    文章

    474

    瀏覽量

    48647
  • ECC
    ECC
    +關(guān)注

    關(guān)注

    0

    文章

    104

    瀏覽量

    21749
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    973

    瀏覽量

    30683
  • SCI
    SCI
    +關(guān)注

    關(guān)注

    1

    文章

    61

    瀏覽量

    20919

原文標(biāo)題:TECS資源池上報BFD會話DOWN和網(wǎng)絡(luò)流量異常告警的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    動態(tài)流量池數(shù)據(jù)資源交付技術(shù):破解網(wǎng)絡(luò)流量調(diào)度的核心難題

    前言在數(shù)字經(jīng)濟(jì)全面滲透的當(dāng)下,數(shù)據(jù)傳輸與網(wǎng)絡(luò)流量已成為支撐數(shù)字業(yè)務(wù)運(yùn)行的核心基礎(chǔ)。從日常的互聯(lián)網(wǎng)訪問、企業(yè)跨地域辦公,到工業(yè)物聯(lián)網(wǎng)終端互聯(lián)、智算中心的算力調(diào)度,都離不開穩(wěn)定、高效的流量資源交付體系
    的頭像 發(fā)表于 03-30 13:50 ?1241次閱讀
    動態(tài)<b class='flag-5'>流量</b>池數(shù)據(jù)<b class='flag-5'>資源</b>交付技術(shù):破解<b class='flag-5'>網(wǎng)絡(luò)流量</b>調(diào)度的核心難題

    破解RDMA網(wǎng)絡(luò)“黑盒”:輕量化會話追蹤工具

    在RDMA網(wǎng)絡(luò)運(yùn)維面臨“黑盒”挑戰(zhàn)的背景下,星融元推出的RST工具通過無侵入捕獲CM報文,實(shí)現(xiàn)RDMA會話的可視化追蹤與全網(wǎng)路徑還原。該工具基于RFT與RPT雙模塊,支持從設(shè)備流表到全局拓?fù)涞亩嗑S觀測,大幅降低運(yùn)維定位成本,推動高性能網(wǎng)
    的頭像 發(fā)表于 02-13 14:30 ?510次閱讀
    破解RDMA<b class='flag-5'>網(wǎng)絡(luò)</b>“黑盒”:輕量化<b class='flag-5'>會話</b>追蹤工具

    如何控制告警聲音,或者實(shí)現(xiàn)長鳴告警

    如何控制告警聲音,或者實(shí)現(xiàn)長鳴告警?
    發(fā)表于 01-20 17:10

    電能質(zhì)量在線監(jiān)測裝置的多級告警閾值功能是如何實(shí)現(xiàn)的?

    電能質(zhì)量在線監(jiān)測裝置的多級告警閾值功能通過 “硬件采集 - 軟件計算 - 閾值比對 - 智能觸發(fā) - 分級響應(yīng)” 的全鏈路閉環(huán)實(shí)現(xiàn),核心是為不同電能質(zhì)量指標(biāo)設(shè)置差異化閾值與響應(yīng)策略,適配異常嚴(yán)重程度
    的頭像 發(fā)表于 12-10 14:32 ?599次閱讀
    電能質(zhì)量在線監(jiān)測裝置的多級<b class='flag-5'>告警</b>閾值功能是如何實(shí)現(xiàn)的?

    線路保護(hù)光纖通道異常處理方法

    通道異常的 常見原因、處理步驟及預(yù)防措施 ,幫助運(yùn)維人員快速定位問題,提升故障處理效率。 廣州郵科光纖線路保護(hù)系統(tǒng) 一、光纖通道異常的常見表現(xiàn) 當(dāng)線路保護(hù)光纖通道出現(xiàn)
    的頭像 發(fā)表于 11-17 10:01 ?1527次閱讀
    線路保護(hù)光纖通道<b class='flag-5'>異常</b><b class='flag-5'>處理</b>方法

    構(gòu)建高可靠網(wǎng)絡(luò):硬件BFD的關(guān)鍵作用

    BFD Acceleration(BFD加速)指的是一系列通過硬件卸載或內(nèi)核優(yōu)化技術(shù),將BFD報文的處理從設(shè)備的中央處理器(CPU)轉(zhuǎn)移到專
    的頭像 發(fā)表于 11-06 11:09 ?1264次閱讀
    構(gòu)建高可靠<b class='flag-5'>網(wǎng)絡(luò)</b>:硬件<b class='flag-5'>BFD</b>的關(guān)鍵作用

    BFD 故障檢測機(jī)制詳解

    BFD (Bidirectional Forwarding Detection)的是雙向轉(zhuǎn)發(fā)檢測。它是一個用于快速檢測兩臺網(wǎng)絡(luò)設(shè)備之間通信故障的輕量級、低開銷的協(xié)議。可以把它想象成一個在網(wǎng)絡(luò)線路上運(yùn)行的、頻率極高的“心跳檢測”或
    的頭像 發(fā)表于 11-03 15:34 ?1264次閱讀
    <b class='flag-5'>BFD</b> 故障檢測機(jī)制詳解

    交換機(jī)光模塊收發(fā)光超閾值無告警問題的處理方法

    某互聯(lián)網(wǎng)電視CDN網(wǎng)絡(luò)使用ZXR10 5960-56QU-HC交換機(jī)作為承載設(shè)備,通過光口與城域網(wǎng)設(shè)備以及CDN服務(wù)器對接,承載互聯(lián)網(wǎng)電視視頻流量。日常運(yùn)行中發(fā)現(xiàn)設(shè)備沒有上報光模塊收發(fā)光超閾值
    的頭像 發(fā)表于 10-16 09:34 ?1055次閱讀
    交換機(jī)光模塊收發(fā)光超閾值無<b class='flag-5'>告警</b>問題的<b class='flag-5'>處理</b>方法

    看不見的安全防線:信而泰儀表如何驗(yàn)證零信任有效性

    刷新后SDP認(rèn)證失敗無法新建對應(yīng)會話,網(wǎng)絡(luò)準(zhǔn)入驗(yàn)證不通過: ? 儀表統(tǒng)計顯示所有業(yè)務(wù)會話均建立失敗 場景 3: IAM通知DUT對指定令牌進(jìn)行老化,流量觸發(fā)DUT重新生成對應(yīng)緩存表
    發(fā)表于 09-09 15:33

    DPI技術(shù)賦能:開啟智能流量分析新紀(jì)元

    隨著企業(yè)數(shù)字化轉(zhuǎn)型的深入,網(wǎng)絡(luò)流量復(fù)雜度與安全威脅呈現(xiàn)爆炸式增長。傳統(tǒng)防火墻與入侵檢測系統(tǒng)面對加密流量和高級威脅顯得力不從心,關(guān)鍵業(yè)務(wù)響應(yīng)延遲激增,未知惡意流量滲透導(dǎo)致數(shù)據(jù)泄露風(fēng)險高,運(yùn)維團(tuán)隊在安全
    的頭像 發(fā)表于 07-28 11:05 ?1614次閱讀
    DPI技術(shù)賦能:開啟智能<b class='flag-5'>流量</b>分析新紀(jì)元

    協(xié)議分析儀能監(jiān)測哪些異常行為?

    協(xié)議分析儀通過深度解析網(wǎng)絡(luò)通信中的協(xié)議字段、時序和狀態(tài),能夠精準(zhǔn)識別多種異常行為,涵蓋從配置錯誤到惡意攻擊的廣泛場景。以下是其可監(jiān)測的核心異常行為類型及具體實(shí)例:一、協(xié)議實(shí)現(xiàn)違規(guī):違反標(biāo)準(zhǔn)或規(guī)范
    發(fā)表于 07-22 14:20

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    ,還是工業(yè)協(xié)議時序混亂,均可完整還原端到端業(yè)務(wù)會話鏈條,為智能分析提供堅實(shí)基礎(chǔ)。2.AI根因定位:推理引擎驅(qū)動秒級精準(zhǔn)診斷l(xiāng) 知識圖譜驅(qū)動:將網(wǎng)絡(luò)拓?fù)洹?b class='flag-5'>流量統(tǒng)計、歷史趨勢、會話日志、
    發(fā)表于 07-16 15:29

    C#上位機(jī)與運(yùn)動控制卡網(wǎng)絡(luò)通訊的周期上報

    使用C#上位機(jī)編程實(shí)現(xiàn)運(yùn)動控制卡網(wǎng)絡(luò)通訊的周期上報功能
    的頭像 發(fā)表于 06-26 13:59 ?978次閱讀
    C#上位機(jī)與運(yùn)動控制卡<b class='flag-5'>網(wǎng)絡(luò)</b>通訊的周期<b class='flag-5'>上報</b>

    TECS OpenStack資源池虛擬機(jī)網(wǎng)絡(luò)二層地址無法互通的問題處理

    某運(yùn)營商TECS OpenStack使用主機(jī)overlay SDN方案組網(wǎng),運(yùn)維人員在創(chuàng)建虛擬機(jī)測試虛擬機(jī)網(wǎng)絡(luò)狀態(tài)時發(fā)現(xiàn)問題:在其中一臺主機(jī)上創(chuàng)建兩臺同網(wǎng)段虛擬機(jī),虛擬機(jī)之間二層地址無法Ping通,但是可以Ping通網(wǎng)關(guān)地址,如圖1所示。
    的頭像 發(fā)表于 06-12 09:28 ?1003次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池虛擬機(jī)<b class='flag-5'>網(wǎng)絡(luò)</b>二層地址無法互通的問題<b class='flag-5'>處理</b>

    曙光網(wǎng)絡(luò)發(fā)布網(wǎng)絡(luò)流量回溯分析平臺SUNA

    AI時代,日益復(fù)雜的網(wǎng)絡(luò)環(huán)境正給運(yùn)維帶來嚴(yán)峻挑戰(zhàn)。業(yè)務(wù)系統(tǒng)卡頓、異常流量難溯源、故障定位如大海撈針等問題頻發(fā),傳統(tǒng)運(yùn)維手段已難應(yīng)對海量數(shù)據(jù)洪流的需求。
    的頭像 發(fā)表于 05-22 14:28 ?1070次閱讀