網(wǎng)絡(luò)維護或網(wǎng)絡(luò)運維可以分為兩類:日常維護和故障排除。它是為了預(yù)防問題發(fā)生,盡量減少突發(fā)的故障。 為了確保網(wǎng)絡(luò)的高效與安全,定期的網(wǎng)絡(luò)設(shè)備日常維護檢查顯得尤為重要。本文整理了一份詳細的《網(wǎng)絡(luò)設(shè)備日常維護檢查單Checklist》,旨在幫助系統(tǒng)性地進行設(shè)備檢查,預(yù)防潛在問題,提升網(wǎng)絡(luò)性能。 不同網(wǎng)絡(luò)設(shè)備的Checklist可以參考相應(yīng)的產(chǎn)品技術(shù)文檔,下圖是Checklist的整體結(jié)構(gòu),包括:設(shè)備環(huán)境檢查、設(shè)備基本信息檢查、設(shè)備運行檢查、接口信息檢查、業(yè)務(wù)檢查等。 1.設(shè)備環(huán)境檢查設(shè)備運行環(huán)境正常是保證設(shè)備正常運行的前提,然而實際工作的時候,當有故障發(fā)生,并不會第一時間檢查設(shè)備環(huán)境,因為設(shè)備環(huán)境相比較其他的因素來說,更加的穩(wěn)定和不容易發(fā)生故障。 # Checklist01:設(shè)備環(huán)境檢查表 檢查項 | 方法/工具 | 評估標準和說明 |
---|
設(shè)備擺放位置 | 觀察 | 設(shè)備應(yīng)放在通風、干燥的環(huán)境中,且放置位置牢固、平整。設(shè)備周圍不得有雜物堆積。 | 機房溫度狀況 | 觀察/溫度計 | 通常要求機房長期工作環(huán)境溫度:0~45℃ ;短期工作環(huán)境溫度:-5~55℃ 。 | 機房濕度狀況 | 觀察/濕度計 | 通常機房的長期工作環(huán)境相對濕度應(yīng)在5%RH~85%RH 之間,不結(jié)露;短期工作環(huán)境相對濕度應(yīng)在0%RH~95%RH 之間,不結(jié)霜。 | 機房內(nèi)空調(diào)運行是否正常 | 觀察/空調(diào) | 空調(diào)可持續(xù)穩(wěn)定運行,使機房的溫度和濕度保持在設(shè)備規(guī)定范圍內(nèi)。 | 清潔狀況 | 觀察 | 所有項目都應(yīng)干凈整潔無明顯塵土附著。注意防塵網(wǎng)的清潔狀況,及時清洗或更換,以免影響機柜門及風扇框的通風、散熱。 | 散熱情況 | 觀察 | 設(shè)備正常工作時,要求保持風扇正常運轉(zhuǎn)(清理風扇期間除外),自關(guān)閉風扇會引起設(shè)備溫度升高,并可能損壞單板。不要在設(shè)備子架上通風口處放置雜物,還應(yīng)定期清理風扇的防塵網(wǎng)。 | 線纜布放 | 觀察 | 電源線與業(yè)務(wù)線纜分開布放。電源線布放整齊、有序。業(yè)務(wù)線纜布放整齊、有序。 線纜標簽清晰、準確,符合規(guī)范。 | 接地方式及接地電阻是否符合要求 | 觀察 | 一般要求機房的工作地、保護地、建筑防雷地分開設(shè)置,因機房條件限制,可采用聯(lián)合接地。尤其對于戶外使用的設(shè)備,設(shè)備接地非常重要,如果未接地容易造成富擊損壞。 | 供電系統(tǒng)是否正常 | 觀察/電壓表 | 要求供電系統(tǒng)運行穩(wěn)定。直流額定電壓范圍為-48VDC~-60V 。交流額定電壓范圍為100V~240V 。 |
2.設(shè)備基本信息檢查設(shè)備基本信息檢查包括軟件版本檢查、License檢查、設(shè)備存儲空間等信息。 # Checklist02:設(shè)備基本信息檢查表 檢查項 | 方法 | 評估標準 |
---|
設(shè)備運行的版本 | display version | 單板PCB 版本號、軟件版本號與要求相符。 | 檢查軟件包 | display startup | 檢查下述系統(tǒng)文件名是否正確: 當前啟動大包名;下次啟動大包名;備份大包名;配置、許可文件、補丁、當前啟動文件名和下次啟動文件名。 | License信息 | display license display license state | 查看GTL License 文件名、版本及配置項是否符合要求,確認是否需要升級。 Masterboard license state 項為Normal 。Masterboard license state 項為Demo 或Trial 時,確認License 在有效期內(nèi)。 | 檢查補丁信息 | display patch-information | 補丁文件必須與實際要求一致,建議加載華為公司發(fā)布的該產(chǎn)品版本對應(yīng)的最新的補丁文件。 補丁必須已經(jīng)生效,即補丁的總數(shù)量和正在運行的補丁數(shù)量一致。 | 檢查系統(tǒng)時間 | displayclock | 系統(tǒng)時間需要與網(wǎng)絡(luò)管理服務(wù)器的時間保持一致(誤差不超過5分鐘)。 | 檢查Flash/SD卡/CF卡空間 | dir flash、 dir slave#cfcard | Flash/SD卡/CF 卡里的文件都必須是有用的,否則請在用戶視圖下執(zhí)行delete/unreserved 命令刪除。 | 信息中心 | display info-center | InformationCenter 項為enabled 。 | 檢查配置正確性 | display current-configuration | 通過查看當前生效的配置參數(shù),驗證設(shè)備配置是否正確。 | 檢查debug 開關(guān) | display debugging | 設(shè)備正常運行時debug 開關(guān)應(yīng)該全部關(guān)閉。 | 檢查配置是否保存 | compare configuration | 當前的配置和下次啟動的配置文件內(nèi)容一致。 |
3.設(shè)備運行狀態(tài)檢查在進行設(shè)備運行狀態(tài)檢查時,重點關(guān)注設(shè)備硬件的運行狀態(tài),如板卡、電源、風扇、溫度、CPU、內(nèi)存等。一般設(shè)備上都
設(shè)置了告警燈,通常硬件故障都會導致告警燈亮(具體狀態(tài)因產(chǎn)品而異)。因此,也可以通過現(xiàn)場觀察發(fā)現(xiàn)設(shè)備運行異常
狀態(tài)。 對于板卡、電源、風扇等部件的運行狀態(tài),應(yīng)遵照廠商的相關(guān)指導進行判斷,有必要時聯(lián)系廠商進行指導。如果確認為硬
件故障,可以聯(lián)系供應(yīng)商處理(由于不同項目、不同設(shè)備的維保方案不同,有的硬件故障可直接聯(lián)系廠商更換,有的則需
要聯(lián)系供應(yīng)商協(xié)助處理)。 # Checklist03:設(shè)備運行狀態(tài)檢查表 檢查項 | 檢查方法 | 評估標準 |
---|
單板運行狀態(tài) | display device | 重點關(guān)注單板在位信息及狀態(tài)信息是否正常。 單板Online 為Present ;單板Power 為PowerOn ; 單板Register 為Registered ;單板Alarm 為Normal 。 | 設(shè)備復(fù)位情況 | display reset-reason、display reboot-info | 通過查看復(fù)位信息(包括復(fù)位時間、復(fù)位原因),確認無非正常復(fù)位。 | 設(shè)備溫度 | display temperature、display environment | 各模塊當前的溫度應(yīng)該在上下限之間。 | 風扇狀態(tài) | display fan | Present 項為YES 表示正常。 | 電源狀態(tài) | display power | State 項為Supply 表示正常。 | FTP網(wǎng)絡(luò)服務(wù)端口 | display ftp-server | 不使用的FTP網(wǎng)絡(luò)服務(wù)端口要關(guān)閉。 | 告警信息 | display alarm all | 無告警信息。如果有告警,需要記錄,對于嚴重以上告警需并立即分析并處理。 | CPU狀態(tài) | display cpu-usage | 各模塊的CPU 占用率正常。如果CPU 占用率如果超過**80%**,建議重點關(guān)注。 | 內(nèi)存占用率 | display memory-usage | 內(nèi)存占用情況正常,如果Memory Using PercentageIs 超過**60%**時需要關(guān)注。 | 日志信息 | display logbuffer、display trapbuffer | 不存在異常信息。 | 主用板/備用板的備份狀態(tài) | display switchover state | 主備板同時存在時,要同時有主備板的顯示狀態(tài)信息。倒換完成,設(shè)備開始正常工作后,主用板需要顯示為realtime or routine backup 表示正常。 |
4.設(shè)備接口內(nèi)容檢查網(wǎng)絡(luò)設(shè)備通過接口來交換數(shù)據(jù)報文。因此,接口的信息非常重要。接口狀態(tài)異常會影響到網(wǎng)絡(luò)的功能。 接口如果出現(xiàn)大量錯包,并且在短時間內(nèi)不斷增加,通常是由于鏈路(包括物理接口)的問題造成的。 # Checklist04:設(shè)備接口內(nèi)容檢查表 檢查項 | 檢查方法 | 評估標準 |
---|
接口錯包 | display interface | 業(yè)務(wù)運行時,要檢查接口有無錯包,包括CRC 錯包等。 | 接口協(xié)商模式 | display interface | 接口協(xié)商模式正確,兩邊接口要一致,不能有半雙工模式。 | 接口配置 | display current-configuration interface | 接口的配置項合理,如接口雙工模式、協(xié)商模式、速率、環(huán)回配置等。 | 接口狀態(tài) | display interface brief | 接口的Up/Down 狀態(tài)滿足規(guī)劃要求。接口的收發(fā)流量是否過大?(**長期超過70%**) | PoE供電 | display poepower-state interfaceinterface-type interface-number | PoE 供電狀態(tài)正常,PortpowerON/OFF 為ON 的接口,其Port power status 為 Delivering-power |
5.業(yè)務(wù)運行狀態(tài)檢查業(yè)務(wù)運行狀態(tài)主要是指網(wǎng)絡(luò)協(xié)議的運行狀態(tài)。 # Checklist05:業(yè)務(wù)運行狀態(tài)檢查表 檢查項 | 檢查方法 | 評估標準 |
---|
MAC地址表信息 | display mac-address | MAC 地址表信息正確 | VLAN信息 | display vlan | 查看所有VLAN 的基本信息 | 路由表信息 | display ip routing-table | 具有默認路由或者其他精確路由,便于故障時候可以遠程定位 對于處于一個網(wǎng)絡(luò)中同一層次的設(shè)備,如果運行相同的路由協(xié)議,各設(shè)備上的路由條目應(yīng)該相差不大(因為靜態(tài)路由的配置差異,路由條目上可能存在一定差異) | OSPF鄰居狀態(tài) IS-IS鄰居狀態(tài) BGP鄰居狀態(tài) | display ospf peer display isis peer display bgp peer | OSPF 鄰居狀態(tài):鄰居狀態(tài)State 為Ful 或者2-Way
IS-IS 鄰居狀態(tài):鄰居狀態(tài)State 為Up BGP 鄰居狀態(tài):鄰居狀態(tài)State 為Established | VRRP狀態(tài) | display vrrp display vrrp statistics | 備份組中的設(shè)備的VRRP 狀態(tài)State 不能同時為Master | MSTP狀態(tài) | display stp brief | 指定端口和根端口的STPState 為FORWARDING |
# CHECKLIST總表
|