網(wǎng)絡(luò)診斷是管好、用好網(wǎng)絡(luò),使網(wǎng)絡(luò)發(fā)揮最大作用的重要技術(shù)工作。本文簡述分層診斷技術(shù),結(jié)合討論路由器各種接口的診斷,綜述互聯(lián)網(wǎng)絡(luò)連通性故障的排除。 網(wǎng)絡(luò)故障診斷,從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點,查找問題的根源,排除故障,恢復網(wǎng)絡(luò)正常運行。網(wǎng)絡(luò)故障通常有以下幾種可能:物理層中物理設(shè)備相互連接失敗或者硬件及線路本身的問題;數(shù)據(jù)鏈路層的網(wǎng)絡(luò)設(shè)備的接口配置 問題;網(wǎng)絡(luò)層網(wǎng)絡(luò)協(xié)議配置或操作錯誤;傳輸層的設(shè)備性能或通信擁塞問題;上三層或網(wǎng)絡(luò)應用程序錯誤。診斷網(wǎng)絡(luò)故障的過程應該沿著OSI七層模型從物理層開始向上進行。首先檢查物理層,然后檢查數(shù)據(jù)鏈路層,以此類推,設(shè)法確定通信失敗的故障點,直到系統(tǒng)通信 正常為止。 網(wǎng)絡(luò)診斷可以使用多種工具:路由器診斷命令,網(wǎng)絡(luò)管理工具和包括局域網(wǎng)或廣域網(wǎng)分析儀在內(nèi)的其它故障診斷工具。查看路由表,是開始查找網(wǎng)絡(luò)故障的好辦法。ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有 用信息的網(wǎng)絡(luò)工具。如何監(jiān)視網(wǎng)絡(luò)在正常條件下的運行細節(jié)和出現(xiàn)故障的情況,監(jiān)視哪些內(nèi)容呢?利用show interface命令可以非常容易地獲得待檢查的每個接口的信息。show buffer命令提供定期顯示緩沖區(qū)大小、用途及使用狀況。show proc命令和 show proc mem命令可用于跟蹤處理器和內(nèi)存的使用情況??梢远ㄆ谑占@些數(shù)據(jù),在故障出現(xiàn)時用于診斷參考。 故障診斷步驟 第一步,首先確定故障的具體現(xiàn)象,分析造成這種故障現(xiàn)象的原因的類型。例如,主機不響應客戶請求服務??赡艿墓收显蚴侵鳈C配置問題、接口卡故障或路由器配置命令丟失等。 第二步,收集需要的用于幫助隔離可能故障原因的信息。從網(wǎng)絡(luò)管理系統(tǒng)、協(xié)議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。 第三步,根據(jù)收集到的情況考慮可能的故障原因,排除某些故障原因。例如,根據(jù)某些資料可以排除硬件故障,把注意力放在軟件原因上。 第四步,根據(jù)最后的可能故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態(tài)。如果一次同時考慮多個故障原因,試圖返回故障原始狀態(tài)就困難多了。 第五步,執(zhí)行診斷計劃,認真做好每一步測試和觀察,每改變一個參數(shù)都要確認其結(jié)果。分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到故障現(xiàn)象消失。 網(wǎng)絡(luò)分層診斷技術(shù) 物理層的故障主要表現(xiàn)在設(shè)備的物理連接方式是否恰當;連接電纜是否正確;Modem、CSU/DSU等設(shè)備的配置及操作是否正確。確定路由器端口物理連接是否完好的最佳方法是使用show interface命令,檢查每個端口的狀態(tài),解釋屏幕輸出信息,查看端口狀態(tài)、協(xié)議建立狀態(tài)和EIA狀態(tài)。 查找和排除數(shù)據(jù)鏈路層的故障,需要查看路由器的配置,檢查連接端口的共享同一數(shù)據(jù)鏈路層的封裝情況。每對接口要和與其通信的其它設(shè)備有相同的封裝。通過查看路由器的配置檢查其封裝,或者使用show命令查看相應接口的封裝情況。 排除網(wǎng)絡(luò)層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應該通過檢查來確定是否已經(jīng)輸入適當?shù)撵o態(tài)路由、默認路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動 態(tài)路由選擇過程的故障,包括RIP或者IGRP路由協(xié)議出現(xiàn)的故障。例如,對于IGRP路由,選擇信息只在同一自治系統(tǒng)號(AS)的系統(tǒng)之間交換數(shù)據(jù),查看路由器配置的自治系統(tǒng)號的匹配情況。 路由器接口故障排除 串口故障排除 串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從show interface serial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種: 1.串口運行、線路協(xié)議運行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息。 2.串口運行、線路協(xié)議關(guān)閉,這個顯示說明路由器與提供載波檢測信號的設(shè)備連接,表明載波信號出現(xiàn)在本地和遠程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息??赡艿墓收习l(fā)生在路由器配置問題、調(diào)制解調(diào)器操作問題、租用線路干擾或遠程路由器 故障,數(shù)字式調(diào)制解調(diào)器的時鐘問題,通過鏈路連接的兩個串口不在同一子網(wǎng)上,都會出現(xiàn)這個報告。 3.串口和線路協(xié)議都關(guān)閉,可能是電信部門的線路故障、電纜故障或者是調(diào)制解調(diào)器故障。 4.串口管理性關(guān)閉和線路協(xié)議關(guān)閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入no shutdown命令,打開管理性關(guān)閉。 接口和線路協(xié)議都運行的狀況下,雖然串口鏈路的基本通信建立起來了,但仍然可能由于信息包丟失和信息包錯誤時會出現(xiàn)許多潛在的故障問題。正常通信時接口輸入或輸出信息包不應該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規(guī)律性增加,表明 通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。查找其它原因發(fā)生的信息包丟失,查看show interface serial命令的輸出報告中的輸入輸出保持隊列的狀態(tài)。當發(fā)現(xiàn)保持隊列中信息包數(shù)量達到了信息的最大允許值,可以增加保持隊列設(shè)置的大小。 網(wǎng)絡(luò)分層診斷技術(shù) 物理層的故障主要表現(xiàn)在設(shè)備的物理連接方式是否恰當;連接電纜是否正確;Modem、CSU/DSU等設(shè)備的配置及操作是否正確。確定路由器端口物理連接是否完好的最佳方法是使用show interface命令,檢查每個端口的狀態(tài),解釋屏幕輸出信息,查看端口狀態(tài)、協(xié)議建立狀態(tài)和EIA狀態(tài)。 查找和排除數(shù)據(jù)鏈路層的故障,需要查看路由器的配置,檢查連接端口的共享同一數(shù)據(jù)鏈路層的封裝情況。每對接口要和與其通信的其它設(shè)備有相同的封裝。通過查看路由器的配置檢查其封裝,或者使用show命令查看相應接口的封裝情況。 排除網(wǎng)絡(luò)層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應該通過檢查來確定是否已經(jīng)輸入適當?shù)撵o態(tài)路由、默認路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動 態(tài)路由選擇過程的故障,包括RIP或者IGRP路由協(xié)議出現(xiàn)的故障。例如,對于IGRP路由,選擇信息只在同一自治系統(tǒng)號(AS)的系統(tǒng)之間交換數(shù)據(jù),查看路由器配置的自治系統(tǒng)號的匹配情況。 路由器接口故障排除 串口故障排除 串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從show interface serial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種: 1.串口運行、線路協(xié)議運行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息。 2.串口運行、線路協(xié)議關(guān)閉,這個顯示說明路由器與提供載波檢測信號的設(shè)備連接,表明載波信號出現(xiàn)在本地和遠程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息。可能的故障發(fā)生在路由器配置問題、調(diào)制解調(diào)器操作問題、租用線路干擾或遠程路由器 故障,數(shù)字式調(diào)制解調(diào)器的時鐘問題,通過鏈路連接的兩個串口不在同一子網(wǎng)上,都會出現(xiàn)這個報告。 3.串口和線路協(xié)議都關(guān)閉,可能是電信部門的線路故障、電纜故障或者是調(diào)制解調(diào)器故障。 4.串口管理性關(guān)閉和線路協(xié)議關(guān)閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入no shutdown命令,打開管理性關(guān)閉。 接口和線路協(xié)議都運行的狀況下,雖然串口鏈路的基本通信建立起來了,但仍然可能由于信息包丟失和信息包錯誤時會出現(xiàn)許多潛在的故障問題。正常通信時接口輸入或輸出信息包不應該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規(guī)律性增加,表明 通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。查找其它原因發(fā)生的信息包丟失,查看show interface serial命令的輸出報告中的輸入輸出保持隊列的狀態(tài)。當發(fā)現(xiàn)保持隊列中信息包數(shù)量達到了信息的最大允許值,可以增加保持隊列設(shè)置的大小。 |
|
來自: garfielding > 《我的圖書館》