這是一個最近一直碰到的狀況,覺得思路很有趣,使用ping跟tracert,來做初步推論。
今天有一個環境,切分為內外部:內部是同一個網段,外部是跨網段。
內外部都是public network,而且中間設備的ip route設定也無誤,這是不需要也沒有機會去檢查的。
內部的Gateway的IP位置是未知的,但是可以連通內外部,也可以正常上網。
只能存取新增的設備,其餘設備的config跟帳號都不知道。
在內部新增了一個Switch設備,但是卻沒有得到回覆,請問是?
- 設備離線(暫時關閉電源)
- 路徑中有介面意外關閉(err-disable)
- 設定錯誤(IP錯誤,或是Gateway錯誤)
- IP衝突
列出四種,這四種都會導致無法連線到設備,要求要能找到問題點,始之可以被正常存取連線。
以下說出如何找出問題跟解法。
- 設備離線(暫時關閉電源)
表徵:IP有時候會有回應,有時候會沒有回應,需要持續一段(一天)觀察。
解法:跟客戶說明關閉電源會導致的結果。 - 路徑中有介面意外關閉(err-disable)
表徵:用 show int brief 去看是 down 的,有設定 bpdu 的相關指令。
解法:檢查config並修改,再重新啟動介面。
3a. 設定錯誤(IP錯誤)
表徵:內外部Ping不到IP,上行或下行介面是通的,也可以看到該設備。
解法:如果有用IPv6,可以試著用cdp或lldp撈出IPv6然後再連過去。
3b. 設定錯誤(Gateway錯誤)
表徵:只有外部Ping不到IP,上行或下行介面是通的,也可以看到該設備。在外部tracert會卡在最後一步。
解法:連到內部其他設備再轉連過去,如果內部無法連線,就要找出該設備解決。
- IP衝突
表徵:IP會有回應,但是資訊不是自己的設備。在安裝設備之前,就能發現設備IP有所回應。
解法:如果有用IPv6,可以試著用cdp或lldp撈出IPv6然後再連到自己的設備去修改。
或是把衝突的設備改IP,不過因為mac table要等待一段時間(預設四小時)才能清除暫存,正常運行。
結論:
基於 遠端協助 >>> 到場處理,設備在設定上,一定要確保遠端是可以正常連線到的,或是透過轉接的方式連線。
config需要被調整那是很自然的,力求確保可以正常遠端連線就能省下很多工。
工作環境跟教科書不一樣的是,有許多的未知數,還有許多不可動的限制。
例如IP位置衝突,IPv6開啟,就算IPv4有衝突到,也是可以被解決的。
在驗收得過的基本要求之下,能用最輕鬆的方式最少的時間完成最好,任何會影響驗收的,花多少時間心力都要去解決。
想起以前面試被提說IP位置重疊有甚麼解決辦法?我還是覺得中間接Switch去偵測是很爛的辦法。就現實工作面來看,這作法費工費器材,不太可能這樣做。
最好是接設備之前先掃描,如果沒有就可以不用擔心。要是裝上去了才懷疑IP衝突,就利用ip scan去看資訊是否跟預期的相同。
要是是別台的資訊,問題排除後,得馬上清除MAC table或等一段時間自然被清除才能正常運行。
利用LLDP或是CDP看是更聰明的方法,有可以找到鄰近設備IPv4或有機會找到IPv6,可以確定被重複到的新Switch是有被設定好。