通常會先檢查兩端點設備的Policy,因為這是最容易發生阻擋的部分。
在除錯的階段,我們有好幾招可以使用,這次會使用「從底而上」。
同網段內設備,如果是Isolate,也就是PrivateVLAN,會連同VLAN的ARP與MAC都看不到。這是適用於飯店業的設定,一般通常不會用。
兩個端點設備的熟人都確認過端點設備的Policy無擋,那就會看過程中的設備。
Aruba Gateway <=L2=> Switch <=L2=> Firewall,L2意味著同VLAN。
若是兩端點都看得到彼此MAC與ARP的話,那可能是什麼問題?
盲區
廠商通常可能看自己的設備,以及對自己的設備熟悉。
因此途經非廠商能掌握的設備,就會進入盲區。盲區若是有意外,就會出意外。
因此往往最終就是一起排查,一群人多雙眼睛一起看。
不要僅侷限單一產品,否則在這種盲區之中,就會無法找出問題點。
經典設計
為什麼要有「經典設計架構」與「經典設計邏輯」?
雖然不照經典,仍舊可以好好運作,但是換人接手,瞭解就需要額外花精力去適應。
經典設計是經得起考驗的。
經典設計除了IP配置、接線邏輯,還有設備角色切割化與明確化。
設備的角色最好仿照他的強項,俗稱防火牆做防火牆的事情,交換器做交換器的事情。
交換器做DHCP Server,或是交換器做防火牆的事情,就會很難處理,因為不常發生。
盲區+習慣經典設計=難發現意外
通常在盲區時,廠商會說:「我這邊確定沒問題。」
不過通常是最後到的,冠上最大嫌疑,就像是廠商的設備。
其實多數人更在乎解決問題,更希望是提供一個排查方向,不是每個人都說我沒問題,但是我們之中肯定至少有一個有問題。
由於習慣了經典設計,就會假設「經典角色」或是稱為「正常情形」,他應該不會這樣做。
萬一破壞了經典設計,他就是會這樣做,我們直接被經典設計帶入難解的情境,畢竟你都覺得不會,就不會再向該處調查。
如果無法確認是否為經典架構的設定,就得抱持一定程度的懷疑。
所以說,我推崇使用經典設計解決問題,弄很多花招,過一段時間之後,可能連自己用了什麼花招都忘了。
然後除錯技巧,最重要的是「假說」,假說要是能解釋所有驗證完的結果,找到這種假說,自然是最有可能的解決方向。如果假說與實測結果無法妥善解釋,那就只能是走頭無路的選擇,那效果不好,可也沒辦法。
排查抱持懷疑心,大膽假設也要符合實證
如果無法確認是否為經典架構的設定,就得抱持一定程度的懷疑。
簡單來說就是大家一起用眼睛看,集結眾人知識看過所有設定,避免信任而有盲區。
每次排查,都會有所斬獲。
假說要能符合這些斬獲,例如,若符合這個假說,就能解釋所有測試看到的結果。
我們努力思考,建立在層層測試結果之上,最終一步步縮小,直到找出根因。
實戰經歷
兩端設備都確認沒阻擋,不過中間Switch不是我們負責的,只能相信。
當然相信,因為是客戶調整的,我們沒看怎麼調,就不會否定。
客戶提出mac有看到比彼此,我們查兩端設備也有看到彼此MAC與ARP。
基本上,L2層一定有通。
同網段但Ping不通,到底是哪一端阻擋?或是中間阻擋?
除錯時,真的需要有保持冷靜與分析測試結果的特質。如果急氣攻心,可能放下一下緊張感,就能想到本來想不到的。
提出符合狀況的假說是很重要的,如果Switch使用ACL阻擋,是不是也會造成這個現象?
頂尖流派是以理論支撐的
最近又刷了一波Wireshark,封包架構與運作原理看得越來越廣。
ARP不是L3封包,只是L2層。
L3層是IP層,因此封包會有段IP協定。而ARP則是ARP協定,訊框並無IP協定。
如果有ACL阻擋,通常Switch ACL是作用在IP層,因此即便用ACL全擋,也檔不下ARP。


為什麼不能靠經驗與觀察,而是需要透過理論去佐證?
因為經驗與觀察是自己的角度,而理論是多人的共識。如果要邁向頂尖流派,自然就需要把讓自己的舉止是可以受驗證與公評的,透過理論去解釋,自然而然就能讓自己邁向頂尖。
走經驗與觀察,有不少在半途就因為根基不佳而建立錯誤認知,也沒有習慣以理論驗證與支持自己猜想,大樓蓋歪了,然後遇到事情要東補西補,補法也可能有狀況,最後只能在一定高度苦苦掙扎。
如果持續嚴謹科學地探索,只需五年就能比十年資深厲害不少。提出合理的假說也是需要練習,提得出來,早點解決,提早下班。最好是成長時一開始就走對的路,雖然要花很多時間與精力,一旦習慣了那個態度與流程,很多事情都能好好被分析與處理。
實際測試
Switch上,針對終端介面單一方向IP流量全擋,終端IP為10.80.0.251,因此會Ping不到,但是ARP在Ping完後出現了。

結果
隔天進行更多測試,發現 Aruba Gateway 有建立Session。
因此,不是我上述的假設,ACL阻擋的方式是沒辦法建立Session。
嫌疑回到Firewall上,然後自己也構思第二可能,然後嘗試。
發現Firewall 的 Zone 改個種類,就能通了。