20250828 – 同網段內設備,VLAN、MAC、ARP都有通,兩端點Policy都有開,但Ping不到!?

20250828 - 同網段內設備,VLAN、MAC、ARP都有通,兩端點Policy都有開,但Ping不到!?

通常會先檢查兩端點設備的Policy,因為這是最容易發生阻擋的部分。

在除錯的階段,我們有好幾招可以使用,這次會使用「從底而上」。

同網段內設備,如果是Isolate,也就是PrivateVLAN,會連同VLAN的ARP與MAC都看不到。這是適用於飯店業的設定,一般通常不會用。

兩個端點設備的熟人都確認過端點設備的Policy無擋,那就會看過程中的設備。

Aruba Gateway <=L2=> Switch <=L2=> Firewall,L2意味著同VLAN。

若是兩端點都看得到彼此MAC與ARP的話,那可能是什麼問題?

盲區

廠商通常可能看自己的設備,以及對自己的設備熟悉。

因此途經非廠商能掌握的設備,就會進入盲區。盲區若是有意外,就會出意外。

因此往往最終就是一起排查,一群人多雙眼睛一起看。

不要僅侷限單一產品,否則在這種盲區之中,就會無法找出問題點。

經典設計

為什麼要有「經典設計架構」與「經典設計邏輯」?

雖然不照經典,仍舊可以好好運作,但是換人接手,瞭解就需要額外花精力去適應。

經典設計是經得起考驗的。

經典設計除了IP配置、接線邏輯,還有設備角色切割化與明確化。

設備的角色最好仿照他的強項,俗稱防火牆做防火牆的事情,交換器做交換器的事情。

交換器做DHCP Server,或是交換器做防火牆的事情,就會很難處理,因為不常發生。

盲區+習慣經典設計=難發現意外

通常在盲區時,廠商會說:「我這邊確定沒問題。」

不過通常是最後到的,冠上最大嫌疑,就像是廠商的設備。

其實多數人更在乎解決問題,更希望是提供一個排查方向,不是每個人都說我沒問題,但是我們之中肯定至少有一個有問題。

由於習慣了經典設計,就會假設「經典角色」或是稱為「正常情形」,他應該不會這樣做。

萬一破壞了經典設計,他就是會這樣做,我們直接被經典設計帶入難解的情境,畢竟你都覺得不會,就不會再向該處調查。

如果無法確認是否為經典架構的設定,就得抱持一定程度的懷疑。

所以說,我推崇使用經典設計解決問題,弄很多花招,過一段時間之後,可能連自己用了什麼花招都忘了。

然後除錯技巧,最重要的是「假說」,假說要是能解釋所有驗證完的結果,找到這種假說,自然是最有可能的解決方向。如果假說與實測結果無法妥善解釋,那就只能是走頭無路的選擇,那效果不好,可也沒辦法。

排查抱持懷疑心,大膽假設也要符合實證

如果無法確認是否為經典架構的設定,就得抱持一定程度的懷疑。

簡單來說就是大家一起用眼睛看,集結眾人知識看過所有設定,避免信任而有盲區。

每次排查,都會有所斬獲。

假說要能符合這些斬獲,例如,若符合這個假說,就能解釋所有測試看到的結果。

我們努力思考,建立在層層測試結果之上,最終一步步縮小,直到找出根因。

實戰經歷

兩端設備都確認沒阻擋,不過中間Switch不是我們負責的,只能相信。

當然相信,因為是客戶調整的,我們沒看怎麼調,就不會否定。

客戶提出mac有看到比彼此,我們查兩端設備也有看到彼此MAC與ARP。

基本上,L2層一定有通。

同網段但Ping不通,到底是哪一端阻擋?或是中間阻擋?

除錯時,真的需要有保持冷靜與分析測試結果的特質。如果急氣攻心,可能放下一下緊張感,就能想到本來想不到的。

提出符合狀況的假說是很重要的,如果Switch使用ACL阻擋,是不是也會造成這個現象?

頂尖流派是以理論支撐的

最近又刷了一波Wireshark,封包架構與運作原理看得越來越廣。

ARP不是L3封包,只是L2層。

L3層是IP層,因此封包會有段IP協定。而ARP則是ARP協定,訊框並無IP協定。

如果有ACL阻擋,通常Switch ACL是作用在IP層,因此即便用ACL全擋,也檔不下ARP。

IP封包
ARP訊框

為什麼不能靠經驗與觀察,而是需要透過理論去佐證?

因為經驗與觀察是自己的角度,而理論是多人的共識。如果要邁向頂尖流派,自然就需要把讓自己的舉止是可以受驗證與公評的,透過理論去解釋,自然而然就能讓自己邁向頂尖。

走經驗與觀察,有不少在半途就因為根基不佳而建立錯誤認知,也沒有習慣以理論驗證與支持自己猜想,大樓蓋歪了,然後遇到事情要東補西補,補法也可能有狀況,最後只能在一定高度苦苦掙扎

如果持續嚴謹科學地探索,只需五年就能比十年資深厲害不少。提出合理的假說也是需要練習,提得出來,早點解決,提早下班。最好是成長時一開始就走對的路,雖然要花很多時間與精力,一旦習慣了那個態度與流程,很多事情都能好好被分析與處理。

實際測試

Switch上,針對終端介面單一方向IP流量全擋,終端IP為10.80.0.251,因此會Ping不到,但是ARP在Ping完後出現了。

結果

隔天進行更多測試,發現 Aruba Gateway 有建立Session。

因此,不是我上述的假設,ACL阻擋的方式是沒辦法建立Session。

嫌疑回到Firewall上,然後自己也構思第二可能,然後嘗試。

發現Firewall 的 Zone 改個種類,就能通了。