Leetcode題解 Python & C#:六月挑戰DAY18 H-Index II

給一個升序排列的非零非負的整數數列 citations , citations[i] 代表第 i 篇論文的引文次數。
找出一個 H-Index 代表至少有 n 篇被引用 n 次,要取最大值回傳。
這是一個 Rank 的排序與篩選,可以想像從 1 開始,如果有 1 篇大於 1 次就往下進行,換成看 2 。
因為是數目也是條件,所以加上計數,如果慢慢往上加到當 citations[i] > n – i 時,那就代表不合格。
題目有提示用 O(logN) Time 解決,有個經典的方式是這樣的時間複雜度:二分搜查法。

二分搜查法要切在左方合格,右方不合格的位置,最後選擇右界。
那 H-Index 是 citations[r] 嗎?不是。
在右界與之後都是 >= citations[r] 的,也就是有 n – r 篇,H-Index 的 n 篇 n 次,若有不同,也只能取 n – r 和 citations[r] 小的為主,這樣子的 H-Index 才能合要求。
不過二者的大小關係是 citations[r] >= n – r ,然後要取小為主所以 H-Index 為 n – r。

Python

class Solution:
def hIndex(self, citations: List[int]) -> int:
if not citations: return 0
n = len(citations)
l, r = 0, n
while l < r:
m = (r-l)//2 + l
if citations[m] >= n-m:
r = m
else:
l = m + 1
return n-r

C#

public class Solution {
public int HIndex(int[] citations) {
int l = 0;
int r = citations.Length;
while(l < r)
{
int m = (r-l)/2 + l;
if(citations[m] >= citations.Length - m)
r = m;
else
l = m + 1;
}
return citations.Length - r;

}
}

testcase

[100]
[]
[1]
[0,1,3,5,6]
[0,1,2,5,6]

Wildcard Mask 用Python計算去簡化輸入

Repl.it (線上執行Python) ※支援手機(Android  IOS)
OneWildcardMask: 將輸入的IP位置用一組Network和WildcardMask表示。
MultiWildcardMask: 用一或多組Network和WildcardMask去表示所有輸入的IP的。
昨天教到 wildcard mask,打開我對 wildcard 只是二進位下該位 wildcard mask 為1就任意,為零就只能是 network 對應的值,這種淺的見解。
wildcard本身有萬用字元的意思,也就是通配,這也能與 wildcard mask 二進位為1就任意(01)起到關聯。
就計算結果上來看,wildcard mask 不是 subnet mask 的相反,而是比 subnet mask 計算更複雜的值。比起翻作「反遮罩」,我認為稱之「通配遮罩」更適合。
wildcard mask 用意是為了減少路由的輸入,也就是可以 match 到多網段,如果設定的好,可以用一行就涵蓋多個網段,可以減少路由器的負荷。
「0.0.0.0 255.255.255.255」(Network, WildcardMask) 代表全部network皆匹配。在設OSPF時,也不用一個個網段輸,只用一行就能解決。
但這是有風險的,也代表該路由器是可以跟所有IP位置形成夥伴關係,一個惡意就能透過路由交換去塞滿垃圾路由或是搶走路由做 Man in Middle。
最好就只開設定內且可信的進ACL,別偷懶!但是 wildcard 計算並不是那麼直觀的,常有不同的需求,如果要手算,就怕數量一大,會很累。
如我要只要開 192.168.0.7 跟 192.168.0.15 進來,只能用一個 network 跟一個 wildcard mask 就要能表示只有該兩個位置會被挑中。
二IP位置前方三部分 192.168.0 都一樣,所以可知 wildcard mask 的前三部分是 0.0.0。
到了第四位就會有些不同,這裡得換成二進位去看其運作。
二進位      十進位
00000111 <= 7 (IP 1)
00001111 <= 15 (IP 2)
 
在左方數來的第五位,同時出現 0 和 1,那代表該位應該要通配。其餘位置上只有 0 或 1 單獨出現,所有是固定的。
0000*000 => 00001000 => 8 (wildcard)
於是得到 wildcard mask 應該是設為 「0.0.0.8」。

這套算法是最基礎的,照這套路能很輕易就手算出各種要求。
那今天有10個VLAN,也就是10個不同網段,甚至是20個以上呢?手算光寫出二進位就很花時間了,更別說可能會看錯。
那交給電腦算吧。
在 wildcard 這種通配規則在該位同時有 01 的情況下要為 1,所以拿兩兩相比來看,運行的是 XOR 計算。
也就是說如果計算結果二進位下的某位為 1,那代表該位需要通配。
因此再把兩兩XOR的結果做一次總體的OR運算,就能算出只用一行指令的限制,最小限度的wildcard mask。但這不能保證只有目標只被挑出,可能會摻一些不在設定內的。
先只考慮濃縮成一個wildcard mask 去包含所有想要在內的IP位置,寫成Python來看
"""
ips間互相做XOR得到結果一
再把結果一做OR,得到單一最低限度的wildcard mask
"""

ips = [[192,168,0,7], [192,168,0,15]]
result = [set(), set(), set(), set()]
wc = []
# 兩兩 XOR => 計算結果1
for i1 in range(len(ips)-1):
for i2 in range(i1+1, len(ips)):
for i3 in range(4):
result[i3].add(ips[i1][i3] ^ ips[i2][i3])
# 計算結果1 做 OR 總計算
for i in range(4):
num = 0
for res in result[i]:
num |= res
wc.append(num)
print(wc)
"""
再次簡化
"""
ips = [[192,168,0,7], [192,168,0,15]]
wc = [0, 0, 0, 0]
for i1 in range(len(ips)-1):
for i2 in range(i1+1, len(ips)):
for i3 in range(4):
wc[i3] |= (ips[i1][i3] ^ ips[i2][i3])
print(wc)
雖然算得出來,但是因為一開始要算兩兩成對XOR,所以會至少要算 n(n-1)/2 次,如果要把一個範圍納入,如最後二位可[0, 255]間,會計算(255*255)*((255*255)-1)/1次。
那會運算相當久,但對人來說,那可能是一秒就能算完的。

換個想法,既然在IP位置清單內的都要能符合,不如從一個 (Network, Wildcard) 的組合,對應每一個IP位置去做一些修改,讓每一個都能符合條件。
ips = []
for l1 in range(256):
for l2 in range(256):
ips.append([192, 168, l1, l2])

wc = [[[0,0,0,0], [255,255,255,255]]]
if ips:
wc = [[ips.pop(0), [0,0,0,0]]]
for ip in ips:
for i in range(4):
wc[0][1][i] |= wc[0][0][i] ^ ip[i]
print(wc)

=> [[[192, 168, 0, 0], [0, 0, 255, 255]]] 

這只要計算 (255*255) 次,明顯快很多,原來兩兩成對的XOR是可以拔除的,同時最後的輸出也已經是指令要打的格式了。
這十分接近理想,但不夠,目前仍未解決沒輸入的IP位置也可能被選中的情況。
要解決這個情況,就可能會用上多個 (Network, Wildcard) 的組合,即使用多個,也要是輸入最少次數就能處理掉。
所幸這是可以被計算出來的,最近看到 Software-Defined(SD),如果自動用上這樣的算法,人就只要去挑出範圍或對應的處理,剩下的計算或輸入指令,就可以交給程式碼代勞。
"""
給一串可以預期整理成下方結果的IP
Network: 192.168.0.0, Wildcard Mask: 0.0.0.3
Network: 192.168.0.4, Wildcard Mask: 0.0.0.8
"""
ips = [[192,168,0,0],[192,168,0,1],[192,168,0,2],[192,168,0,3],[192,168,0,4],[192,168,0,12]]
from collections import defaultdict
wc = defaultdict(list)
"""
將 IP位置 做 summary
"""
def check(strIP, strIP2):
"""
只能有一個位置01同時出現
但如果是 * 符,二者沒有對上,就表示無法整合。
"""
dismatch = 0
pos = -1
for i in range(32):
if strIP[i] != strIP2[i]:
if strIP[i] == "*" or strIP2[i] == "*": return -1
dismatch += 1
pos = i
if dismatch == 2: return -1
return pos

for ip in ips:
strIP = "{:0>8}{:0>8}{:0>8}{:0>8}".format(*[bin(num)[2:] for num in ip]) # 換成 連續二進位 string
level = 0
pos = 0
while pos != -1 and wc[level]:
for j in range(len(wc[level])):
pos = check(strIP, wc[level][j][1])
if not pos == -1:
ip = wc[level].pop(j)[0]
strIP = strIP[:pos] + "*" + strIP[pos+1:]
level += 1
break
wc[level].append([ip, strIP])

"""
將 Summary 後的結果轉換回十進位格式
"""
result = []
for key in wc:
for NW in wc[key]:
NW[1] = NW[1].replace("1", "0").replace("*", "1")
result.append([NW[0], [int(NW[1][0:8],2), int(NW[1][8:16],2),int(NW[1][16:24],2),int(NW[1][24:32],2)]])

"""
將十進位的資料型態換成字串
"""
for each in sorted(result):
Network = ".".join([str(num) for num in each[0]])
WildcardMask = ".".join([str(num) for num in each[1]])
print("Network: {:}, Wildcard Mask: {:}".format(Network, WildcardMask))

現在人只要決定哪些IP位置在要裡面,也能確保不會有預期之外的IP會被選中。
不過這對於 Range 沒有很好的支持,如果要 0 到 255 就得一一個打。但這是前處理的範疇,本篇就不做深做探討。

Leetcode題解 Python & C#:六月挑戰DAY17 Surrounded Regions

給一個二維的串列,其元素為 ‘X’ 或 ‘O’ 要把所有 ‘O’ 被 ‘X’ 包圍的換成 ‘X’。
這規則有點像圍棋,圍住就吃掉。
那有好幾種思路:
最直觀的,就是遇到一個 ‘O’ 時,檢查其四周是否為 ‘X’,然後如果檢查時遇到 ‘O’,就延伸檢查。
或者變體,直接檢查 ‘O’ 的上下左右到邊際是否有 ‘X’ 出現,然後給標記,最後檢查標記四周只有標記與 ‘X’,就換成 ‘X’。
走到這裡,只有一種狀況會需要特別小心,就是在邊際的 ‘O’ ,如果有碰到,就會產生要當心的狀況。
換個思考,與其費心找四周,不如把邊際或與之相連的 ‘O’ 抓出來,其他都改成 ‘X’ 即可。

Python

class Solution:
def solve(self, board: List[List[str]]) -> None:
"""
Do not return anything, modify board in-place instead.
"""
if not board or not board[0]: return
excludePos = set()
rows = len(board)
cols = len(board[0])

def searchExclude(y, x):
if y = rows: return
if x = cols: return

if board[y][x] == "O" and (y,x) not in excludePos:
excludePos.add((y,x))
searchExclude(y-1, x)
searchExclude(y+1, x)
searchExclude(y, x-1)
searchExclude(y, x+1)

for y in range(rows):
searchExclude(y, 0)
searchExclude(y, cols-1)

for x in range(cols):
searchExclude(0, x)
searchExclude(rows-1, x)

for x in range(1, cols-1):
for y in range(1, rows-1):
if board[y][x] == "O" and (y,x) not in excludePos:
board[y][x] = "X"

C#

public class Solution {
public int rows;
public int cols;
public HashSet excludePos;

public void Solve(char[][] board) {
rows = board.Length;
if(rows == 0){return;}
cols = board[0].Length;
if(cols == 0){return;}
excludePos = new HashSet();

for(int y = 0; y < rows; y++)
{
SearchExcluded(board, y, 0);
SearchExcluded(board, y, cols-1);
}
for(int x = 0; x < cols; x++)
{
SearchExcluded(board, 0, x);
SearchExcluded(board, rows-1, x);
}

for(int y = 0; y < rows; y++)
{
for(int x = 0; x < cols; x++)
{
if(board[y][x] == 'O' && !excludePos.Contains((y, x)))
{
board[y][x] = 'X';
}
}
}
}

public void SearchExcluded(char[][] board, int y, int x) {
if(y = rows){return;}
if(x = cols){return;}
if(board[y][x] == 'O' && !excludePos.Contains((y, x)))
{
excludePos.Add((y, x));
SearchExcluded(board, y-1, x);
SearchExcluded(board, y+1, x);
SearchExcluded(board, y, x-1);
SearchExcluded(board, y, x+1);
}
}
}

JN的CCNA: 如何使用

這裡依照 《CCCNA 200-301 Official Cert Guide》 這本書的目錄做章節的分類,這使得照這裡的步驟去學習是與官方指南是一致的。所以只要一回回都確實完成,就能含蓋所有範圍。

每個章節(Charpter)可以分成三個部分︰

學習內容」:
如果有書籍或其他來源沒有寫仔細的部分,我就會補充,否則只會放上出處。這裡會按照推薦順序排列,越好的會排在前面,多寡不一定,但最少一定會有書籍。

實作練習」:
搭配《Cisco Packet Tracer》作練習,使用的版本為「7.3」。實作可分為二種:解說型、演練型。解說型主要目的為配合當節內容作「觀察」,注重各時刻的狀況變化;演練型的會有幾種:單項設定、除錯、多項設定、設計。每個演練型的最後都要完成一些要求,如:ping通,或是切斷部分仍能正常運作。

相關題目」:
會把題庫中相關的題目放到這裡, 針對考題內容作實作(如果有辦法的話)。

我建議每個章節分三個狀態,然後自己紀錄下來進度,確保每個部分都有完成。

1. 「   」:尚未開始
2. 「X」:已經開始但尚未結束
3. 「O」:完成

JN的CCNA: 對學習CCNA的看法

前言 – – 對學習CCNA的看法 2020.06.13

我在 2020-06-12 考到了 CCNA 的證照。

有人覺得 CCNA 的證照很好考,也許是,因為只要把「題庫」背熟,背多分,就能考過。但能考過是一回事,要考滿分又是另外一回事。2020年改版的CCNA題庫,因為還不成熟,各家答案並不一致,所以要是沒有強大的「實作」能力,只背是不可能明暸前因後果,找到一個能信服自己的答案(但不一定是正確的)。

總之,如果在台灣考,選用某中文論壇(hh)的題庫,正確率高,範圍精準,品質也好。但是我覺得還是有美中不足的地方,就是有一些關鍵敘述是漏掉的,那會「嚴重」影響解題。這現象在各版現有我看過的題庫,都有出現。

我認為不必花錢買題庫,因為不能保障買到的品質,更不能買到自己到題目會有深刻的理解。只有腳踏實地,一個個篇章逐一擊破,拿到證書才能稱上實質合格的CCNA。

CCNA的考試範圍是很大的,官方書籍(ccna certification study guide)的頁數總和就有千頁以上!新版合併各範圍成一個 200-301,因此也把各範圍拉一些到書的後面章節,分數也佔了不少。那些篇章不是 router & switch ,就好像從頭從零開始,然後多半又屬於記憶性的。先不說能看完就算厲害的,但看完只是入門,不夠,需要實作,

講這麼多,我認為CCNA是需要很多時間去精熟的,培訓課程開66小時,但那只夠把要上的都粗略講一遍,除非夠聰明,不然很難一次就照單全收,且能夠互相搭配運用。除了上課之外,練習也是很重要的,大概也要再花66小時去練實作,實作會學到的跟用到的可能是CCNP或是CCIE級別的深度。這裡的實作不只是單一項目的設定,也可能包含一些情境式的設計,或是效率優化的配置,那會用到許多CCNA會講到的協定,使根基更穩固。

我也是有上班級的,課餘花了很多時間去探索那些CCNA範圍內的知識與其運作。有CCNA證照不代表那些該會的能做得出來,懂不懂,那一眼就看得出來。CCNA並不限制一定要上他們合作機構的課程才能考試,所以課程沒上完就能考證照,沒上課也可以考試。

有證照一定是加分,會做是門檻,「會不會做才是關鍵」。

真實的工作情況大部分都是TroubleShooting,而也只有多練,過程自己一定會有不小心(遺漏或打錯),思考可能是哪裡出了錯,去找出那些問題,並且解決掉,才有辦法去往高階去創建或維護大型且複雜的網路。

看到一些同學在練習時,一臉盲然,努力回想上次老師講了什麼指令,然後重頭輸入。他們學習充滿了挫折感,因為不知為何。一個「不小心」,就連TroubleShooting的能力都沒有,呆坐電腦前,因為他們的腦內世界沒有TroubleShooting指令,只有上課講到的指令。

這樣的學習方式是大錯特錯,我並不是嘲諷那些人或教學方式的死板,而且老師教得不錯。

「輸入指令絕對不是第一步!」

要先有一個期望或設計(目的地),然後再想說要輸什麼指令(決定交通方式),再輸入指令(前往目的地),檢查(有沒有到達正確的地方)。這也是寫程式語言的標準流程。

那些學得挫折的同學,大多都沒有第一步的概念,也沒有第二步的思考與選擇,所以連去哪都不清楚,自己在搭乘什麼也不清楚,當然,所以自己此時此刻身處何方是沒有概念的,內心可能有這種感受「我是誰?我在哪?我在幹嘛?」

又或者沒有能區分「設計」與「設定」的對錯。
「設計」沒有對錯,除非是不合規則的(如router二介面設計在同一網段)。
而「設定」是跟隨設計,設定才會有明顯的對錯分別,沒照設計或是不合規則就是錯的。

能夠按設計圖施工,設定完成一個結構的人,才是「工程師」。如果每一步都要等人發號施令,那只是「工人」。這也使我在教同學時,到底要把所有指令全講,或是提示部分讓他思考,最終培育出不同程度的能力。

總之,要培養一個明確的思維思路,我都稱之「程式邏輯」。難的不是指令背不起來,而是沒辦法想到與制定一個如SOP一步一步的概念,要是能想到,指令再補上,就套方法可以用到許多領域。

最後,我的目標是「CCIE」,而且還想要有二張,因此,
關於CCNA或CCNP的學習頁面會一直作整理(更新)直到我考完CCIE第二張的半年。
這是我的規劃,在這期間內,如果有任何問題或更新,我會「Best Effort」去做,要是有幫上忙,就給個支持或留個言。

Leetcode題解 Python & C#:六月挑戰DAY16 Validate IP Address

給一個字串 IP ,回傳其屬於 IPv4 或 IPv6 或都不是 Neighter。 
如果要找「合格」的字串,會想到用 re 去解決,這是在一般的情況下。如果是LeetCode,也許就不會用它。
不過官方的解法是有用到 re 的,直接傻眼,但那確實是最正當的解法。
通過「正則表達式(Regex)」是最嚴謹的做法,但也要有支持這項功能,在未知跟沒有的情況下,只能土炮出來。
這裡要從根本講,不論IPv6或是IPv4對電腦來說都是連續的二進位,IPv4長度為32bit,IPv6為128bit。
給人看的十進位跟十六進位是經由轉換而來的,如果換回原來的二進位形式,就只要留意是否長度是否合格就好。
所以把 string IP 轉換成連續二進位,就能輕而易舉去找出是否為合格的IP位置。(但是寫轉換的過程不容易) 

在 IPv4 中用「.」做分隔,是用十進位的數字,分四段,每一段要有8bit。
在 IPv6 中用「:」做分隔,是用十六進位的數字,分八段,每一段要有32bit。
寫成IP轉換版,轉 IPv6 或 IPv4 的流程是大同小異的,甚至可以只用一個函數修改一些傳入參數就能變成IPv4或IPv6皆可的式子。

Python

class Solution:
def validIPAddress(self, IP: str) -> str:

deci = {*"0123456789"}
hexdeci = {*"0123456789abcdef"}

def checkIPv4(IP):
group = IP.split(".")
if len(group) != 4: return False
for seg in group:
if not(3 >= len(seg) >= 1): return False
if any([c not in deci for c in seg]): return False
if not(255 >= int(seg) >= 0): return False
if str(int(seg)) != seg: return False
return True

def checkIPv6(IP):
group = IP.lower().split(":")
if len(group) != 8: return False
for seg in group:
if not(4 >= len(seg) >= 1): return False
if any([c not in hexdeci for c in seg]): return False
return True

if checkIPv4(IP): return "IPv4"
if checkIPv6(IP): return "IPv6"
return "Neither"

Python(IP轉換版)

class Solution:
def validIPAddress(self, IP: str) -> str:

decimal = {*"0123456789"}

def covertIPv4(IP):
IPv4 = ""
seg = ""
segCount = 0
for c in IP:
if c == ".":
segCount += 1
if segCount >= 4 or not seg: return False
if len(seg) > 1 and seg[0] == '0': return False
seg = "{:0>8}".format(bin(int(seg))[2:])
if len(seg) > 8: return False
IPv4 += seg
seg = ""
elif c in decimal:
seg += c
else:
return False
if seg:
if len(seg) > 1 and seg[0] == '0': return False
seg = "{:0>8}".format(bin(int(seg))[2:])
if len(seg) > 8: return False
IPv4 += seg
return len(IPv4) == 32

hexadecimal = {*"0123456789abcdefABCDEF"}

def covertIPv6(IP):
IPv6 = ""
seg = ""
segCount = 0
for c in IP:
if c == ":":
segCount += 1
if segCount >= 8 or not seg: return False
seg = "{:0>16}".format(seg)
if len(seg) > 16: return False
IPv6 += seg
seg = ""
elif c in hexadecimal:
seg += "{:0>4}".format(bin(int(c, 16))[2:])
else:
return False
if seg:
seg = "{:0>16}".format(seg)
if len(seg) > 16: return False
IPv6 += seg
return len(IPv6) == 128

if covertIPv4(IP): return "IPv4"
if covertIPv6(IP): return "IPv6"
return "Neither"

Python(IP轉換合一版)

class Solution:
def validIPAddress(self, IP: str) -> str:

decimal = {*"0123456789"}
hexadecimal = {*"0123456789abcdef"}

def covertIP(strIP, Segs, PerSegBit, Carry, Delimiter):
def addSeg(IP, seg):
if segCount >= Segs or not seg: return False
if Delimiter == "." and len(seg) > 1 and seg[0] == '0': return False
if Delimiter == ":" and len(seg) > 4: return False
try:
seg = ("{:0>"+str(PerSegBit)+"}").format(bin(int(seg, len(Carry)))[2:])
except:
return False
if len(seg) > PerSegBit: return False
return IP + seg

IP = seg = ""
segCount = 0
for c in strIP.lower():
if c == Delimiter:
segCount += 1
IP = addSeg(IP, seg)
if not IP: return False
seg = ""
elif c in Carry:
seg += c
else:
return False
if not seg: return False
IP = addSeg(IP, seg)
if not IP: return False
return len(IP) == Segs * PerSegBit

if covertIP(IP, 4, 8, decimal, "."): return "IPv4"
if covertIP(IP, 8, 16, hexadecimal, ":"): return "IPv6"
return "Neither"

C#

public class Solution {
public string ValidIPAddress(string IP) {
if(IsIPv4(IP)){return "IPv4";}
if(IsIPv6(IP)){return "IPv6";}
return "Neither";
}

private bool IsIPv4(string IP) {
var parts = IP.Split('.');
if(parts.Length != 4){return false;}
int dec = 0;
foreach(var part in parts)
{
if(!(Int32.TryParse(part, out dec))){return false;}
if(dec 255 || (dec.ToString().Length != part.Length)){return false;}
}
return true;
}

private bool IsIPv6(string IP) {
var parts = IP.Split(':');
if(parts.Length != 8){return false;}
int hex;
foreach(var part in parts)
{
if(part.Length > 4){return false;}
if(!Int32.TryParse(part,
System.Globalization.NumberStyles.HexNumber,
null,
out hex)){return false;}
if(hex < 0){return false;}
}
return true;
}
}

TestCase

"1.1.1.01"
"01.01.01.01"
"001.001.001.001"
"301.301.301.301"
"12..33.4"
"1.0.1."
"1.-1.1.1"
"0.0.0.0"
"172.16.254.1"
"256.256.256.256"
"2001:0db8:85a3:0:0:8A2E:0370:7334"
"2001:0db8:85a3::8A2E:0370:7334"
"2001:db8:85a3:0:0:8A2E:0370:7334"
"20EE:FGb8:85a3:0:0:8A2E:0370:7334"
"2001:0db8:85a3:00000:0:8A2E:0370:7334"
"1081:db8:85a3:01:-0:8A2E:0370:7334"
"2001:0db8:85a3:0:0:8A2E:0370:7334:"

Leetcode題解 Python:Maximum Frequency Stack

實作一個 FreqStack,類似 stack,但 pop() 會先從出現次數最高的最後一個開始,也就是 出現次數 > 位置 的順序。
這題導入了 Freq 的計數,因此要有一個計數的設計,用一個 HashTable 去記錄 val 對應的出現次數。
接下來要把 stack 套上以計數為優先的方式,出現最多次的一定先被 pop() 掉,對相同次數的來說,pop() 是正常的。
但對不同次數的來說,一定要先 pop() 光更多次的,才會輪到自己這一層。
如果連 push 五次同一個 val,那麼會是第五次的 val 先被 pop() ,才會換到第四次的 val,中間會有個換層的移動,如果已經pop()光就往下一層。
fruq = {1:[val], 2:[val], 3:[val], 4:[val], 5:[val]}
在計數的時候,各 val 計數的最高值也就是最優先要被 pop() 的那一層,用一個 MaxFreq 去記錄。
fruq[MaxFreq].pop() 過後,fruq[MaxFreq] == [] 時, MaxFreq -= 1 ,同時也要把 count[val] -= 1。
雖然標 hard,但非常快就解出了,感覺要定為 medium。不過結果我寫的跟官方的只有變數命名有差。

Python

class FreqStack:

def __init__(self):
self.count = defaultdict(int)
self.freq = defaultdict(list)
self.MaxFreq = 0

def push(self, x: int) -> None:
self.count[x] += 1
self.freq[self.count[x]].append(x)
self.MaxFreq = max(self.MaxFreq, self.count[x])

def pop(self) -> int:
num = self.freq[self.MaxFreq].pop()
self.count[num] -= 1
if not self.freq[self.MaxFreq]: self.MaxFreq -= 1
return num

Leetcode題解 Python & C#:Maximum Binary Tree

給一列沒有重複的整數陣列,要建立一個 maximum tree,規則如下,並回傳其 root 。

1.The root is the maximum number in the array.
2.The left subtree is the maximum tree constructed from left part subarray divided by the maximum number.

3.The right subtree is the maximum tree constructed from right part subarray divided by the maximum number.
root一定是陣列中最大的,最大值位置左方是左子樹的所有值,右方是右子樹的。
因此把 nums[:maxVal] 傳入到 constructMaximumBinaryTree 就可以得到左方子樹,右方也同理。
如此運作下去,最後會傳入一個空陣列,這就是「中止條件」,所以一遇到就馬上回傳 None 使其停止遞迴。

Python

class Solution:
def constructMaximumBinaryTree(self, nums: List[int]) -> TreeNode:
if not nums: return None
maxIdx = nums.index(max(nums))
return TreeNode(nums[maxIdx], self.constructMaximumBinaryTree(nums[:maxIdx]), self.constructMaximumBinaryTree(nums[maxIdx+1:]))

C#

public class Solution {
public TreeNode ConstructMaximumBinaryTree(int[] nums) {
if(nums.Length == 0){return null;}
int maxIdx = Array.IndexOf(nums, nums.Max());
return new TreeNode(nums[maxIdx],
ConstructMaximumBinaryTree(nums.Take(maxIdx).ToArray()),
ConstructMaximumBinaryTree(nums.Skip(maxIdx+1).Take(nums.Length-maxIdx+1).ToArray()));
}
}

Leetcode題解 Python & C#:六月挑戰DAY15 Search in a Binary Search Tree

給一個二元樹的根,要找到值為 val 的 node 並回傳,沒有則回傳 None。
這裡的二元樹是嚴格的,即 node 的左子樹皆小於自身,右子樹皆大於自身,即二元搜尋樹。
用一個標準的二元樹遞迴函數也能順利地解找到答案。
不過那樣會找到太多不必要的部分,也沒有用上二元搜尋樹的特色。
由於左邊皆比自身小,如果 val 小於 node.val,那就往左方而去,反之則右方。相等就直接回傳。

Python

class Solution:
def searchBST(self, root: TreeNode, val: int) -> TreeNode:
while root:
if root.val == val:
return root
elif root.val > val:
root = root.left
elif root.val < val:
root = root.right
return root

C#

public class Solution {
public TreeNode SearchBST(TreeNode root, int val) {
if(root is null || root.val == val)
return root;
if(root.val > val)
return SearchBST(root.left, val);
else
return SearchBST(root.right, val);
}
}

Leetcode題解 Python:Allocate Mailboxes

給一個陣列 houses ,houses[i]為第 i 個房子的位置,k 為郵筒數,要找出最佳分配下,每房子到最近郵筒的總距離。 
如果郵筒數夠,在每房子前面設一個是最好的,但如果不夠,就會折衷,在房子間找個中間點去設立。
這其實是一個分群的問題。
要設一個郵筒,如果只有二間房子,那最佳位置會在中間。如果三間,那郵筒會在中間的房子前。
換句話說,如果房子有偶數個,在中間那二間之內都可以。如果有奇數個,那只能在中間的房子前。
找到如何決定最佳設置點,接下來就要分 k 組,找到最短的距離總和。

要能決定出一個區間需要有兩個 index, 分別為 l, i。有了 l, i 就能去算距離總和。
用 DFS ,一旦只剩一個郵筒可設,就從只能去算 [l, len(houses)]的距離總和。
如果有二個以上郵筒的可設,就從在 [l,i] 設 或 當前不設 dfs[l, i+1, remain] 的總距離取小者。
或者,以 i 去找 [i,n] 間的選一個位置 j ,將 [i, j]之間的房子配設一個郵筒,然後從中取最小值。
同樣地,若只剩一個郵筒可設,就直接算到 [i, len(houses)] 的距離總和。
這方法好處是少用一個 index,若迴圈定好,也不用做超出邊界的判斷。

Python

class Solution:
def minDistance(self, houses: List[int], k: int) -> int:
houses.sort()
n = len(houses)

@lru_cache(None)
def calu_dst(si, ei):
avg = houses[(si+ei)//2]
return sum([abs(num - avg) for num in houses[si:ei]])

@lru_cache(None)
def dfs(i, remain):
if remain == 1: return calu_dst(i, n)
distance = 10000 # 1 <= houses[i] <= 10^4
for j in range(i+1, n+1-remain+1):
distance = min(distance, calu_dst(i, j) + dfs(j, remain-1))
return distance

return dfs(0, k)

Leetcode題解 Python:Find Two Non-overlapping Sub-arrays Each With Target Sum

給一個正整數陣列 arr ,跟一整數 target ,最找出二子陣列各自總和皆為target且二子陣列不重壘的最小長度總和。若沒有回傳 -1。
關於找子陣列(注意要為連續的或是稱序列)總和為target,通常用計算其累進值,accu[0] = arr[0], accu[1] = accu[0] + arr[0], accu[-1] = sum(arr)。
如果 accu[i] – target 在 accu 內,就代表有對應另外一個的連續子陣列存在。透過 accu[j] – accu[i] 可以找到 arr 任位置的連續子陣列總和。
在計算累進值的同時,就可以開始找目標值,也是這種算法的優勢,如果搭配 hash類 的查詢,只要累進值算完,就能找完所有可能,相當於 O(N) Time。 
首先要決定 ans 的預設值,因為如果拿 -1 當預設去比小,最後會是 -1 ,需要找一個比 -1 大且不會有可能出現的值,最大可能為 len(arr),所以 ans 預設為 len(arr) + 1。
一旦有 accu[i] – target 出現,表示現在到找一段總和為 target,這一段的頭位置為 accu[i] – target 在 accu 中的位置,尾位置為 i 。
如果前面已經有一段,只要前一段的尾位置 >= 這一段的頭位置,代表兩者沒有重壘到,就能拿二段長度相交去更新 ans 。
每個找到的子陣列其尾位置(i)是最先被知道的,之後的找到的子陣列只要其頭位置在此或之後,都可以與之形成合格的可能總長度。
如在 i 位置上找到總長度最短的 shortest,在 i 位置之後的找到每段其頭位置在 i 或 i 之後,都能與 shortest 組合起來。
因此可這麼看,在i與之後的位置最小長都是 shortest。
每個位置都有一個 shortest,整體用 shortests 紀錄。
shortests [i] 為頭位置在 i 時能組合最小的長度。
每位置不論有沒有找到,都要把 shortest 保存在 shortests [i]。
(※shortest: [default,s1,s1,s1,s2,s2,s2,s2,s3,…,shortest] )
找到一段,就用該段的頭位置 headPos 去對 shortest[headPos] 得到前方可組合的最小長度,二者長度相加去更新ans。
shortest 預設也為 len(arr)+1 ,如果前方沒有找到或沒能組合的,也不會改動 ans。

Python

class Solution:
def minSumOfLengths(self, arr: List[int], target: int) -> int:
accuPos = {0:-1}
accu = 0
ans = shortest = len(arr)+1
shortests = [len(arr)+1] * len(arr)
for i, num in enumerate(arr):
accu += num
accuPos[accu] = i
if accu - target in accuPos:
length = i - accuPos[accu - target]
if accuPos[accu - target] > -1:
ans = min(ans, length + shortests[accuPos[accu - target]])
shortest = min(shortest, length)
shortests[i] = shortest
return -1 if ans == len(arr)+1 else ans

Leetcode題解 Python:Kth Ancestor of a Tree Node

有 n 個 node,編號為[0, n-1],給一個 parent ,parent[i] 代表第 i 個 node 的 parent 為第 parent[i] 節。
然後給一 node 編號與 k ,要找出其第 k 個祖先。若沒有則回傳 -1 。
難的不是在於能不能順利找到,找到是難度 easy 的問題。難在於能不能「快速」地找到。
我在過程中有試過保存 2 跳的祖先,最糟也能在 25000 跳內解決,不過會超時。
關聯是一對一的,如果為每個node做map,即root到node的每node,就可以 1 跳解決,但是記憶體會爆,O(N**2) Space,因為每node的map都是不一樣的。
這題的關鍵在於要再哪一塊做取捨,如果純照parent跳,會用 O(N) Time。而且本題「大量」執行查詢,最多50000次,那會使沒做查詢優化的超時。
雖然我做了 2 跳祖先,但不夠,仍是 O(N) Time。如果換成保存「指數」跳的祖,就能把查詢變成 O(logN) Time,才有辦法應付大量的查詢。
依 parnet 可以找到 1(2**0) 跳的祖先,那 2(2**1) 跳的是1跳的再1跳,那 4(2**2) 跳呢?是2跳的再2跳。依此類推。

如果有 5 個 node ,那保存到 4(2**2)跳 的袓先就夠了;如果有 8 個 node,那保存到 8(2**3)跳。
因此要保存多少,看總數取log2決定,長度為 log2(n) + 1,而 + 1 是給 1(2**0)跳 空間。 
長度為16的話,代表最多也只會用到16次跳去找到第k個祖先。只有65535會用到16跳,因為其二進位有16個1。
這樣的保存轉換使 __init__() 會用上 O(NlogN) Time,而查詢會變成 O(logN) Time,但大量的查詢使其整體近 O(logN) Time,在效能與記憶體做最好的平衡。

Python

class TreeAncestor:
def __init__(self, n: int, parent):
m = int(math.log2(n)) + 1
self.table = [[-1 for _ in range(m)] for _ in range(n)]
for p in range(1,n):
self.table[p][0] = parent[p]
for k in range(1, m):
self.table[p][k] = self.table[self.table[p][k-1]][k-1]
if self.table[p][k] == -1: break

def getKthAncestor(self, node: int, k: int) -> int:
while k and node != -1:
pos = int(math.log2(k))
node = self.table[node][pos]
k -= 1 << pos
return node