這大概算是Python最難啃的一塊骨頭吧。在我Python生涯的這一年里,我遇到了一些Pythoner,他們毫無例外地完全不會使用函數(shù)式編程(有些人喜歡稱為Pythonic),比如,從來不會傳遞函數(shù),不知道lambda是什么意思,知道列表展開但從來不知道用在哪里,對Python不提供經(jīng)典for循環(huán)感到無所適從,言談之中表現(xiàn)出對函數(shù)式風(fēng)格的一種抗拒甚至厭惡。 我嘗試剖析這個問題,最終總結(jié)了這么兩個原因:1、不想改變,認為現(xiàn)有的知識可以完成任務(wù);2、對小眾語言的歧視,Python目前在國內(nèi)市場份額仍然很小很小,熟悉Python風(fēng)格用處不大。 然而我認為,學(xué)習(xí)使用一種截然不同的風(fēng)格可以顛覆整個編程的思想。我會慢慢總結(jié)一個系列共4篇文字,篇幅都不大,輕松就能看完,希望對喜歡Python的人們有所幫助,因為我個人確實從中受益匪淺。 還是那句老話,尊重作者的勞動,轉(zhuǎn)載請注明原作者和原地址:) 1. 函數(shù)式編程概述 1.1. 什么是函數(shù)式編程? 函數(shù)式編程使用一系列的函數(shù)解決問題。函數(shù)僅接受輸入并產(chǎn)生輸出,不包含任何能影響產(chǎn)生輸出的內(nèi)部狀態(tài)。任何情況下,使用相同的參數(shù)調(diào)用函數(shù)始終能產(chǎn)生同樣的結(jié)果。 在一個函數(shù)式的程序中,輸入的數(shù)據(jù)“流過”一系列的函數(shù),每一個函數(shù)根據(jù)它的輸入產(chǎn)生輸出。函數(shù)式風(fēng)格避免編寫有“邊界效應(yīng)”(side effects)的函數(shù):修改內(nèi)部狀態(tài),或者是其他無法反應(yīng)在輸出上的變化。完全沒有邊界效應(yīng)的函數(shù)被稱為“純函數(shù)式的”(purely functional)。避免邊界效應(yīng)意味著不使用在程序運行時可變的數(shù)據(jù)結(jié)構(gòu),輸出只依賴于輸入。 可以認為函數(shù)式編程剛好站在了面向?qū)ο缶幊痰膶α⒚?。對象通常包含?nèi)部狀態(tài)(字段),和許多能修改這些狀態(tài)的函數(shù),程序則由不斷修改狀態(tài)構(gòu)成;函數(shù)式編程則極力避免狀態(tài)改動,并通過在函數(shù)間傳遞數(shù)據(jù)流進行工作。但這并不是說無法同時使用函數(shù)式編程和面向?qū)ο缶幊?,事實上,?fù)雜的系統(tǒng)一般會采用面向?qū)ο蠹夹g(shù)建模,但混合使用函數(shù)式風(fēng)格還能讓你額外享受函數(shù)式風(fēng)格的優(yōu)點。 1.2. 為什么使用函數(shù)式編程? 函數(shù)式的風(fēng)格通常被認為有如下優(yōu)點: - 邏輯可證
這是一個學(xué)術(shù)上的優(yōu)點:沒有邊界效應(yīng)使得更容易從邏輯上證明程序是正確的(而不是通過測試)。 - 模塊化
函數(shù)式編程推崇簡單原則,一個函數(shù)只做一件事情,將大的功能拆分成盡可能小的模塊。小的函數(shù)更易于閱讀和檢查錯誤。 - 組件化
小的函數(shù)更容易加以組合形成新的功能。 - 易于調(diào)試
細化的、定義清晰的函數(shù)使得調(diào)試更加簡單。當(dāng)程序不正常運行時,每一個函數(shù)都是檢查數(shù)據(jù)是否正確的接口,能更快速地排除沒有問題的代碼,定位到出現(xiàn)問題的地方。 - 易于測試
不依賴于系統(tǒng)狀態(tài)的函數(shù)無須在測試前構(gòu)造測試樁,使得編寫單元測試更加容易。 - 更高的生產(chǎn)率
函數(shù)式編程產(chǎn)生的代碼比其他技術(shù)更少(往往是其他技術(shù)的一半左右),并且更容易閱讀和維護。 1.3. 如何辨認函數(shù)式風(fēng)格? 支持函數(shù)式編程的語言通常具有如下特征,大量使用這些特征的代碼即可被認為是函數(shù)式的: - 函數(shù)是一等公民
函數(shù)能作為參數(shù)傳遞,或者是作為返回值返回。這個特性使得模板方法模式非常易于編寫,這也促使了這個模式被更頻繁地使用。 以一個簡單的集合排序為例,假設(shè)lst是一個數(shù)集,并擁有一個排序方法sort需要將如何確定順序作為參數(shù)。 如果函數(shù)不能作為參數(shù),那么lst的sort方法只能接受普通對象作為參數(shù)。這樣一來我們需要首先定義一個接口,然后定義一個實現(xiàn)該接口的類,最后將該類的一個實例傳給sort方法,由sort調(diào)用這個實例的compare方法,就像這樣: 1 2 3 4 5 6 7 8 9 | #偽代碼
interface Comparator {
compare(o1, o2)
}
lst = list ( range ( 5 ))
lst.sort(Comparator() {
compare(o1, o2) {
return o2 - o1 / / 逆序
})
|
可見,我們定義了一個新的接口、新的類型(這里是一個匿名類),并new了一個新的對象只為了調(diào)用一個方法。如果這個方法可以直接作為參數(shù)傳遞會怎樣呢?看起來應(yīng)該像這樣:
1 2 3 4 | def compare(o1, o2):
return o2 - o1 #逆序
lst = list ( range ( 5 ))
lst.sort(compare)
|
請注意,前一段代碼已經(jīng)使用了匿名類技巧從而省下了不少代碼,但仍然不如直接傳遞函數(shù)簡單、自然。
- 匿名函數(shù)(lambda)
lambda提供了快速編寫簡單函數(shù)的能力。對于偶爾為之的行為,lambda讓你不再需要在編碼時跳轉(zhuǎn)到其他位置去編寫函數(shù)。
lambda表達式定義一個匿名的函數(shù),如果這個函數(shù)僅在編碼的位置使用到,你可以現(xiàn)場定義、直接使用:
1 | lst.sort( lambda o1, o2: o1.compareTo(o2))
|
相信從這個小小的例子你也能感受到強大的生產(chǎn)效率:)
- 封裝控制結(jié)構(gòu)的內(nèi)置模板函數(shù)
為了避開邊界效應(yīng),函數(shù)式風(fēng)格盡量避免使用變量,而僅僅為了控制流程而定義的循環(huán)變量和流程中產(chǎn)生的臨時變量無疑是最需要避免的。
假如我們需要對剛才的數(shù)集進行過濾得到所有的正數(shù),使用指令式風(fēng)格的代碼應(yīng)該像是這樣:
1 2 3 4 | lst2 = list ()
for i in range ( len (lst)): #模擬經(jīng)典for循環(huán)
if lst[i] > 0 :
lst2.append(lst[i])
|
這段代碼把從創(chuàng)建新列表、循環(huán)、取出元素、判斷、添加至新列表的整個流程完整的展示了出來,儼然把解釋器當(dāng)成了需要手把手指導(dǎo)的傻瓜。然而,“過濾”這個動作是很常見的,為什么解釋器不能掌握過濾的流程,而我們只需要告訴它過濾規(guī)則呢?
在Python里,過濾由一個名為filter的內(nèi)置函數(shù)實現(xiàn)。有了這個函數(shù),解釋器就學(xué)會了如何“過濾”,而我們只需要把規(guī)則告訴它:
1 | lst2 = filter ( lambda n: n > 0 , lst)
|
這個函數(shù)帶來的好處不僅僅是少寫了幾行代碼這么簡單。
封裝控制結(jié)構(gòu)后,代碼中就只需要描述功能而不是做法,這樣的代碼更清晰,更可讀。因為避開了控制結(jié)構(gòu)的干擾,第二段代碼顯然能讓你更容易了解它的意圖。
另外,因為避開了索引,使得代碼中不太可能觸發(fā)下標(biāo)越界這種異常,除非你手動制造一個。
函數(shù)式編程語言通常封裝了數(shù)個類似“過濾”這樣的常見動作作為模板函數(shù)。唯一的缺點是這些函數(shù)需要少量的學(xué)習(xí)成本,但這絕對不能掩蓋使用它們帶來的好處。
- 閉包(closure)
閉包是綁定了外部作用域的變量(但不是全局變量)的函數(shù)。大部分情況下外部作用域指的是外部函數(shù)。
閉包包含了自身函數(shù)體和所需外部函數(shù)中的“變量名的引用”。引用變量名意味著綁定的是變量名,而不是變量實際指向的對象;如果給變量重新賦值,閉包中能訪問到的將是新的值。
閉包使函數(shù)更加靈活和強大。即使程序運行至離開外部函數(shù),如果閉包仍然可見,則被綁定的變量仍然有效;每次運行至外部函數(shù),都會重新創(chuàng)建閉包,綁定的變量是不同的,不需要擔(dān)心在舊的閉包中綁定的變量會被新的值覆蓋。
回到剛才過濾數(shù)集的例子。假設(shè)過濾條件中的 0 這個邊界值不再是固定的,而是由用戶控制。如果沒有閉包,那么代碼必須修改為:
1 2 3 4 5 6 7 8 9 | class greater_than_helper:
def __init__( self , minval):
self .minval = minval
def is_greater_than( self , val):
return val > self .minval
def my_filter(lst, minval):
helper = greater_than_helper(minval)
return filter (helper.is_greater_than, lst)
|
請注意我們現(xiàn)在已經(jīng)為過濾功能編寫了一個函數(shù)my_filter。如你所見,我們需要在別的地方(此例中是類greater_than_helper)持有另一個操作數(shù)minval。
如果支持閉包,因為閉包可以直接使用外部作用域的變量,我們就不再需要greater_than_helper了:
1 2 | def my_filter(lst, minval):
return filter ( lambda n: n > minval, lst)
|
可見,閉包在不影響可讀性的同時也省下了不少代碼量。
函數(shù)式編程語言都提供了對閉包的不同程度的支持。在Python 2.x中,閉包無法修改綁定變量的值,所有修改綁定變量的行為都被看成新建了一個同名的局部變量并將綁定變量隱藏。Python 3.x中新加入了一個關(guān)鍵字 nonlocal 以支持修改綁定變量。但不管支持程度如何,你始終可以訪問(讀取)綁定變量。
- 內(nèi)置的不可變數(shù)據(jù)結(jié)構(gòu)
為了避開邊界效應(yīng),不可變的數(shù)據(jù)結(jié)構(gòu)是函數(shù)式編程中不可或缺的部分。不可變的數(shù)據(jù)結(jié)構(gòu)保證數(shù)據(jù)的一致性,極大地降低了排查問題的難度。
例如,Python中的元組(tuple)就是不可變的,所有對元組的操作都不能改變元組的內(nèi)容,所有試圖修改元組內(nèi)容的操作都會產(chǎn)生一個異常。
函數(shù)式編程語言一般會提供數(shù)據(jù)結(jié)構(gòu)的兩種版本(可變和不可變),并推薦使用不可變的版本。
- 遞歸
遞歸是另一種取代循環(huán)的方法。遞歸其實是函數(shù)式編程很常見的形式,經(jīng)??梢栽谝恍┧惴ㄖ幸姷?。但之所以放到最后,是因為實際上我們一般很少用到遞歸。如果一個遞歸無法被編譯器或解釋器優(yōu)化,很容易就會產(chǎn)生棧溢出;另一方面復(fù)雜的遞歸往往讓人感覺迷惑,不如循環(huán)清晰,所以眾多最佳實踐均指出使用循環(huán)而非遞歸。
這一系列短文中都不會關(guān)注遞歸的使用。
<第一節(jié)完>
|