Python生成器的詳細(xì)介紹,首先生成器是Python初級開發(fā)者最難理解的概念之一,雖被認(rèn)為是Python編程中的高級技能,但在各種項目中可以隨處見到生成器的身影,你得不得去理解它、使用它、甚至愛上它。 提到生成器,總不可避免地要把迭代器拉出來對比著講,生成器就是一個在行為上和迭代器非常類似的對象,如果把迭代器比作Android系統(tǒng),那么生成器就是iOS,二者功能上差不多,但是生成器更優(yōu)雅。 什么是迭代器 顧名思義,迭代器就是用于迭代操作(for循環(huán))的對象,它像列表一樣可以迭代獲取其中的每一個元素,任何實現(xiàn)了__next__方法(python2是next)的對象都可以稱為迭代器。 它與列表的區(qū)別在于,構(gòu)建迭代器的時候,不像列表把所有元素一次性加載到內(nèi)存,而是以一種延遲計算(lazyevaluation)方式返回元素,這正是它的優(yōu)點。比如列表含有中一千萬個整數(shù),需要占超過400M的內(nèi)存,而迭代器只需要幾十個字節(jié)的空間。因為它并沒有把所有元素裝載到內(nèi)存中,而是等到調(diào)用next方法時候才返回該元素(按需調(diào)用callbyneed的方式,本質(zhì)上for循環(huán)就是不斷地調(diào)用迭代器的next方法)。 以斐波那契數(shù)列為例來實現(xiàn)一個迭代器: class Fib: def __init__(self, n): self.prev = 0 self.cur = 1 self.n = n def __iter__(self): return self def __next__(self): if self.n > 0: value = self.cur self.cur = self.cur + self.prev self.prev = value self.n -= 1 return value else: raise StopIteration() # 兼容python2 def __next__(self): return self.next() f = Fib(10) print([i for i in f]) #[1, 1, 2, 3, 5, 8, 13, 21, 34, 55] 什么是生成器 知道迭代器之后,就可以正式進(jìn)入生成器的話題了。普通函數(shù)用return返回一個值,和Java等其他語言是一樣的,然而在Python中還有一種函數(shù),用關(guān)鍵字yield來返回值,這種函數(shù)叫生成器函數(shù),函數(shù)被調(diào)用時會返回一個生成器對象,生成器本質(zhì)上還是一個迭代器,也是用在迭代操作中,因此它有和迭代器一樣的特性,唯一的區(qū)別在于實現(xiàn)方式上不一樣,后者更加簡潔 最簡單的生成器函數(shù): >>> def func(n): ... yield n*2 ... >>> func <function func at 0x00000000029F6EB8> >>> g = func(5) >>> g <generator object func at 0x0000000002908630> >>> func就是一個生成器函數(shù),調(diào)用該函數(shù)時返回對象就是生成器g,這個生成器對象的行為和迭代器是非常相似的,可以用在for循環(huán)等場景中。注意yield對應(yīng)的值在函數(shù)被調(diào)用時不會立刻返回,而是調(diào)用next方法時(本質(zhì)上for循環(huán)也是調(diào)用next方法)才返回 >>> g = func(5) >>> next(g) 10 >>> g = func(5) >>> for i in g: ... print(i) ... 10 那為什么要用生成器呢?顯然,用生成器在逼格上要比迭代器高幾個等級,它沒有那么多冗長代碼了,而且性能上一樣的高效,為什么不用呢?來看看用生成器實現(xiàn)斐波那契數(shù)列有多簡單。 def fib(n): prev, curr = 0, 1 while n > 0: n -= 1 yield curr prev, curr = curr, curr + prev print([i for i in fib(10)]) #[1, 1, 2, 3, 5, 8, 13, 21, 34, 55] 生成器表達(dá)式 在前面一期「這樣寫代碼更優(yōu)雅」的文章里面曾經(jīng)介紹過列表推導(dǎo)式(listcomprehension),生成器表達(dá)式與列表推導(dǎo)式長的非常像,但是它倆返回的對象不一樣,前者返回生成器對象,后者返回列表對象。 >>> g = (x*2 for x in range(10)) >>> type(g) <type 'generator'> >>> l = [x*2 for x in range(10)] >>> type(l) <type 'list'> |
|