excel 歡迎點(diǎn)擊右上角關(guān)注小編,除了分享技術(shù)文章之外還有很多福利,私信學(xué)習(xí)資料可以領(lǐng)取包括不限于Python實戰(zhàn)演練、面試集錦、學(xué)習(xí)資料等。 前言成堆的數(shù)據(jù)如何導(dǎo)入Excel進(jìn)行分析? 大量的表格等待統(tǒng)計? 作為人生苦短的Python程序員,改如何優(yōu)雅地操作Excel? 得益于各位開源大佬的貢獻(xiàn),Python處理Excel擁有眾多的庫,使用它們我們就直接能批量處理Excel標(biāo)的。使用的比較多的有:
環(huán)境配置:再好的庫,也需要在正確的Python版本與環(huán)境中才能運(yùn)行 各個版本對應(yīng)的環(huán)境 上圖標(biāo)題欄是對應(yīng)的環(huán)境,左側(cè)是包名。各位可以參考一下,記得別安裝錯了。 xlutils 僅支持 xls 文件,即2003以下版本; openpyxl 主要是用于助理2010版本。即使文件庫中沒有安裝office也能自動生成excel表格。 win32com 與 DataNitro 僅支持 windows 系統(tǒng); xlwings 安裝成功后,如果運(yùn)行提示報錯“ImportError: no module named win32api”, 請使用 pip install pywin32指令安裝win32模塊 win32com 不是獨(dú)立的擴(kuò)展庫,而是集成在其他庫中,安裝 pypiwin32 或者 pywin32 包即可使用; DataNitro 是 Excel 的插件,安裝需到官網(wǎng)下載。 文檔操作:雖然大家都是操作 Excel,但即使最基本的新建文件、修改文件、保存文件等功能,在不同的庫中也存在差異。比如 xlsxwriter 并不支持打開或修改現(xiàn)有文件,xlwings 不支持對新建文件的命名,DataNitro 作為 Excel 插件需依托于軟件本身,pandas 新建文檔需要依賴其他庫等等。 支持的功能 上圖是各個庫包支持的功能,在編碼之前記得看一下你需要的功能是否支持。 基本功能由于設(shè)計目的不同,每個模塊通常著重于某一方面功能,各有所長。 xlwings 可結(jié)合 VBA 實現(xiàn)對 Excel 編程,強(qiáng)大的數(shù)據(jù)輸入分析能力,同時擁有豐富的接口,結(jié)合 pandas/numpy/matplotlib 輕松應(yīng)對 Excel 數(shù)據(jù)處理工作。 openpyxl 簡單易用,功能廣泛,單元格格式/圖片/表格/公式/篩選/批注/文件保護(hù)等等功能應(yīng)有盡有,圖表功能是其一大亮點(diǎn),缺點(diǎn)是對 VBA 支持的不夠好。 pandas 數(shù)據(jù)處理是 pandas 的立身之本,Excel 作為 pandas 輸入/輸出數(shù)據(jù)的容器。 win32com 從命名上就可以看出,這是一個處理 windows 應(yīng)用的擴(kuò)展,Excel 只是該庫能實現(xiàn)的一小部分功能。該庫還支持 office 的眾多操作。需要注意的是,該庫不單獨(dú)存在,可通過安裝 pypiwin32 或者 pywin32 獲取。 xlsxwriter 擁有豐富的特性,支持圖片/表格/圖表/篩選/格式/公式等,功能與openpyxl相似,優(yōu)點(diǎn)是相比 openpyxl 還支持 VBA 文件導(dǎo)入,迷你圖等功能,缺點(diǎn)是不能打開/修改已有文件,意味著使用 xlsxwriter 需要從零開始。 DataNitro 作為插件內(nèi)嵌到 Excel 中,可完全替代 VBA,在 Excel 中使用 python 腳本。既然被稱為 Excel 中的 python,協(xié)同其他 python 庫亦是小事一樁。然而,這是付費(fèi)插件... xlutils 基于 xlrd/xlwt,老牌 python 包,算是該領(lǐng)域的先驅(qū),功能特點(diǎn)中規(guī)中矩,比較大的缺點(diǎn)是僅支持 xls 文件。 性能我們對幾個庫做了最基本的寫入和讀取測試,分別使用不同庫進(jìn)行添加及讀取 1000行 * 700列 數(shù)據(jù)操作,得到所用時間,重復(fù)操作取平均值。另外在不同的電腦配置,不同的環(huán)境下結(jié)果肯定會有出入,數(shù)據(jù)僅供參考。 讀寫時間 注:xlutils 最多只能寫入 256 列,即 1000*256,用時3.8秒,表現(xiàn)不錯; DataNitro 與 xlsxwriter 不能打開 Excel 文件。 小結(jié)通過以上的分析,相信大家對幾個庫都有了簡單的了解。在編寫文章的過程中,筆者也在思考各個庫最適合的應(yīng)用場景。 不想使用 GUI 而又希望賦予 Excel 更多的功能,openpyxl 與 xlsxwriter,你可二者選其一; 需要進(jìn)行科學(xué)計算,處理大量數(shù)據(jù),建議 pandas+xlsxwriter 或者 pandas+openpyxl; 想要寫 Excel 腳本,會 Python 但不會 VBA 的同學(xué),可考慮 xlwings 或 DataNitro; 至于 win32com,不管是功能還是性能都很強(qiáng)大,有 windows 編程經(jīng)驗的同學(xué)可以使用。不過它相當(dāng)于是 windows COM 的封裝,自身并沒有很完善的文檔,新手使用起來略有些痛苦。 你可根據(jù)自己的需求和生產(chǎn)環(huán)境,選擇合適的 Python-Excel 模塊。 代碼示例最后,附上一些演示代碼,大家可自行體會下不同模塊的使用。
xlwings基本代碼
xlsxwriter基本代碼
import xlrd #讀取數(shù)據(jù)import xlwt #寫入數(shù)據(jù)import xlutils #操作excel#----xlrd庫#打開excel文件workbook = xlrd.open_workbook('myexcel.xls')#獲取表單worksheet = workbook.sheet_by_index(0)#讀取數(shù)據(jù)data = worksheet.cell_value(0,0)#----xlwt庫#新建excelwb = xlwt.Workbook#添加工作薄sh = wb.add_sheet(sheetname='Sheet1')#寫入數(shù)據(jù)sh.write(0,0,'data')#保存文件wb.save('myexcel.xls')#----xlutils庫#打開excel文件book = xlrd.open_workbook('myexcel.xls')#復(fù)制一份new_book = xlutils.copy(book)#拿到工作薄worksheet = new_book.getsheet(0)#寫入數(shù)據(jù)worksheet.write(0,0,'new data')#保存new_book.save()
import win32com.client as wc #啟動Excel應(yīng)用 excel_app = wc.Dispatch('Excel.Application') #連接excel workbook = excel_app.Workbooks.Open(r'e:/myexcel.xlsx' ) #寫入數(shù)據(jù) workbook.Worksheets('Sheet1').Cells(1,1).Value = 'data' #關(guān)閉并保存 workbook.SaveAs('newexcel.xlsx') excel_app.Application.Quit
import openpyxl # 新建文件 workbook = openpyxl.Workbook # 寫入文件 sheet = workbook.activesheet['A1']='data' # 保存文件 workbook.save('test.xlsx')
#單一單元格賦值 Cell('A1').value = 'data' #單元區(qū)域賦值 CellRange('A1:B2').value = 'data' 介紹就到此結(jié)束 |
|