字處理軟件是平時辦公必備的同時也是最常用的軟件之一,而字處理軟件用的最多最頻繁的就是微軟的word,其擴展名為docx。在日常工作中,可能需要對很多的docx文件進行批處理,例如教師在批閱學生提交的電子版作業(yè)時,需要填寫日期等信息,假設一個年級有100人,那么100份作業(yè)就需要填寫100次日期,這個工作是簡單的、重復的,那么是不是可以將這個工作交給計算機去做呢? 要想讓計算機完成這項工作,就需要通過編程的方式告訴計算機應該怎么做。我們選擇python編程語言來完成這項工作。 第一步:安裝第三方操作docx文件的依賴庫docx。 python中提供了支持讀寫docx文件的庫為python-docx,首先需要安裝這個第三方庫,可以通過包管理軟件pip來完成。 pip install python-docx 第二步:打開docx文件,假設要打開的文件名為'作業(yè)1.docx'。 doc = Document('作業(yè)1.docx') 有了docx對象,接下來就可以對文件進行操作了。 第三步:找到需要修改的位置,并完成修改。 通過分析docx文檔,了解到需要處理的內(nèi)容在表格中。 t0 = doc.tables[0] 該方法可以獲得文件的第一個表格。 接下來可以獲得表格的第一行。 row0 = t0.rows[0] 接下來可以獲得該行的第一個單元格,并打印該單元格的內(nèi)容。 cell0 = row0.cells[0] cell0.text # 輸出結(jié)果為:學號 該結(jié)果與文章開頭的文件截圖內(nèi)容一致,從上面可以看到,利用python的docx庫,可以非常方便的操作docx文件。 按照最初提出的需求,需要將表格中的日期修改為今天,可以看到該單元格位于第一個表格的第二行的第二個單元格。 doc.tables[0].rows[1].cells[1].text = '2019-07-19' 第四步:保存文件。 doc.save('作業(yè)1-new.docx') 最后一步:批處理所有文件。 要想批處理所有文件,只需要遍歷指定文件夾中的所有文件,然后通過上面的方式對每一個文件進行處理即可完成任務。 import pathlib from docx import Document
for item in pathlib.Path('/作業(yè)目錄').iterdir(): # item.name 即為文件名 doc = Document(item.name) doc.tables[0].rows[1].cells[1].text = '2019-07-19' doc.save(item.name) 本文介紹了利用python批處理docx文件的方法,這個方法是非常實用、有效的,能夠極大的提高工作效率,充分踐行把簡單的、重復的工作交給計算機。還在等什么呢,趕快下載試用吧,get一個新的技能! 如果您對本文感興趣,歡迎持續(xù)關注后續(xù)更多Python應用系列文章。 參考文獻 [1] python-docx documentation. https://python-docx./en/latest/ where2go 團隊 |
|