《閱讀的方法》這本書中提到了很多書名,如何將其全部提取出來呢? Deepseek中輸入提示詞: 你是一個Python編程專家,寫一個提取書名的腳本,具體步驟如下: 讀取文件:"F:\book\Luo Zhen Yu\Yue Du De Fang Fa (3)\閱讀的方法.docx" 查找書中所有的成對書名號“《》”; 將書名號所在的這一段落提取出來,另存到docx文件:"F:\book\Luo Zhen Yu\Yue Du De Fang Fa (3)\閱讀的方法-書單.docx" 注意:每一步都要輸出信息到屏幕上 要實現(xiàn)這個功能,我們可以使用Python的python-docx庫來讀取和寫入Word文檔。以下是一個完整的腳本,它按照你的要求提取書名號所在的行,并將其保存到新的Word文檔中。 首先,確保你已經(jīng)安裝了python-docx庫。如果沒有安裝,可以使用以下命令進行安裝: bash 復制 pip install python-docx 然后,編寫以下Python腳本: from docx import Document # 定義文件路徑 input_file_path = r"F:\book\Luo Zhen Yu\Yue Du De Fang Fa (3)\閱讀的方法.docx" output_file_path = r"F:\book\Luo Zhen Yu\Yue Du De Fang Fa (3)\閱讀的方法-書單.docx" # 讀取原始文檔 print(f"正在讀取文件: {input_file_path}") doc = Document(input_file_path) # 創(chuàng)建一個新的文檔用于保存提取的內(nèi)容 output_doc = Document() # 遍歷文檔中的每一個段落 print("開始查找書名號...") for para in doc.paragraphs: # 檢查段落中是否包含書名號“《”和“》” if '《' in para.text and '》' in para.text: print(f"找到包含書名號的行: {para.text}") # 將該段落添加到新文檔中 output_doc.add_paragraph(para.text) # 保存提取的內(nèi)容到新文檔 print(f"正在保存提取的內(nèi)容到: {output_file_path}") output_doc.save(output_file_path) print("提取和保存完成!") 程序運行結(jié)果: |
|