要使用Python读取Word文档,可以使用pythondocx
库,首先需要安装这个库,可以使用以下命令进行安装:
pip install pythondocx
接下来,我们可以使用以下代码来读取Word文档中的文本、小标题和表格数据:
import docx 打开Word文档 doc = docx.Document('example.docx') 读取文本 for paragraph in doc.paragraphs: print(paragraph.text) 读取小标题 for paragraph in doc.paragraphs: if paragraph.style.name.startswith('Heading'): print(paragraph.text) 读取表格数据 tables = doc.tables for table in tables: for row in table.rows: for cell in row.cells: print(cell.text, end=' ') print()
将example.docx
替换为你要读取的Word文档的文件名,这段代码将打印出文档中的所有文本、小标题和表格数据。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/465684.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复