港服(Server.HK)Python教程:python如何在word中读取表格内容

word文件看起来很复杂,不方便结构化。事实上,word文档中大概有几种内容:paragraph(段落)、table(表…

word文件看起来很复杂,不方便结构化。事实上,word文档中大概有几种内容:paragraph(段落)、table(表格)、character(字符)。我现在要分析的word文档基本都是段落和表格。本文主要讲述从word中分析表格,并将表格信息结构化的方法。

1、为了使用python解析word文件,可以使用包docx,首先需要在python中安装它。

pip install python-docx

2、安装后,就可以读取word文件。

importdocx
fn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据
for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据
 
for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text)
 
table_num=len(doc.tables)#获取文档的表格个数
 
print(table_num)
 
table_0=doc.tables[0]#选取第一个表
 
table_rows =len(table_0.rows)#获取第一个表的行数
 
print(table_rows)
 
tab=doc.tables[0].rows[0].cells[0]#获取第一张表第一行第一列数据
 
print(tab.text)
 
par= doc.paragraphs[2]#读取第三段数据
 
print(par.text)

以上就是python在word中读取表格内容的方法,希望对大家有所帮助。更多Python学习指路:港服(Server.HK)python教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

为您推荐

港服(Server.HK)Python教程:如何实现对Python中列表的排序?

对List进行排序,Python提供了两个方法 方法1.用List的内建函数list.sort进行排序 list.sor...

港服(Server.HK)Python教程:python迭代器中的函数整理

1、可以连接迭代器的函数 chain:按顺序将多个迭代器连接成一个迭代器。 Cycle:重复迭代器的所有元素。 Tee:...

港服(Server.HK)Python教程:用Python举例实现逆波兰表达式

逆波兰表达式是编译原理中的一种基本表达式,利用Python语言也可以实现逆波兰表达式的输出,这里举例实践说明: 什么是逆...

Python 程序:检查给定字符串是否为回文

港服(Server.HK)Python教程: 用一个实例写一个 Python 程序来检查给定的字符串是不是回文。在 Py...

港服(Server.HK)Python教程:python3判断字典中key是否存在

今天来说一下如何判断字典中是否存在某个key,一般有两种通用做法,下面为大家来分别讲解一下: 第一种方法:使用自带函数实...
返回顶部