首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python高效办公|如何正确处理word中的表格

Python高效办公|如何正确处理word中的表格

作者头像
罗罗攀
发布于 2021-12-06 09:49:20
发布于 2021-12-06 09:49:20
2.5K00
代码可运行
举报
运行总次数:0
代码可运行

项目由来

很久没更新Python高效办公系列的文章啦,最近就遇到一个很适合Python来做的一件事情,分享给大家。

是这样的,如word所示,我们需要将里面的部分数据整理为excel表格,以便我后期使用。当然,数据我做了脱敏处理,但是这些坐标都是真实存在的,是武汉的地标,这就留给大家去探索了;其次,真实的数据有很多,如果一个个拷贝就很麻烦。所以,我们就来看看Python怎么分分钟完成这项任务。

解题思路

这里的关键点是提取经纬度(X和Y),X是8位的数字,Y是7位数字,我们这时候很容易想到用正则表达式。正则表达式我之前就有讲解过,不愧是YYDS。

X是8位,很好提取,直接用\d{8}就行;但是7位的Y就不能直接这样写,因为这样也会匹配到X中的数字(因为X有8位,7位小于8位,会匹配到),所以我们需要在前面和后面加上英文逗号,加以限制。

最后,要解决的就是如何读取word中的表格,和读取后怎么写入excel表中。这两个问题使用docx和xlwt库即可,别忘记安装这两个库。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install python-docx
pip install xlwt

实现代码

下面就是我写的代码,都加了注释,希望大家自己也尝试写一下。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from docx import Document #用于读取word
import re #正则表达式库
import xlwt #写入excel的库

# 创建excel工作簿和sheet,在第一行写入表头。
workbook = xlwt.Workbook(encoding='utf-8')
sheet = workbook.add_sheet('点位')
sheet.write(0, 0, "点位")
sheet.write(0, 1, "X")
sheet.write(0, 2, "Y")

# 读取word,并获取word中的第一个表
doc = Document('坐标.docx')
tb1 = doc.tables[0]

# 定义临时变量,用于一行行写入数据到excel。
j = 1

# 读取word表中的数据,正则表达式提取后写入excel中。
for i in range(len(tb1.rows)):
    if i == 0:
        continue
    title = tb1.cell(i, 0).text
    coordinate = tb1.cell(i, 3).text
    lons = re.findall('(\d{8})', coordinate)
    lats = re.findall(',(\d{7}),', coordinate)
    for lon, lat in zip(lons, lats):
        sheet.write(j, 0, title)
        sheet.write(j, 1, lon)
        sheet.write(j, 2, lat)
        j += 1
    print(title, lons, lats)

# 保存文件
workbook.save('test.xls')

最后,大家有没有碰到过类似重复操作的任务,大家平时是怎么做的,留言和我讨论吧~

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/8/23 下,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python办公自动化| word 表格转excel
之前写过一篇 Python办公自动化 | 批量word报告生成工具 ,有小伙伴提出了逆向需求,即:从批量word中获取内容并写入excel,需求背景是汇总一些材料,举例:实习鉴定表、个人简历、档案等。
披头
2020/07/06
3.2K1
【Python爬虫】 电影Top250信息
BeautifulSoup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是python对象,所有对象可以归纳为4种
司六米希
2022/11/15
5490
【Python爬虫】 电影Top250信息
Python爬虫超详细讲解(零基础入门,老年人都看的懂)
网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。
BookSea
2023/07/21
1.7K0
Python网页爬取_在pycharm里面如何爬取网页
使用Python爬取简单数据 闲暇时间学习Python,不管以后能否使用,就算了解计算机语言知识。 因为有一点Java基础,所以Python的基本语法就很快的过了一遍,表达或许有点混乱,以后慢慢改进。 一、导入爬取网页所需的包。
全栈程序员站长
2022/11/04
2.2K0
Python网页爬取_在pycharm里面如何爬取网页
Python 爬虫超详细讲解(零基础入门,老年人都看的懂)
网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。 原则上,只要是浏览器(客户端)能做的事情,爬虫都能够做。
Python小二
2020/09/08
8400
Python 爬虫超详细讲解(零基础入门,老年人都看的懂)
python爬取淘宝全部『螺蛳粉』数据,看看你真的了解螺蛳粉吗?
上一篇文章(爬取淘宝热卖商品并可视化分析,看看大家都喜欢买什么!)爬取分析了淘宝的热卖商品,从分析来看『螺蛳粉』的销量巨高。因此这篇文章将爬取淘宝全部『螺蛳粉』商品数据,通过可视化分析淘宝螺蛳粉的一些秘密!
Python研究者
2021/03/05
8691
python爬取淘宝全部『螺蛳粉』数据,看看你真的了解螺蛳粉吗?
【一起学Python】爬取前程无忧招聘信息并写入Excel
说在前面:这是依旧是来自Ricky的爬虫小实战。预告一下未来的几个主要内容吧,打算重写一下微信公众号后台,然后写几篇教程;之后是有关分词、词云、情感分析的一些内容;然后也有打算研究一下小程序,坑好多,
不二小段
2018/04/08
1.4K0
【一起学Python】爬取前程无忧招聘信息并写入Excel
真特么激动第一个爬虫----爬取豆瓣电影top250
之前一直对爬虫有兴趣,但是一直没有真正静下心来去好好学习过,这一段时间跟着b站上的一个教程做了自己人生中第一个爬虫程序,还是很有成就感的。
萌萌哒的瓤瓤
2020/08/26
5010
真特么激动第一个爬虫----爬取豆瓣电影top250
利用图灵机器人为公众号添加智能问答,知识库功能
订阅号很早就有了,我最近闲了无事就像探索探索可以怎么玩。首先联想到就是微软小冰智能问答系统,还有很早时候有一个公众号提供了,根据c、c++函数名返回API具体用法的功能。那么这两个类似的功能如何实现呢。
流川疯
2019/01/18
1.3K0
手把手教你用Pyecharts库对淘宝数据进行可视化展示
大家好,我是Python进阶者,上个礼拜的时候,我的Python交流群里有个名叫程序的大佬,头像是绿色菜狗的那位,在Python交流群里边的人应该都知道我说的是哪个大佬了,他提供了一份初始淘宝数据,数据乍看上去非常杂乱无章,但是经过小小明大佬的神化处理之后,一秒就变清晰了,真是太神了,然后就有了后续的数据分词处理和可视化等内容了,可能群里的人平时工作太忙,没有来得及看群消息,作为热心的群主,这里给大家整理成一篇文章,感兴趣的小伙伴,可以去实操一下,还是可以学到很多东西的。言归正传,一起来学习下今天的数据分析内容吧。
Python进阶者
2021/08/27
7340
提高效率必备之 Python 办公黑科技!
学习 Python 这么久了,今天我们来聊聊如何利用 Python 提升办公效率,在工作中提升工作效率的同时也让提升自己的专项技能,让自己的成神之路越来越近!废话不多说啦,请上才艺!
sergiojune
2021/08/12
4890
提高效率必备之 Python 办公黑科技!
Python高效办公|格式化经纬度
在现实工作中,我们肯定和Excel打过很多交道,其中你一定用到过单元格格式,例如让数字保留两位小数,或者换为百分数等等。
罗罗攀
2021/12/06
5890
Python高效办公|格式化经纬度
技术 | Python的从零开始系列连载(三十七)
为了解答大家学习Python时遇到各种常见问题,小灯塔特地整理了一系列从零开始的入门到熟练的系列连载,每周五准时推出,欢迎大家学积极学习转载~
灯塔大数据
2019/03/07
4230
基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来
前几天在有个粉丝问了个问题,大概意思是这样的:基于Python代码,要求输出word文档中的关键词和词频,并且将关键词的词性也标注出来,最终输出一个Excel文件,一共3列,列名分别是关键词、词频和词性。
前端皮皮
2023/08/17
3720
基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来
python 携程爬虫开发笔记
最近购买了《Python3 爬虫、数据清洗与可视化实战》,刚好适逢暑假,就尝试从携程页面对广州的周边游产品进行爬虫数据捕捉。 因为才学Python不够一个星期,python的命名规范还是不太了解,只能套用之前iOS开发的命名规范,有不足之处请多多指点
freesan44
2018/09/05
2K0
python 携程爬虫开发笔记
python自动化高效办公第二期,带你项目实战【一】{excel数据处理、批量化生成word模板、pdf和ppt等自动化操作}
我们在读取文件的时候,excel的列是字母我们不容易直观看出来是第几列,下面对excel进行设置。
汀丶人工智能
2022/12/21
3.1K0
python自动化高效办公第二期,带你项目实战【一】{excel数据处理、批量化生成word模板、pdf和ppt等自动化操作}
爬虫之旅1-入门及案例
HTTP + SSL;其中SSL指的是安全套接字层,传输数据之前先进行加密,之后解密再获取内容 效率低,但是安全
皮大大
2021/03/02
5280
爬取了某网2w条招聘信息,看看有什么工作适合你​。​
又到一年一度的秋招了,受疫情的影响,就业难度大大增加,今天爬取2w前程无忧的招聘信息,看看有什么工作适合你。
Python与Excel之交
2021/08/05
3390
【python爬虫】爬虫编程技术的解密与实战
Python领域就像一片未被勘探的信息大海,引领你勇敢踏入Python数据科学的神秘领域。这是一场独特的学习冒险,从基本概念到算法实现,逐步揭示更深层次的模式分析、匹配算法和智能模式识别的奥秘。
SarPro
2024/02/20
3960
【python爬虫】爬虫编程技术的解密与实战
【说站】python格式化经纬度的方法
1、对数据进行清理,主要是度分秒的符号问题,有的是中文或者英文,需要统一替换成一种在Excel中完成。
很酷的站长
2022/11/26
6070
【说站】python格式化经纬度的方法
推荐阅读
相关推荐
Python办公自动化| word 表格转excel
更多 >
领券
一站式MCP教程库,解锁AI应用新玩法
涵盖代码开发、场景应用、自动测试全流程,助你从零构建专属AI助手
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档