上一篇告别单调工作系列——利用python拯救漂亮妹子中「拯救」了漂亮妹子之后,原本以为事情告一段落,哪知道……
起因
记得帮妹子搞定自动提交表单之后的第三天,妹子端着奶茶乐呵呵的来找我,和我一番畅谈理想,又指点江山之后,终于切入了正题。
大致的意思就是通过excel自动提交表单数据你帮我搞定了,你好厉害,现在整理excel的工作我也不是很想做,你有没有办法帮我搞定,搞定之后不会亏待你的,奶茶一定双手奉上。
碰到这样的事情其实我的内心是拒绝的,这明显有点‘贪得无厌’,不知道什么叫见好就收吗?
可是,谁叫人家妹子长得漂亮呢,嘴巴又甜,被她这么忽悠了几下,习惯性的开始调研起需求来了,哎,这职业习惯得改改。
经过
聊了十几分钟之后,大致了解了需求,其实就是有几个部门每天会发来固定的excel,她需要根据一定的要求整理汇总,有问题的数据联系对应的人去处理,没有问题的数据再录入到系统。
要了excel模板和具体的整理规则之后,漂亮妹子乐呵呵的走了,我有点后悔,又要牺牲自己的下班时间了,哎,好人难做啊。
理了下思路,其实解决这个需求不是很难。
首先先约定好规则,包括excel的命名,存放路径,excel格式等。其中excel命名和格式已经是固定的,不用操太多心。
但存放路径不定,基本上都是通过邮件来沟通的,原本想去遍历邮件去获取附件的,但考虑到无法判断哪份excel是最终版,所以这一步就算了,让业务自行判断后放到统一的路径下。
接下来就是遍历指定路径下的excel,根据业务给的数据规则进行整合,整合之后生成一个目标excel,一份是正确的数据,还一份是异常数据。
所用到的python模板基本上也是自带的,加上操作Excel的,。
python操作excel
面对这样的需求,正好也让自己复习巩固下python操作excel的几个模板,记录下来,供大家参考。
操作excel我主要用,,这三个模块,基本可以解决我遇到的所有需求。
模块只支持读取excel,不管是的还是的,可以看个简单的demo:
import xlrd
rd = xlrd.open_workbook("test.xls")#读取文件
sheets = rd.sheet_names()#获取所有sheet名
table = rd.sheet_by_name("sheet1")#通过sheet名获取名为 sheet1 的表
#遍历excel,打印出第一列
for i in range(table.nrows):
print(excelData.col_values(0)[i])
和模块,只支持写excel操作,两者各有优缺点,相对来说不管从功能上还是性能上都略胜与,尤其是在支持大文件写入方面,如果数据量非常大,可以启用模式,这是一种顺序写入模式,得到一行数据就立刻写入一行,而不会把所有的数据都保持在内存中。
网上有一篇Python Excel技术比较,大家可以看下,讲的比较详细,各模块的优缺点。
截图1
至于写法,其实两者差不多,直接看下官方文档即可,这里以举例:
importxlwt
# 创建一个workbook 设置编码
workbook = xlwt.Workbook(encoding ='utf-8')
# 创建一个worksheet
worksheet = workbook.add_sheet('Worksheet1')
# 写入excel
# 参数对应 行, 列, 值
worksheet.write(1,, label ='test')
style = xlwt.XFStyle()# 初始化样式
font = xlwt.Font()# 为样式创建字体
font.name ='Times New Roman'
font.bold =True# 黑体
font.underline =True# 下划线
font.italic =True# 斜体字
style.font = font# 设定样式
worksheet.write(2,,'Unformatted value')# 不带样式的写入
worksheet.write(3,,'Formatted value', style)# 带样式的写入
# 设置单元格宽度
worksheet.col().width =3333
# 输入日期
style = xlwt.XFStyle()
style.num_format_str ='M/D/YY'# Other options: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0
worksheet.write(4,, datetime.datetime.now(), style)
#添加公式
worksheet.write(5,,5)# Outputs 5
worksheet.write(5,1,2)# Outputs 2
worksheet.write(6,, xlwt.Formula('A5*B5'))
worksheet.write(1,1, xlwt.Formula('SUM(A5,B5)'))
#添加超链接
worksheet.write(7,, xlwt.Formula('HYPERLINK("http://www.google.com";"Google")'))
# 保存
workbook.save('test.xls')
后记
终于利用下班时间将这个需求搞定了,妹子很开心,但隐隐觉得没有达到她想要的,也许过几天,妹子又会乐呵呵的端着奶茶来找我了……
领取专属 10元无门槛券
私享最新 技术干货