前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python + 腾讯云,多页PDF发票识别一键搞定!

Python + 腾讯云,多页PDF发票识别一键搞定!

原创
作者头像
程序员晚枫
发布于 2025-04-03 14:20:33
发布于 2025-04-03 14:20:33
15000
代码可运行
举报
运行总次数:0
代码可运行

大家好,这里是程序员晚枫,全网同名。本周,我们poocr团队又带来了一个超实用的功能升级:支持多页PDF的发票识别!这意味着你可以用一行代码轻松识别整本发票PDF,效率直接拉满!🚀

1. 本周大更新:多页PDF发票识别来袭!

poocr 1.0.0版本发布截图
poocr 1.0.0版本发布截图

在poocr 1.0.0版本中,我们全面支持了腾讯、百度、华为、阿里等大厂的OCR接口(详情见poocr 1.0.0发布)。而本周,我们又针对多页PDF发票识别进行了专项优化。现在,无论是单页还是多页PDF,都能一键识别,结果直接导出为Excel,方便到让人尖叫!

代码语言:python
代码运行次数:0
运行
AI代码解释
复制
# pip install poocr
import poocr

poocr.ocr2excel.VatInvoiceOCR2Excel(intput_path=r'C:\Users\Lenovo\Desktop\temp\增值税发票-test.jpg',
                                    output_excel='./晚枫.xlsx',
                                    configPath='./poocr-config.toml')

2. 团队协作的力量:从bug到完美

修复多页PDF识别bug的提交记录
修复多页PDF识别bug的提交记录

这次功能更新由团队小伙伴@wzllby主导开发,中途还经历了一次“小插曲”。在首次发版时,我们发现了一个bug:只能识别PDF的第一页发票明细(见修复记录)。发现问题后,团队迅速定位问题并修复,最终实现了完整的多页PDF识别功能。

这次经历让我再次感受到团队协作的力量!从一个人单打独斗,到如今有小伙伴一起“并肩作战”,poocr的每一步成长都离不开大家的努力。❤️

3. 持续进化:跟上腾讯云的脚步

poocr的目标是成为最易用的文字识别库,而腾讯云OCR的强大能力是我们的坚实后盾。未来,我们计划:

  1. 支持更多票据类型:如火车票、飞机票等。
  2. 优化识别速度:通过异步处理提升效率。
  3. 拓展更多平台合作:让识别更稳定、更精准。

如果你有想要的功能,欢迎直接在评论区“喊话”!我们的更新方向由你决定!😄

程序员晚枫的唠叨时间

我是程序员晚枫,一个热爱开源、专注Python自动化的技术博主。poocr从一个单打独斗的小项目,发展到如今被5.5万用户下载,离不开每一位用户的信任和支持。

如果你也喜欢poocr,欢迎加入我们的开源小组(评论区留言:“开源”)。一起码代码,一起搞事情!下一个改变产品方向的idea,可能就来自你!✨

互动话题:你最希望poocr新增什么功能?评论区见!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验