大家好,这里是程序员晚枫,全网同名。本周,我们poocr团队又带来了一个超实用的功能升级:支持多页PDF的发票识别!这意味着你可以用一行代码轻松识别整本发票PDF,效率直接拉满!🚀
在poocr 1.0.0版本中,我们全面支持了腾讯、百度、华为、阿里等大厂的OCR接口(详情见poocr 1.0.0发布)。而本周,我们又针对多页PDF发票识别进行了专项优化。现在,无论是单页还是多页PDF,都能一键识别,结果直接导出为Excel,方便到让人尖叫!
# pip install poocr
import poocr
poocr.ocr2excel.VatInvoiceOCR2Excel(intput_path=r'C:\Users\Lenovo\Desktop\temp\增值税发票-test.jpg',
output_excel='./晚枫.xlsx',
configPath='./poocr-config.toml')
这次功能更新由团队小伙伴@wzllby主导开发,中途还经历了一次“小插曲”。在首次发版时,我们发现了一个bug:只能识别PDF的第一页发票明细(见修复记录)。发现问题后,团队迅速定位问题并修复,最终实现了完整的多页PDF识别功能。
这次经历让我再次感受到团队协作的力量!从一个人单打独斗,到如今有小伙伴一起“并肩作战”,poocr的每一步成长都离不开大家的努力。❤️
poocr的目标是成为最易用的文字识别库,而腾讯云OCR的强大能力是我们的坚实后盾。未来,我们计划:
如果你有想要的功能,欢迎直接在评论区“喊话”!我们的更新方向由你决定!😄
我是程序员晚枫,一个热爱开源、专注Python自动化的技术博主。poocr从一个单打独斗的小项目,发展到如今被5.5万用户下载,离不开每一位用户的信任和支持。
如果你也喜欢poocr,欢迎加入我们的开源小组(评论区留言:“开源”)。一起码代码,一起搞事情!下一个改变产品方向的idea,可能就来自你!✨
互动话题:你最希望poocr新增什么功能?评论区见!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有