2025已经来临,AI的诞生已经让信息化更进一步,在信息化时代,我们从数据的来源、到数据的处理-清洗已经变得尤为重要。
传统的对于电子发票、车票先进财务报销票据,在人工录入的方式实现下,不仅效率非常低,出错概率也特别大。部分财务部门在月初结算时,常常会非常苦恼,给财务部门的工作带来了很大的挑战,特别是大型企业。
针对这部分业务问题,已经有很好的解决方案了,OCR识别工具应运而生,OCR的应用已经很普遍了,在很多业务中已经有了很出色的实践方案。但是OCR还是有一定的局限性。针对很多情况,比如不同地区的不同业务票据,不能很好的识别。还需要引进人工来进行处理审核检查等等,同样对于业务还是一个挑战。
腾讯云本次的智能结构化OCR(光学字符识别)产品,其核心通过多模态的大模型技术,同时可针对用户进行自定义模板识别,即使在版式多变或中英文混排的情况下,仍能保持高识别精度。这就很大的解决了不同地区的不同业务票据,可针对性的进行自定义模板识别处理。极大的提高了财务部门的业务处理效率。
接下来我们直接来看一下腾讯智能结构化OCR的测试demo.
下面是一张图,是一个不规则的信息,我们直接来识别一下,看看结果。
很明显结果中直接将图上的所有数据都识别出来了。这一点对于普通的OCR来说,已经是很进步了的。
接下来我们尝试一下智能结构化的自定义key,我们尝试直接获取 trk 对应结构后面的结果。
看下面的图可以很显示看到,结果直接识别出了对应 trk# 后面的数据值,这一点是很重要的一点。首先是可以极大的减少服务端数据量的传输。想要什么数据,就直接获取什么数据。减少了服务器流量的传输。
接下来我们看一个实际的案例,来看看咱们的智能结构化OCR到底比传统的OCR厉害多少。
首先我们看下图。下图是某市的一个公共交通发票。这明显是一个地区自定义的发票。这种发票与其他地区发票可能都会有一定的区别。首先我们来直接识别一下,看看结果。
结果很明显的识别了下面的序号,和右侧的红色文字。
接下来,如果我们想直接获取右侧的文字应该如何呢 ?
看下面的图。我们增加一个自定义的key 。看我输入的字段key . <右侧红字> 通过这个key我们就直接获取到了结果。很明显右侧红字是一个描述性的词,与实际的业务都没有相关的关系,但直接获取到了结果。这就是智能结构化的其中一个厉害之处,通过深度学习来获取到相应的结果。
总结
以上的案例已经在项目中实际运用了。使用相当棒。
随着AI的发展越来越快速,智能结构化识别也将会随着AI的发展更进一步的提高其再各种复杂识别下的作用。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。