前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >看完这篇,我不再疯狂码字!

看完这篇,我不再疯狂码字!

作者头像
腾讯云TI平台
发布2022-03-03 09:40:30
2.1K0
发布2022-03-03 09:40:30
举报
文章被收录于专栏:腾讯云TI平台

以下文章来源于腾讯云AI ,作者Jerry

先回顾一些窘迫的时刻:

  • 心心念念找到的优质PDF文献内容复制粘贴后乱码;
  • 讲座卡卡卡拍了一大堆PPT,却难以整理编辑;
  • 网页上筛选的文字只能查看,内容无法复制;
  • 发送的图片上大段文字只能手动打字录入;
  • 海量纸质文件、票据需要手工录入系统。

曾几何时,这些场景和过程让人倍感枯燥,甚至崩溃!

俗话说,工具用得好,再也没烦恼。

文字识别(OCR)这类智能AI产品的出现,让工作、学习中的文本处理变得更加便捷、轻松,同时也在产业实践中助力企业数字化,实现降本增效。

如上述列举的一些常见场景,在实际落地的能力场景中,文字识别主要偏向于模板类(固定证件和票据等)或者定制类的识别。

但个人和企业的证照、票据、表单种类数不胜数,一直以来业界对中长尾版式的信息识别+字段抽取的方案不足。

且基于小样本情况下图文识别容易存在泛化能力不好的问题,无法覆盖兼容字段关系、字体变形、字号不一、过亮过暗等问题。当业务出现新样式时,重新训练任务样本要求、成本过高。

从通用类识别到中长尾版式,甚至无标准版式,有没有更好的解决办法呢?

01

智能结构化识别

在行业和业务层面,文字识别的技术和应用已经相当成熟,作为基础能力或者集成应用产品,市场红利和潜力巨大。

受限于核心技术突破,OCR领域众多产品一直存在重复造轮子的现象,竞争白热化、产品同质化。

当需求方提供不了较大规模和较高质量的样本,而固定模板往往需要进行针对性训练,小样本数据量无法支撑深度网络模型训练时,智能结构化识别就凸显出了巨大的价值。

依托腾讯优图实验室自研核心技术,腾讯云AI文字识别本次重点推出了智能结构化识别能力,可以不做任何的标注定制,即可识别各样式的证照、票据、表单、合同等内容,智能提取关联需要的字段信息,过滤其他冗余字段。

这种结合了文本位置、自然语言处理(NLP)对关键信息抽取的能力,是OCR从识别到理解的一次进化,具有极强的应用泛化性,能进一步为企业数字化提供强有力的工具。

值得一提的是,通过文本纠错、文本分类等NLP能力的加持,智能结构化识别具备认知和理解能力,大大提升了文字识别识别准确率,实现更复杂、小众样本的业务提效,进一步释放文字识别的潜力与价值。

据相关产品经理介绍,腾讯云AI智能结构化识别支持2000+版式,30000+字段提取,无需配置结构化对应关系,自动提取图片中的Key-value对应关系,有效降低定制化模型成本,对于无Key值字段的可自动分配Key值识别提取,可以满足个人信息录入、企业资质认证、票据单据报销等场景。

02

典型场景

不同于制式文档扫描件,自然或者小众场景中的文字具有更多表现形式。

其没有标准的版式,固定的字体,固定的对应关系,另外图片质量也无法得到保证。图片的背景还会对文字产生干扰,因此检测和识别诸如自然、小众场景下的文字具有广泛的应用场景。

对于智能结构化识别能力的落地应用,有一些典型场景可供参考,具体来说:

@个人证件信息识别:

如物流运输、金融、政务行业,对中长尾、不常见、版式不固定的业务证件进行审核或信息录入,这类识别的证件有如下特点:

  • 地区差异:在不同地区有不同的版式,不适合做垂直接口,如道路运输证。
  • 不常使用:核查的业务场景少频率低,没有对应垂直识别接口,如残疾人证、结婚证。

@企业经营的证照:

典型场景为金融行业,对其客户的资质需要进行审核或信息录入。这类客户输入识别的证照有如下特点:

  • 特殊业务,在不同地区有不同的版式,如油品售卖许可证、烟草售卖许可证等。

@各类手机截图识别:如教育、政务行业,识别截图中的内容,进行材料信息收集录入。这些截图有如下特点:

  • 同一类报告,不同终端有不同版面,如学籍报告、成绩单。
  • 同一种证明,不同地区有不同版面,例如各地区行程码、健康码。

@物流单据识别:

如何在有限的时间内高效完成包裹的分拣和信息录入,是困扰快递行业的一大难题。这类客户有符合自身业务的一套单据样式,在数字化采集的过程中,需要抽取识别与检测单据中的内容,做货物数据信息的录入和处理,需要KV匹配和准确能力。这些单据有如下特点:

  • 企业自制的单据,如磅单、出库单、装货卸货单等。

腾讯云AI智能结构化识别专注于中长尾等版式研究及提供易用、高性价比的文字识别智能产品。除了可直接调用的全面的API接口,还提供了丰富多样的SDK供开发者使用,服务使用简单便捷,兼容性强。 

通过丰富的文字识别能力矩阵,不断拓展应用场景,助力金融、物流运输、政务、法律等多领域提升运营管理效率, 实现跨越式智能升级。

官网测试Demo(可点击阅读原文进入):https://cloud.tencent.com/act/event/ocrdemo

产品文档介绍:https://cloud.tencent.com/document/product/866/60877


欢迎关注“腾讯云AI平台”公众号获取《2021年中国计算机视觉市场报告》回复【入群】可添加云AI小助手,加入云AI产品、技术、认证等相关社群

回复【云梯计划】可了解更多TCA腾讯云人工智能从业者认证限时免费相关信息

回复【产品手册】可获得最新腾讯云AI产品及解决方案手册

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云AI平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 智能结构化识别
  • 典型场景
    • @个人证件信息识别:
      • 如物流运输、金融、政务行业,对中长尾、不常见、版式不固定的业务证件进行审核或信息录入,这类识别的证件有如下特点:
        • @企业经营的证照:
          • 典型场景为金融行业,对其客户的资质需要进行审核或信息录入。这类客户输入识别的证照有如下特点:
            • @物流单据识别:
              • 如何在有限的时间内高效完成包裹的分拣和信息录入,是困扰快递行业的一大难题。这类客户有符合自身业务的一套单据样式,在数字化采集的过程中,需要抽取识别与检测单据中的内容,做货物数据信息的录入和处理,需要KV匹配和准确能力。这些单据有如下特点:
              相关产品与服务
              文字识别
              文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档