产品介绍
通用文字识别(General Optical Character Recognition,General OCR)基于行业前沿的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别、表格识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
产品功能
通用印刷体识别
支持多场景、不同版面下整图文字的识别。支持自动识别语言类型,同时支持自选语言种类(推荐),除中英文外,支持日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。
通用印刷体识别(高精度版)
支持图像整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,准确率和召回率更高,覆盖场景更广泛,应用场景包括:印刷文字识别、网络图片文字识别、广告图文字识别、街景店招文字识别、菜单文字识别、视频标题文字识别、头像文字识别等。
通用手写体识别
支持多场景、不同版面下整图文字中的手写中文、英文、字母、数字、常见字符的识别。针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。
英文识别
支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、不同版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。可应用于英文笔记作业文档化、英文试卷答题卡识别等场景。
表格识别(V2)
支持中英文图片/ PDF 内常规表格、无线表格、多表格的检测和识别,支持日文有线表格识别,返回每个单元格的文字内容,支持旋转的表格图片识别,支持将识别结果保存为 Excel 格式。
表格识别(V3)
支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。识别效果比表格识别更好,覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)的识别效果均优于表格识别V2,同时能避免部分印章干扰、表格线断裂等影响因素。适用于对接口准召率要求更高的客户。
广告文字识别
支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。支持中英文、横排和竖排文字识别,支持90度、180度、270度翻转以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。