首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >自然场景文字识别技术及在地图中的应用

自然场景文字识别技术及在地图中的应用

提问于 2018-08-23 20:01:32
回答 11关注 1查看 2.2K

 随着互联网和移动互联网技术的高速发展,越来越多的新型应用场景需要利用自然场景图像中的文字信息。

已邀请
等2人回答

回答 11

不不个了

精选回答

发布于 2018-08-24 04:38:50

地图文本识别技术创新

        1) 卷积过程基于GoogLeNet的Inception 结构进行改进,采用不同大小的卷积核意味着不同大小的感受野,最后拼接不同尺度特征,提升网络性能。

        2)修改解码方式,支持多候选和文字位置的输出,校正识别结果。如图输出每个字符位置所示,模型识别结果为:粮粮油调料干菜批发部,根据两个“粮”字的中线距离较近可以判断这两个字符是同一个字符,调整识别结果为:粮油调料干菜批发部。

输出每个字符位置:

输出多个识别结果候选:

       3)超分辨率技术扩增训练样本,极大的提高了低分辨率样本的识别率。

圣才

发布于 2018-08-24 03:30:47

地图OCR在POI众包中的应用

      1.众包用户采集POI图片上传到众包后台进入采编分离环节,采编分离算法根据OCR的文本检测结果剔除没有POI的图片;有POI的图片根据OCR识别结果自动编辑图片对应的POI,编辑成功的POI完成审核;没有编辑成功的POI进入人工去噪。

     2.人工去噪把没有POI的图片剔除,有POI的图片返给众包用户编辑POI。

     3.用户编辑的图片和POI上传到众包后台进入自动审核,自动审核根据OCR识别结果与用户编辑的POI进行匹配,匹配上的POI完成审核,没匹配上的POI进入人工审核。

      4.人工审核通过的POI完成审核,没通过的POI剔除。

      POI众包通过应用地图OCR技术及采编分离流程对业务的帮助有几下几点:

     1.采编分离环节自动剔除的没有POI的图片节省了众包用户查看图片时间,自动编辑上POI的图片节省了用户的编辑时间。众包用户总的查看编辑POI的时间降低了58%,大大提高了用户的作业效率,提升了用户体验及用户黏性。

     2.通过采编分离流程及新的定价策略使POI的回收率提高了83%,增强了POI数据的完备性。

     3.自动审核通过的POI可以直接入库,不用审核员再查看,大大解放了人力,提升了审核效率,节省了成本。

djgump

发布于 2018-08-24 05:11:57

文字识别方法主要分为单字识别和文本行识别。

       1.单字识别,是将文字识别看成分类问题,用CNN代替了传统文字识别方法中特征提取步骤,显而易见,此方法需要使用固定大小的单字图像作为输入,也就是识别之前要定位每个字符的位置。此方法会将字符定位的误差带入识别环节,影响整个文字识别系统的准确率。

       2.文本行识别,通用识别算法是CRNN网络,此方法结合基于CNN的图像特征和基于RNN的上下文特征取代人工定义的特征,并且避免了字符分割,实现端到端的无约束字符定位和识别,能较好地识别自然场景文字。

和开发者交流更多问题细节吧,去 写回答
相关文章
【场景文字识别】场景文字识别
1. STR任务简介 许多场景图像中包含着丰富的文本信息,对理解图像信息有着重要作用,能够极大地帮助人们认知和理解场景图像的内容。场景文字识别是在图像背景复杂、分辨率低下、字体多样、分布随意等情况下,将图像信息转化为文字序列的过程,可认为是一种特别的翻译过程:将图像输入翻译为自然语言输出。场景图像文字识别技术的发展也促进了一些新型应用的产生,如通过自动识别路牌中的文字帮助街景应用获取更加准确的地址信息等。 在场景文字识别任务中,我们介绍如何将基于CNN的图像特征提取和基于RNN的序列翻译技术结合,免除人工定
用户1386409
2018/04/02
23.5K0
【场景文字识别】场景文字识别
场景文字识别技术,过滤黄赌毒
作者介绍: 数据平台部OCR+团队负责人。2008年毕业于中国科学院研究生院,主攻模式识别、计算机视觉、图像处理、以及深度学习等方向。读研期间曾在模式识别顶级期刊PAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence)发表指纹识别相关论文。此前在腾讯优图团队从事图像处理(人脸识别)相关工作,现在属于腾讯技术工程事业群\数据平台部\OCR+团队,主要从事文字识别、图像语义理解等相关工作。 引言 OCR技术,通俗来讲就是从图像中
腾讯技术工程官方号
2018/01/29
4.6K0
场景文字识别技术,过滤黄赌毒
基于深度学习的自然场景文字检测及端到端的OCR中文文字识别
基于图像分类,在VGG16模型的基础上,训练0、90、180、270度检测的分类模型. 详细代码参考angle/predict.py文件,训练图片8000张,准确率88.23%
机器学习AI算法工程
2019/10/28
2.6K0
基于深度学习的自然场景文字检测及端到端的OCR中文文字识别
自然场景文本检测识别技术综述
白蛇: 白纸黑字的扫描文档识别技术已经很成熟,而自然场景图像文本识别的效果还不理想。倾斜字、艺术字、变形字、模糊字、形似字、残缺字、光影遮蔽、多语言混合文本等应用落地面临的技术难题还没被彻底解决。
SIGAI学习与实践平台
2018/08/07
3.7K0
自然场景文本检测识别技术综述
自然场景文本检测识别技术综述
0629封面.jpg 番外 青蛇: 姐, 图像文本检测和识别领域现在的研究热点是什么? 白蛇: 白纸黑字的扫描文档识别技术已经很成熟,而自然场景图像文本识别的效果还不理想。倾斜字、艺术字、变形字、模
SIGAI学习与实践平台
2018/06/30
7.9K1
自然场景文本检测识别技术综述
AI安全帽识别技术在工地场景中的应用及意义
安全帽是建筑业、制造业等工业生产中重要的劳保工具,应用十分广泛且十分重要。但是在实际场景中,比如建筑工地或工厂流水线上,依然有很多工人忽视安全帽的重要性,同时,由于企业的监督不到位,因未佩戴安全帽而引发的安全事故不计其数,因此对工作人员进行安全帽佩戴状况的实时检测是非常关键的。
TSINGSEE青犀视频
2023/01/06
8610
ICDAR 2019论文:自然场景文字定位技术详解
自然场景图像中的文字识别应用广泛,其中文字定位是最重要的一步,但技术上极具挑战。本文提出了一个高效的场景文本检测框架,取得了明显的效果提升。
美团技术团队
2019/09/29
1.3K0
ICDAR 2019论文:自然场景文字定位技术详解
浅析EasyCVR视频技术在自然灾害风险场景中的应用意义
我国是自然灾害多发的国家,夏季也是灾害多发季节,山洪、泥石流、洪涝、冰雹、飓风、地震等自然灾害每年都给国家经济带来巨大的损失。建设自然灾害风险预警视频监控系统,实现对自然灾害的可视化预警监测和监管,并提供数据分析、设备管理、智能分析、实时告警等功能,辅助和提高自然灾害防范、处置能力,已经成为行业需求。
TSINGSEE青犀视频
2023/05/24
3930
AI综述专栏 | 复杂环境文字识别技术研究及应用进展
在科学研究中,从方法论上来讲,都应先见森林,再见树木。当前,人工智能科技迅猛发展,万木争荣,更应系统梳理脉络。为此,我们特别精选国内外优秀的综述论文,开辟“综述”专栏,敬请关注。
马上科普尚尚
2020/05/11
1.1K0
AI综述专栏 | 复杂环境文字识别技术研究及应用进展
浅析视频技术与AI智能识别技术在智慧矿山场景中的应用
能源与矿业是我国国民经济的重要物质生产部门和支柱产业之一,同时也是一个安全事故多发的高危行业,施工阶段的现场管理对工程成本、进度、质量及安全等至关重要。国家矿山安监局陆续发布(矿安〔2022)128号)文、(矿安综〔2023〕5号)文推动矿山重大灾害风险防控,山西、贵州等各省积极响应并实施了相应举措。矿业智能化既是未来趋势,更是产业发展需求,建设智慧矿山已经成为矿业安全生产的必经之路,是推动行业提质增效和安全生产的有效保障。
TSINGSEE青犀视频
2023/05/22
5600
浅析TSINGSEE智能视频分析网关的AI识别技术及应用场景
随着近几年人工智能的快速发展,深度学习方法及性能日益提升,计算机视觉、图像处理、视频结构化和大数据分析等技术也不断完善,使得安防产品逐步走向智能化。在技术成熟度上,处理安防影像的技术已经研发得较为完备,同时行业指导性政策也进一步加快了人工智能技术的落地应用。
EasyNVR
2022/07/30
1.1K0
OpenVINO场景文字检测与识别
OpenVINO提供的场景文字检测模型准确率是非常的高,完全可以达到实用级别,其实OpenVINO还提供了另外一个场景文字识别的模型,总体使用下来的感觉是没有场景文字检测那么靠谱,而且只支持英文字母与数字识别,不支持中文,不得不说是一个小小遗憾,但是对比较干净的文档图像,它的识别准确率还是相当的高,速度也比较快,基本上都在毫秒基本出结果。
OpenCV学堂
2019/06/21
3K1
OpenVINO场景文字检测与识别
OCR文字识别技术
因为随着移动互联网的繁荣发展,社会已经迎来了移动应用井喷时代,而出于对业务模式创新,以及用户体验优化的追求,以前很多依赖特定仪器才能实现的技术和操作开始适配到移动端, OCR技术就是这股移动化浪潮中相当受到瞩目的技术之一。
ocr识别算法专家
2020/03/30
37.2K0
详解 GAN 在自然语言处理中的问题:原理、技术及应用
【新智元导读】本文从 GAN 为什么没有在自然语言处理(NLP)中取得让人惊喜的成果出发,分析了原始 GAN 在 NLP 中的问题。 介绍和分析了近期将 GAN 应用于 NLP 中的一些论文,并进行了总结。 GAN 自从被提出以来,就广受大家的关注,尤其是在计算机视觉领域引起了很大的反响。这篇文章主要介绍 GAN 在 NLP 里的应用(可以算是论文解读或者论文笔记),并未涉及GAN 的基本知识 。由于很长时间没有写中文文章了,请各位对文章中不准确的地方多多包涵、指教。 GAN 为什么没有 NLP 取得好成
新智元
2018/03/27
2K0
详解 GAN 在自然语言处理中的问题:原理、技术及应用
模式识别新研究:微软OCR两层优化提升自然场景下的文字识别精度
鼠标发明人Douglas Engelbart曾经针对人工智能的简称AI提出了另一个理念——Augmented Intelligence,即增强智能。在他看来,人已经足够聪明,我们无需再去复制人类,而是可以从更加实用的角度,将人类的智能进一步延伸,让机器去增强人的智能。 OCR (Optical Character Recognition,光学字符识别)就是这样的一项技术,它的本质上是利用光学设备去捕获图像并识别文字,将人眼的能力延伸到机器上。本文将介绍OCR技术在移动环境下面临的新挑战,以及在自然场景图像下
用户1737318
2018/06/05
2K0
语音前处理技术在会议场景中的应用及挑战
 点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息   //   编者按:随着在线会议的普及,用户已经不再满足于能听到,而是要有更为极致的听感体验,如何能够在复杂多变的应用场景中依旧保证声音清晰流畅是对会议系统的极大挑战。LiveVideoStackCon2022上海站大会邀请到了全时 音视频研发部经理 顾骋老师,为大家详细介绍了语音前处理技术在会议场景中的应用与挑战。 文/顾骋 整理/LiveVideoStack 大家好,我是顾骋,来自全时
LiveVideoStack
2023/04/04
9200
语音前处理技术在会议场景中的应用及挑战
图技术在美团外卖下的场景化应用及探索
总第534篇 2022年 第051篇 在外卖广告CTR预估建模中,我们依托图技术在场景化上进行了一系列探索。本文首先介绍了使用图网络技术的出发点,然后从特征层面的抽象图关系到子图扩展以及场景感知子图,逐步介绍如何使用图技术建模业务问题,并针对联合训练的线上服务细节及效果进行解释和分析,希望能给从事相关工作的同学带来一些帮助或启发。 1. 引言 1.1 问题与挑战 1.2 图技术介绍 2. 图技术的场景化探索 2.1 基于特征图的场景特征交叉建模 2.2 基于子图扩展的行为图建模 2.3 基于元路径的场景图
美团技术团队
2022/09/13
1.2K0
图技术在美团外卖下的场景化应用及探索
FOTS:自然场景的文本检测与识别
我们需要从任何图像(包含文本)检测文本区域,这个图像可以是任何具有不同背景的东西。在检测到图像后,我们也必须识别它。
deephub
2021/03/10
1.4K0
FOTS:自然场景的文本检测与识别
语音识别类产品的分类及应用场景
前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) 音频由公众号“闪电配音”提供 媒体和AI巨头们乐于给大众描绘一幅幅精彩的未来生活蓝图:人工智能可以化身为你的爱车,在沙漠、森林或小巷中风驰电掣;可以是智慧公正的交警,控制红绿灯、缓解交通的拥挤;还可以是给人以贴心照顾的小助理,熟悉你生活中的每一处小怪癖。 在看到这些美妙的畅想之后,作为一个严谨认真的AI产品经理,我不禁想去探索上述美好未来的实现路径;今天,
企鹅号小编
2018/01/16
3.5K0
语音识别类产品的分类及应用场景
视频监控场景下报警功能的技术特点及场景应用
视频监控报警功能是近年来发展起来的新一代报警技术。与传统报警技术相比,视频报警技术不仅实现了报警的可视化,而且更智能,并与互联网应用相融合,为用户提供低成本、全方位、全天候的安全防范服务,在保障安全生产、保护生命财产方面起到了重要作用。
Openskeye
2023/05/30
1.6K0

相似问题

OCR文字识别技术有哪些应用?

83.7K

通用文字识别支持自定义场景识别吗?

1131

我想了解自然场境下图片文字识别软件?

1294

卡证文字识别能批量识别身份证及银行卡吗?

1103

文字识别识别不了?

0285
相关问答用户
腾讯 | 产品运营经理擅长5个领域
腾讯 | 服务生
腾讯 | 客户端研发擅长3个领域
腾讯云AI | 技术专家
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档