前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >提取图片、视频、文献信息的阅读辅助神器:天若OCR文字识别工具

提取图片、视频、文献信息的阅读辅助神器:天若OCR文字识别工具

作者头像
百味科研芝士
发布2019-05-23 22:38:43
8.3K0
发布2019-05-23 22:38:43
举报
文章被收录于专栏:百味科研芝士

平时,我们参加一个会议,拍下了关键图片,想搜索相关的文献,却要一个一个字母输入搜索;看一个视频,觉得里面的台词很好,想记录下来,看视频一个一个字母码出来?;网上搜索一些文档,不能下载,却想引用这些资料里面的文字,却碰到复制权限的限制(不给复制),那怎么办?;看一篇文献,有一些单词看不懂,也要一个一个码出来搜索,翻译?

基于以上问题,笔者给大伙分享一个工具——天若ocr文字识别,它可以帮我们完美解决这类问题。

首先,先给大伙简单说下OCR。OCR(optical character recognition)文字识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。打个比方,书本上有段精彩的文字,想在电脑保存下来,但书上的文字是属于书的,那么,将书本上的文字转换为我们电脑上常用的文字,就是OCR了。

天若ocr文字识别,是一项集合百度、腾讯、有道、搜狗的ocr接口,免费不限次数(有道免费接口有ip限制仅供娱乐)的工具

1、对于搜狗的接口调用的还是http://ocr.shouji.sogou.com/v2/ocr/json,这个接口识别效果很好,但是对于图片的尺寸有规定。作者对截取图片进行了尺寸上的优化,保证较小的文字也能识别。具体大家可以自行测试。 2、腾讯ocr接口,也比较准确,但是速度比较慢。 3、百度ocr接口,精确度还可以,但是标点符号识别不准确,速度一般。 4、有道ocr接口,速度很快平均0.3-0.4秒就可识别出来。但是接口受ip请求的限制。(仅供参考) 5、竖排文本识别接口,竖排文本识别需要依赖识别模块cvextern.dll。

安装和使用方法

安装:软件无需安装,直接运行即可。

使用方法:打开后就会安静地在后台待着,需要使用时按默认的 F4 键双击运行图标呼出截图框,就可选择你需要识别的内容范围,截图之后松开左键即可识别文字。识别出文字后,可进一步操作,就看你如何操作了(可合拼段落,翻译,朗读等)。

见下效果:

图片识别

在线文档识别

视频识别

PDF识别

感觉可以用作文献阅读助手了。

操作贼简单,笔者就不过多强调了。大伙可以多点尝试。

简单说下,该工具功能强大的地方在于:

1.突破各种不同媒介(图片、视频等)之间的障碍; 2.识别后的文字的可调整(段落拆分、合拼等); 3.文字便于复制黏贴(免去码字烦恼); 4.快速翻译,可充当文献阅读助手; 5.识别后的文字可朗读(学习英语的能手?)。

感谢开发者。

最后,提醒一下,软件不能使用的原因:

1、缺少.net框架,最低需要安装.net4.0。原则上你只要安装了这个版本的框架xp系统也可以使用。 2、快捷键冲突更换快捷键(右键点击运行图标,进入设置界面,可设置)。 3、出现按下截图键,屏幕放大情况的请右键属性,禁用dpi的显示缩放。 4、需联网,联网,联网。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档