平时,我们参加一个会议,拍下了关键图片,想搜索相关的文献,却要一个一个字母输入搜索;看一个视频,觉得里面的台词很好,想记录下来,看视频一个一个字母码出来?;网上搜索一些文档,不能下载,却想引用这些资料里面的文字,却碰到复制权限的限制(不给复制),那怎么办?;看一篇文献,有一些单词看不懂,也要一个一个码出来搜索,翻译?
基于以上问题,笔者给大伙分享一个工具——天若ocr文字识别,它可以帮我们完美解决这类问题。
首先,先给大伙简单说下OCR。OCR(optical character recognition)文字识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。打个比方,书本上有段精彩的文字,想在电脑保存下来,但书上的文字是属于书的,那么,将书本上的文字转换为我们电脑上常用的文字,就是OCR了。
天若ocr文字识别,是一项集合百度、腾讯、有道、搜狗的ocr接口,免费不限次数(有道免费接口有ip限制仅供娱乐)的工具。
1、对于搜狗的接口调用的还是http://ocr.shouji.sogou.com/v2/ocr/json,这个接口识别效果很好,但是对于图片的尺寸有规定。作者对截取图片进行了尺寸上的优化,保证较小的文字也能识别。具体大家可以自行测试。 2、腾讯ocr接口,也比较准确,但是速度比较慢。 3、百度ocr接口,精确度还可以,但是标点符号识别不准确,速度一般。 4、有道ocr接口,速度很快平均0.3-0.4秒就可识别出来。但是接口受ip请求的限制。(仅供参考) 5、竖排文本识别接口,竖排文本识别需要依赖识别模块cvextern.dll。
安装和使用方法
安装:软件无需安装,直接运行即可。
使用方法:打开后就会安静地在后台待着,需要使用时按默认的 F4 键或双击运行图标呼出截图框,就可选择你需要识别的内容范围,截图之后松开左键即可识别文字。识别出文字后,可进一步操作,就看你如何操作了(可合拼段落,翻译,朗读等)。
见下效果:
图片识别
在线文档识别
视频识别
PDF识别
感觉可以用作文献阅读助手了。
操作贼简单,笔者就不过多强调了。大伙可以多点尝试。
简单说下,该工具功能强大的地方在于:
1.突破各种不同媒介(图片、视频等)之间的障碍; 2.识别后的文字的可调整(段落拆分、合拼等); 3.文字便于复制黏贴(免去码字烦恼); 4.快速翻译,可充当文献阅读助手; 5.识别后的文字可朗读(学习英语的能手?)。
感谢开发者。
最后,提醒一下,软件不能使用的原因:
1、缺少.net框架,最低需要安装.net4.0。原则上你只要安装了这个版本的框架xp系统也可以使用。 2、快捷键冲突更换快捷键(右键点击运行图标,进入设置界面,可设置)。 3、出现按下截图键,屏幕放大情况的请右键属性,禁用dpi的显示缩放。 4、需联网,联网,联网。