首页
学习
活动
专区
圈层
工具
发布

Python 中文图片OCR

有个需求,需要从一张图片中识别出中文,通过python来实现,这种这么高大上的黑科技我们普通人自然搞不了,去github找了一个似乎能满足需求的开源库-tesseract-ocr: Tesseract的...OCR引擎目前已作为开源项目发布在Google Project,其项目主页在这里查看https://github.com/tesseract-ocr, 它支持中文OCR,并提供了一个命令行工具。...如果要识别中文需要下载对应的训练集:https://github.com/tesseract-ocr/tessdata ,下载”chi_sim.traineddata”,然后copy到训练数据集的存放路径...image = Image.open('test.png') code = pytesseract.image_to_string(image, lang='chi_sim') print(code) OCR...速度比较慢,大家可以拿一张包含中文的图片试验一下。

11.8K31
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Tesseract-OCR识别中文与训练字库实例

    关于中文的识别,效果比较好而且开源的应该就是Tesseract-OCR了,所以自己亲身试用一下,分享到博客让有同样兴趣的人少走弯路。 文中所用到的身份证图片资源是百度找的,如有侵权可联系我删除。...一、准备工作 1、下载Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安装就行。 2、下载chi_sim.traindata字库。要有这个才能识别中文。...下好后,放到Tesseract-OCR项目的tessdata文件夹里面。 3、下载jTessBoxEditor,这个是用来训练字库的。 以上的几个在百度都能找到下载,就不详细讲了。...四、测试 1、把 normal.traineddata 复制到Tesseract-OCR 安装目录下的tessdata文件夹中 2、识别命令: 1 tesseract mjorcen.normal.exp0

    5.2K20

    GitHub 热榜:文字识别神器,超轻量级中文 OCR!

    整理 | AI 科技大本营 光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题。...近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) +...这个项目基于 chineseocr 与 psenet 实现中文自然场景文字检测及识别,环境是 linux/macos。...和 ocr-lstm 是搬运 chineseocr 的) 支持竖排文本识别 ncnn 实现 psenet(未实现核扩展) ncnn 实现 crnn_dense (改变了全连接为 conv1x1)...ncnn 实现 shuuflenev2 角度分类网络 ncnn 实现 ocr 整个流程 最近,项目作者对更新了可实现的功能。

    3.1K10

    GitHub 热榜:文字识别神器,超轻量级中文 OCR!

    整理 | AI 科技大本营 光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题。...近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) +...这个项目基于 chineseocr 与 psenet 实现中文自然场景文字检测及识别,环境是 linux/macos。...和 ocr-lstm 是搬运 chineseocr 的) 支持竖排文本识别 ncnn 实现 psenet(未实现核扩展) ncnn 实现 crnn_dense (改变了全连接为 conv1x1)...ncnn 实现 shuuflenev2 角度分类网络 ncnn 实现 ocr 整个流程 最近,项目作者对更新了可实现的功能。

    3.2K20

    统一图文解析OCR大模型Nanonets-OCR-s开源,复杂表格、图像描述、水印一站式解决

    今天要为大家介绍的就是这款最新开源的Nanonets-OCR-s,它是一款功能强大 OCR 模型,统一了文本处理与图像识别。...它非常擅长复杂表格提取、水印提取、LaTeX 公式识别、签名检测与隔离和智能复选框处理,最有意思的是它统一了文本与图像的解析,还能够输出图像描述。...演示 分别演示复杂表格提取,智能图像描述、水印提取、公式识别和签名检测与隔离,智能复选框就不赘述了。 1.1 复杂表格提取 文档中提取复杂表格并将其转换为 markdown 和 html 表格。...输入文档,表格非常复杂了可以说: 表格输入 输出的 Markdown,其中表格以 html 表示。.../Nanonets-ocr-s 比如上传一张 PPT: WX20250625-084806@2x 然后获得输出如下 4.

    1.4K10

    医疗行业化验单智能识别技术探讨:OCR与表格识别的应用

    借助OCR(光学字符识别)与表格识别技术,医疗机构可以有效解决这些问题。本文将探讨OCR与表格识别技术在化验单处理中的应用,并分析其在医疗行业中的技术实现与优势。...一、系统意义OCR与表格识别技术在医疗行业中的意义主要体现在以下几点:1. 提高效率将化验单的处理时间从传统的数小时压缩至几分钟,支持批量数据快速处理,显著降低人工劳动强度。2....OCR与表格识别技术的应用包括:· 自动提取关键数据:通过实体识别与信息抽取技术,系统能够提取病历中的患者信息、诊断结果、药物名称等。...四、未来展望OCR与表格识别技术的应用为医疗行业的数据管理带来了新的可能,但未来仍需关注以下方向:1. 跨模态数据融合:结合语义分析与医学影像建模,进一步提升系统的智能化水平。2....通过技术的不断优化,OCR与表格识别将在医疗数据处理、分析与决策中扮演更为重要的角色。

    87610

    【工具教程】批量OCR识别PDF中文字,并根据文字对PDF批量重命名和导出表格,基于QT和腾讯API来完成

    要实现批量OCR识别PDF中的文字,并根据文字对PDF进行批量重命名,可以使用QT作为GUI框架,结合腾讯云的OCR API来实现。...腾讯云OCR API​​:注册腾讯云账号,开通OCR服务,获取API密钥(SecretId和SecretKey)。​​...一个按钮用于开始OCR识别和重命名。一个文本框用于显示处理进度或结果。四、 集成腾讯云OCR API在QT项目中集成腾讯云OCR API。...OCR识别​​:腾讯云OCR API可能对图片质量有要求,确保转换后的图片清晰。​​文件名处理​​:提取的文本可能需要进一步处理,以确保适合作为文件名。​​...通过以上步骤,你可以实现一个基于QT和腾讯云OCR API的PDF批量OCR识别和重命名工具。

    64500

    实测超轻量中文OCR开源项目,总模型仅17M

    点击上方↑↑↑“OpenCV学堂”关注我 来源:公众号 机器之心 授权 想要试试中文 OCR?这个项目可以考虑,轻量模型,不需要 GPU 也能跑得动。 ?...光学字符识别(OCR)现在已经有很广泛的应用了,很多开源项目都会嵌入已有的 OCR 项目来扩展能力,例如 12306 开源抢票软件,它就会调用其它开源 OCR 服务来识别验证码。...如果要说到中文 OCR,像身份证识别、火车票识别都是常规操作,它也可以实现更炫酷的功能,例如翻译笔在书本上滑动一行,自动获取完整的图像,并识别与翻译中文。...目前比较常用的中文 OCR 开源项目是 chineseocr,它基于 YOLO V3 与 CRNN 实现中文自然场景文字检测及识别,目前该项目已经有 2.5K 的 Star 量。...而本文介绍的是另一个新 开源的中文 OCR 项目,它基于 chineseocr 做出改进,是一个超轻量级的中文字符识别项目。

    2K40

    cnocr:用来做中文OCR的Python3包,装上就能用!

    cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。 cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。...对于中文识别且识别困难(如文字比较模糊)的场景,建议尝试模型 conv-lite-lstm。...对于简单的中文识别场景,可以使用模型 densenet-lite-lstm 或 densenet-lite-fc ,或者利用自己的训练数据对它们进行精调。...图片预测 类CnOcr是OCR的主类,包含了三个函数针对不同场景进行文字识别。类CnOcr的初始化函数如下: 其中的几个参数含义如下: model_name: 模型名称,即上面表格第一列中的值。...函数CnOcr.ocr(img_fp)和CnOcr.ocr_for_single_line(img_fp)内部其实都是调用的函数CnOcr.ocr_for_single_lines(img_list)。

    3.7K30

    实测超轻量中文OCR开源项目,总模型仅17M

    想要试试中文 OCR?这个项目可以考虑,轻量模型,不需要 GPU 也能跑得动。...光学字符识别(OCR)现在已经有很广泛的应用了,很多开源项目都会嵌入已有的 OCR 项目来扩展能力,例如 12306 开源抢票软件,它就会调用其它开源 OCR 服务来识别验证码。...如果要说到中文 OCR,像身份证识别、火车票识别都是常规操作,它也可以实现更炫酷的功能,例如翻译笔在书本上滑动一行,自动获取完整的图像,并识别与翻译中文。...目前比较常用的中文 OCR 开源项目是 chineseocr,它基于 YOLO V3 与 CRNN 实现中文自然场景文字检测及识别,目前该项目已经有 2.5K 的 Star 量。...而本文介绍的是另一个新 开源的中文 OCR 项目,它基于 chineseocr 做出改进,是一个超轻量级的中文字符识别项目。

    2.8K00

    cnocr:用来做中文OCR的Python3包,装上就能用!

    cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。 cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。...对于中文识别且识别困难(如文字比较模糊)的场景,建议尝试模型 conv-lite-lstm。...对于简单的中文识别场景,可以使用模型 densenet-lite-lstm 或 densenet-lite-fc ,或者利用自己的训练数据对它们进行精调。...图片预测 类CnOcr是OCR的主类,包含了三个函数针对不同场景进行文字识别。类CnOcr的初始化函数如下: 其中的几个参数含义如下: model_name: 模型名称,即上面表格第一列中的值。...函数CnOcr.ocr(img_fp)和CnOcr.ocr_for_single_line(img_fp)内部其实都是调用的函数CnOcr.ocr_for_single_lines(img_list)。

    2.9K10

    实测对比|法国 AI 独角兽公司发布的“最强 OCR”,实测效果如何?

    3月上旬,法国一家AI独角兽公司进军OCR(光学字符识别)领域,发布了一个号称“全世界最好的OCR”产品,根据其技术团队的说明,这款OCR产品具备优秀的准确度和认知能力,能够理解文档的每个元素(包括文本...如下图中的推文表示,在中文样本测试中,A产品的表现没有显著优势。也有AI团队认为,A产品超越了一些前沿LLM的OCR性能,但尚未完全为企业使用做好准备。在实际生产环境中,A产品表现是否出色?...它的中文文件处理性能与国内产品相较如何?面对这些问题,TextIn测试团队进行了一次针对性测试,基于丰富的真实样本,全方面评测OCR产品能力。...整体而言,TextIn文档解析在各项指标上表现良好,其中表格解析能力较为突出,公式识别相对一般;A产品在英文论文、英文PDF扫描文档等文件类型上识别效果较好,中文以及手写性能一般,整体技术能力在中文环境及商业文件复杂样本下存在薄弱项...中文表单对于中文少线表单,TextIn能够正确解析,A产品则无法识别表格结构。

    36910
    领券