Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python Easyocr 图片文字识别

Python Easyocr 图片文字识别

作者头像
用户9925864
发布于 2022-07-27 00:33:16
发布于 2022-07-27 00:33:16
16.7K00
代码可运行
举报
运行总次数:0
代码可运行

前段时间做了车牌识别相关的内容分享,参看:

车牌识别(1)-车牌数据集生成

车牌识别(2)-搭建车牌识别模型

今天给大家分享一个简单的OCR文本识别工具:easyocr。这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。当然这个模块适当改进也可以用以车牌识别

1.安装

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install easyocr -i https://pypi.tuna.tsinghua.edu.cn/simple

它会安装除了模型文件之外的所有依赖,模型文件则会在运行代码的时候下载。

在pytorch网站上,请确保选择正确的CUDA版本。如果仅打算在CPU模式下运行,请选择CUDA = None。

我的电脑没安装gpu版本的pytorch,所以运行比较慢。

2.使用教程

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import easyocr
reader = easyocr.Reader(['ch_sim']) # ch_sim是Chinese simplified简写
result = reader.readtext('1.jpg')
print(result)
代码语言:javascript
代码运行次数:0
运行
复制

运行的过程中会安装所需要的模型文件,像下面这样:

由于它的下载速度非常慢,而且经常会失败,因此建议先下载好模型文件,再将其放置到所需要的位置:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip

中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip

中国(传统)模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip

拉丁模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip

日本模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip

韩文模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip

泰文模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip

阿拉伯文模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip

如果下载速度太慢,请在公众号后台回复:easyocr(明天再试下载,今晚还没传输到网盘),下载文字检测模型(CRAFT)和中文简体模型文件包。

下载完模型后,将文件放到下面这个位置。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Windows:C:\Users\用户名\.EasyOCR\model
Linux:~/ .EasyOCR / model

如下图所示:

重新执行脚本不会再提醒下载模型了,随便找的一个图片如下:

识别结果如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[([[60, 308], [745, 308], [745, 447], [60, 447]], '文字识别提取', 0.9516711235046387), ([[77, 471], [725, 471], [725, 535], [77, 535]], '支持识别英法韩日俄德西葡语', 0.7867767214775085)]

输出采用列表格式,每个list分别表示对应文字的边界框、识别文本结果和置信度。

对于多语种的情况:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import easyocr
reader = easyocr.Reader(['ch_sim', 'en'])
result = reader.readtext('chEN.jpg')
print(result)

效果如下:

总体效果还算不错,感兴趣的朋友可以试下车牌识别的效果,以及思考下如何改进车牌识别效果

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法工程师的学习日志 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
安装python的文字识别库easyocr出现的问题及解决办法
访问:https://www.anaconda.com/products/individual
JQ实验室
2022/09/29
2.9K0
Python提取图片文字内容
爬虫的时候,有时候会遇到一些验证码,常见的有滑块验证码和文字验证码,本文所讲内容将为解决文字验证码做一些准备!
远方的星
2021/06/20
15.1K0
Python提取图片文字内容
Python使用EasyOCR库对行程码图片进行OCR文字识别介绍与实践
Tips: 在其官网有demo演示,我们可以使用其进行简单图片ocr识别,地址为https://www.jaided.ai/easyocr/ 或者 https://huggingface.co/spaces/tomofi/EasyOCR
全栈工程师修炼指南
2022/06/05
9.6K0
Python使用EasyOCR库对行程码图片进行OCR文字识别介绍与实践
【Python】轻松识别文字,这款Python OCR库支持超过80种语言
有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。
黄博的机器学习圈子
2021/01/12
8.1K0
【Python】轻松识别文字,这款Python OCR库支持超过80种语言
EasyOCR_easyocr语言包
EasyOCR是一款用python语言编写的OCR第三方库,同时支持GPU和CPU,还提供了可直接运行的命令行工具,目前已经支持超过70种语言,当然,中文也是支持的,项目地址是: https://github.com/JaidedAI/EasyOCR
全栈程序员站长
2022/11/01
1.2K0
使用EasyOCR库进行OCR文字识别介绍与实践
Tips: 在其官网有demo演示,我们可以使用其进行简单图片ocr识别,地址为https://www.jaided.ai/easyocr/ 或者 https://huggingface.co/spaces/tomofi/EasyOCR
全栈工程师修炼指南
2022/09/29
10.7K0
使用EasyOCR库进行OCR文字识别介绍与实践
OCR-easyocr初识
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 一、介绍 批量文字识别(OCR)是Python办公自动化的基本操作,应用在我们工作生活中的方方面面,比如车牌识别、证件识别、银行卡识别、票据识别等等。 Python中OCR第三方库非常多,比如easyocr、PaddleOCR、cnocr等等。 EasyOCR 是一个用 Python 编写的 OCR 库,用于识别图像中的文字并输出为文本,支持 80 多种语言。 检测部分使用CRAFT算法,识别模型为CRNN,由3个组件组
机器学习AI算法工程
2022/08/26
2.9K0
OCR-easyocr初识
厉害了!21.5K star,一款功能强大的自动化开源OCR识别工具!
在信息化社会,文字识别技术(OCR)发挥着日益重要的作用。无论是处理文档、识别图片中的文字,还是自动化录入信息,OCR技术都为我们提供了极大的便利。
测试开发技术
2024/07/31
8910
厉害了!21.5K star,一款功能强大的自动化开源OCR识别工具!
开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR
因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这四款产品。
zstar
2024/05/24
4.4K0
开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR
【说站】python EasyOCR库是什么
1、EasyOCR是一个用python编写的OCR三方库。可以在python中调用,用来识别图像中的文字,并输出为文本。
很酷的站长
2022/11/23
5860
【说站】python EasyOCR库是什么
基于 opencv+yolov8+easyocr的车牌追踪识别
通过车辆识别技术,识别视频中每个车辆及其车牌号,车辆应进行追踪,避免重复计数量。
用户11404404
2025/07/13
2180
基于 opencv+yolov8+easyocr的车牌追踪识别
15.7k stars一个实用型OCR,支持80多种语言
一个实用型 OCR,支持 80 多种语言和所有流行的书写脚本,包括:拉丁文、中文、阿拉伯文、梵文、西里尔文等。 特点 支持本地或云/API部署 准确度提高到 99% 以上 完全可定制,支持 80 多种语言 支持表格识别 二维码/条码提取识别 GitHub数据 15.7k stars 281 watching 2.2k forks 开源地址:https://github.com/JaidedAI/EasyOCR 安装 pip install easyocr 演示案例 import easyocr rea
开源日记
2023/03/10
5410
15.7k stars一个实用型OCR,支持80多种语言
easyOCR_功能测试包括
EasyOCR是一个用python编写的OCR三方库。git地址为:https://github.com/JaidedAI/EasyOCR。
全栈程序员站长
2022/11/15
8840
【收藏】图片转成文字的方法总结,python批量图片转文字信息参考源码
在日常办公或者学习中,往往存在这样一个工作场景,比如,“老王,我这里有一张图片,你把里面的文字信息给我整理出来”,都2021年了,你真的还在手敲图片文字信息么?那么还不赶紧收藏这篇秘籍,这里本渣渣总结了三种方法,教你如何将图片上的文字信息提取出来,图片转成文字信息的方法。
二爷
2021/01/25
6.3K0
【收藏】图片转成文字的方法总结,python批量图片转文字信息参考源码
PHP使用简单强大OCR工具EasyOCR
EasyOCR是一个功能强大的开源光学字符识别OCR(Optical Character Recognition,光学字符识别)库,它基于深度学习模型,能够快速准确地识别图片中的文字,并将这些文字转换为可编辑和可搜索的文本格式。与传统的 OCR 工具相比,EasyOCR 不仅识别速度快,还能处理各种复杂的文本图像,如弯曲的文本、不同字体、各种语言混合的文本等。
Tinywan
2024/09/10
6730
PHP使用简单强大OCR工具EasyOCR
从零开始学习 YOLOv8:目标检测与车牌识别实例
目标检测就像是在寻找隐藏的宝藏。想象一下,你在一个巨大的图画里,里面藏着无数的物体,而你的任务是迅速找到其中的几样,比如说,一只流浪的小猫和一辆红色的小轿车。目标检测就是让计算机“眼明手快”,准确找出这些目标,甚至告诉你“喵,那个小猫正躲在花丛里!”
繁依Fanyi
2024/10/23
2.9K1
从零开始学习 YOLOv8:目标检测与车牌识别实例
Python自动打码,DdddOcr通用验证码自动识别库
在Python爬虫中,或者使用POST提交的过程中,往往需要提交验证码来验证,除了人工打码,付费的api接口(打码接口),深度学习识别验证码,当然还有适合新人使用的OCR验证码识别库,简单的验证码是可以完全实现自动打码的,比如下面本渣渣分享的通用验证码自动识别库:ddddocr(带带弟弟OCR)!
二爷
2021/11/19
4K0
Python自动打码,DdddOcr通用验证码自动识别库
【Python】已解决:Python正确安装文字识别库EasyOCR
在使用Python进行图像处理和文字识别时,EasyOCR是一个流行的库,它基于PyTorch,并提供了强大的文字识别功能。然而,很多开发者在安装和使用EasyOCR时,遇到了各种各样的错误,影响了开发进度和体验。本文将详细分析常见错误的原因,并提供正确的安装和使用方法。
屿小夏
2025/05/22
5740
Python OCR库:自动化测试验证码识别神器!
在接口自动化工作中,经常需要处理文字识别的任务,而OCR(Optical Character Recognition,光学字符识别)库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库,包括pyocr、pytesseract和python- tesseract、EasyOCR。本文将对它们进行比较,并提供一些示例代码来演示它们在实际接口自动化工作中的应用。
测试开发技术
2023/09/11
7.7K0
Python OCR库:自动化测试验证码识别神器!
自动删除朋友圈的py脚本实现
有时候就想清空下朋友圈,微博什么的,但是发了好几年,几百几千条 ,官方又不提供批量删除工具,纯手工删,有点为难自己,删到猴年马月了,所以作为一个酷酷的计算机民工,自然要靠代码来解决。
用户4625223
2023/03/07
1.4K1
自动删除朋友圈的py脚本实现
相关推荐
安装python的文字识别库easyocr出现的问题及解决办法
更多 >
领券
一站式MCP教程库,解锁AI应用新玩法
涵盖代码开发、场景应用、自动测试全流程,助你从零构建专属AI助手
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档