怎么从图里识别文字_识别图里的文字_怎么提取jpg图里的文字 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

AI移动自动化测试框架设计(解读)

传统的UI自动化框架（UIAutomator、Espresso、appium等），或多或少在这些方法做的不够完美。

05

测试从0到1OCR初探培训（九）

又来到了测试网络会议的第九期培训，本期的主讲人皮卡丘，培训的是关于OCR-tesseract 使用，话不多说详情如下：

02

您找到你想要的搜索结果了吗？

是的

没有找到

验证码的故事 (2)

上次我们说到了路易斯·冯·安(Luis von Ahn)发明的，既能拦截网络垃圾 spam、又能顺便帮助进行古籍的数字化工作的验证码工具--reCAPTCHA。今天继续这个话题的后续故事。 reCAPTCHA 在 2009 年被 Google 收购。在其作为验证码本职工作之外，承担了数字化 Google Books 和 Google 新闻档案计划的部分任务。到了近两年，有很多使用 reCAPTCHA 服务的网站上，验证码的内容发生了变化：一半仍然是扭曲的单词，而另一半则是一张带有数字的照片。这其实是 Goo

05

电商巨头如何用NLP打响电商争霸战？

眼看双十一要到，各路电商又要开始开辟激情战场来绝地求生了。所以今天禅师特意找来一篇课程，由被称为“外贸电商平台鼻祖”eBay 的数据科学家李睿分享，NLP 在 eBay 的技术实践。

01

07. OCR学习路径之基于Attention机制的文本识别

对于单文本行的图片进行识别，另一种常用的网络模型为编码-解码模型（Encoder-Decoder），并加入了注意力模型（Attention model）来帮助特征对齐，故简称EDA。

03

验证码的未来：扒一扒reCAPTCHA的那些事

reCAPTCHA的诞生及意义 CMU（卡耐基梅隆大学）设计了一个名叫reCAPTCHA的强大系统，让电脑去向人类求助。具体做法是：将OCR（光学自动识别）软件无法识别的文字扫描图传给世界各大网站，用以替换原来的验证码图片；那些网站的用户在正确识别出这些文字之后，其答案便会被传回CMU。 reCAPTCHA是利用CAPTCHA的原理（CAPTCHA的中文全称是全自动区分计算机和人类的图灵测试），借助于人类大脑对难以识别的字符的辨别能力，进行对古旧书籍中难以被OCR识别的字符进行辨别的技术。也就是说，reCA

05

Python改变生活 | OCR识别的花样使用

这是Python改变生活系列的第四篇，在上文中讲了一个需求的解决办法，即用python识别条形码来获取快递单号。

02

借助OCR和正则表达式，复旦博士用130行代码核查核酸报告，800份只需要2分钟！

来源：大数据文摘本文约2000字，建议阅读5分钟800张图只要2分钟，程序已封装。近日，根据复旦大学报道，学校信息科学与工程学院博士生李小康使用OCR和正则表达式帮助学院几分钟核查完数百人核酸完成截图，大大提高了核查效率和精度。相关话题在知乎上也引起了众多讨论，目前该话题已经得到了300多万次浏览。用OCR和正则表达式“防疫” 首先，我们需要简单介绍一些OCR。 OCR，英文全称Optical Character Recognition，即光学字符识别，也可简单地称为文字识别，这是文字自动输入的

02

Bootstrap实战 - 瀑布流布局

讲 Bootstrap 基础的教程网上已经很多了，实际上 Bootstrap 中文网（bootcss.com）里的文档已经写的很详细了，但实战的案例却不多。这里用一些当前流行的网页布局为导向，使用 Bootstrap 中的样式来完成它。每次只讲与案例相关的知识点，边学边练，加强理解。练习本案例需有 HTML/CSS 基础。

04

借助OCR和正则表达式，复旦博士用130行代码核查核酸报告，800份只需要2分钟！

大数据文摘出品作者：Caleb 上海尚未解封。 4月9日，在上海市疫情防控工作新闻发布会上，上海市副市长、市疫情防控工作领导小组副组长宗明表示，3月1日以来，上海市已持续开展了多轮次核酸筛查或抗原检测。自4月4日上海宣布进行全员核酸检测以来，截至4月8日24时，累计筛查约9527万人次，已完成检测的样本中累计检出阳性感染者9.44万余人。面对如此数量的核酸报告，人工核查核酸报告费时费力，高压之下些许错误也无法避免，有什么更好的办法吗？ 4月7日，根据复旦大学报道，学校信息科学与工程学院博士生李小康

03

Python改变生活 | 轻松识别数百个快递单号

了解我的小伙伴可能都知道，小五经常给大家送书。最近一年，不算联合抽奖送书，单独我自购+出版社赞助已送出1000本书籍。

04

Python开发---试用OCR文字识别API

AI如今发展迅速，各云厂商对通用的人脸识别，文字识别，语音识别和语音合成提供了接口。在日常中有些小场景还是可以用到这些通用AI接口使平台或软件锦上添花的。

03

新火种AI|谷歌深夜发布复仇神器Gemini，原生多模态碾压GPT-4？

北京时间12月7日凌晨，谷歌CEO“劈柴”突然发布重磅AI杀手锏——Gemini。就在前几天，还有消息说Gemini要推迟一个月才上线，结果现在这么突然地发布，着实让AI圈料不到。以谷歌以往的实力，不用想，这又是AI界的一个“不眠之夜”。

00

50行Python代码识别杨超越的颜值

但是如果要详细介绍的话，那这个故事得从opencv的那个夏天说起，对于python小白来说，门槛有点高。所以行哥今天先给大家介绍一个几秒就可以上手的人脸识别案例，下次行哥再深入通过原理来介绍

02

带你学AI(一)

人工智能难学吗？其实不难。一个有大学学历和基本编程经验的开发，在正确的材料和方向引导下3个星期的时间就能实现自己的第一个人工智能，甚至不需要你有python基础，边学python边学AI都行。

05

App之“文字”的设计技巧

题外话：最近在忙着app上线，太忙了，没顾得上写文章，后面空了会继续更新～随着互联网技术的高速发展、传播媒体的国际化、信息资讯的大量膨胀，以及人们多元化需求的唤醒，原来单一的信息传播方式受到了冲击。

04

轮播图也就是看看而已，确实越来越少的网站，采用轮播图了

轮播图，图片旋转器，滑片，无论你怎么叫这玩意，它在网络上无处不在。轮播图在电商网站主页上广泛应用，大多数电商网站的主页上都有它：但轮播图对用户真的有意义吗？或者它只是设计者用来偷懒，将内容一股脑塞进

07

使TextView消失的10种方法

但是，这在某些情况下无法满足业务需求，比如说某控件既有图像又有文字，而我只想让文字消失，那上面的方法显然不行，这时可以使用

03

如何使用PS更改任意图片中的文字

可能你们看见今天的题目有点奇怪，这有什么不会的。但你们可能误会了。今天的缘由是，我在做好一张图片时，其中组合图里面的一张小图里面的一个标签需要更改，但我找不到原始文件，不知道这个字体是什么字体，所以没办法跟原图匹配上一模一样的字体。为了一个标签，又重新去组图，是一件很麻烦的事情，所以呢，就有了今天的推文！

01

R- 组合图(折线+条形图)绘制

就是下面这张图，在途中用条形图展示了不同季节样本浮游动物的组成情况，同时使用带误差棒的折线图来表示浮游动物生物量的变化，相当于在一幅图中同时展示了群落的相对丰度和绝对丰度。

01

Python爬虫之点触验证码的识别

可能你对这个名字比较陌生，但是肯定见过类似的验证码，比如 12306 就是典型的点触验证码。

01

android中使用Html渲染的方式实现必填项前面的*号示例

项目的个人基本信息UI界面效果图如下，有一个红色的*号，并且跟它挨着的文字颜色不一样。简友们，你们是怎么实现的呢？我这里主要介绍一种有Html渲染的方式

02

机器翻译做到头了？Meta开源NLLB翻译模型，支持200种语言互译

每天给你送来NLP技术干货！ ---- 文 | Alex(凹非寺) 源 | 量子位排版 | 夕小瑶的卖萌屋这个翻译模型，不仅支持200+语言之间任意两两互译，还是开源的。Meta AI在发布开源大型预训练模型OPT之后，再次发布最新成果NLLB。 NLLB的全称为No Language Left Behind，如果套用某著名电影，可以翻译成“一个语言都不能少”。这其中，中文分为简体繁体和粤语三种，而除了中英法日语等常用语种外，还包括了许多小众语言。 ▲NLLB支持的部分语种截图由于这些语言之间

01

大厂技术实现 | 爱奇艺文娱知识图谱的构建与应用实践 @自然语言处理系列

知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法。本文研究的是爱奇艺奇搜知识图谱的构建流程与应用场景，了解这一文娱行业知识图谱是如何帮助用户精确找到想要的内容、回答用户问题、以及理解用户搜索意图的。

06

200+语言任意互译，新开源的大模型让粤语靓仔直接喜大普奔

Alex 发自凹非寺量子位 | 公众号 QbitAI 这个翻译模型，不仅支持200+语言之间任意两两互译，还是开源的。 Meta AI在发布开源大型预训练模型OPT之后，再次发布最新成果NLLB。 NLLB的全称为No Language Left Behind，如果套用某著名电影，可以翻译成“一个语言都不能少”。这其中，中文分为简体繁体和粤语三种，而除了中英法日语等常用语种外，还包括了许多小众语言 △NLLB支持的部分语种截图由于这些语言之间都可以两两互译，所以咱们能用NLLB把阿斯图里亚语、卢

01

业界｜AI与云计算一起出租：微软、谷歌等巨头竞跑

如今巨头们已经不满足于提供单纯的云计算服务了，他们盯上了企业手里大量的客户数据，试图用AI技术学习这些数据，为企业提供更精确的服务。在云计算领先的微软和亚马逊，以及在AI里领先的谷歌，在这个新的交叉领域里开始竞跑。医院和微软Azure ：监测病人在家的身体信息有这么一家位于新罕布什尔州的达特茅斯-希区柯克医疗中心，他们的一些病人在家踩上浴室的体重秤的时候，微软的计算机会立马得知体重计上的数值。而且，微软还能得到这个医院病人在家的其他信息：血压值和病人的情绪状态，后者是微软的计算机通过分析护士和病人的

05

Python可视化#5000亿资产是什么水平#

故事的开头是，昨天#5000亿资产是什么水平#上了热搜，因为赌王的离去，他的家产公布激起各种白日梦想家的诞生，坐我旁边的小师妹也算了半天要是放余额宝一天得多少钱

02

RNN与机器翻译

---- CS224d-Day 9: GRUs and LSTMs -- for machine translation 视频链接课件链接 ---- 本文结构：机器翻译系统整体的认识什么是 parallel corpora 三个模块各模块有什么难点 RNN 模型最简单的 RNN 模型扩展模型 GRU: LSTM ---- 下面是video的笔记： 1.机器翻译机器翻译是NLP问题中比较难的其中之一，为了解决这个问题，有一些很好玩的模型： Gated Recurrent U

05

XMind 2022—XMind思维导图

xmind 2022 mac版与xmind 8完全兼容，不但具备全面思维导图工具，还有全新的界面设计和交互方式。

03

作为一名程序员，我都收集了哪些好玩的生成器？

【导语】不久前，一款名为 "狗屁不通" 的文章生成器在 GitHub 开源后大火，具体内容可查看我们之前的文章分享《我在 GitHub 上发现了一个 "狗屁不通" 的开源项目...》。

02

Hinton、LeCun、Bengio 与 Demis Hassabis一同获得 2022 年阿斯图里亚斯公主技术和科学研究奖！

作者｜李梅编辑｜陈彩娴当地时间6月15日，阿斯图里亚斯公主基金会官宣：2022年阿斯图里亚斯公主技术和科学研究奖（Princess of Asturias Award for Technical and Scientific Research）颁给深度学习三巨头 Geoffrey Hinton、Yann LeCun、Yoshua Bengio 以及 Deepmind 创始人 Demis Hassabis，以表彰他们对人工智能的进步及其在社会中的全面融合所做出的贡献！评审团认为，他们在深度学习领域的贡献

01

Echarts饼状图修改图例legend文字颜色和字体大小

在默认的饼状图里面，图例legend颜色是黑色的，有时候根据ui需要，根据不同的背景色，需要将图例文字调成白色或者其他颜色，那么，修改这些的还是一句话，修改某个属性即可。

01

连葫芦娃都数不明白，解说英雄联盟的GPT-4V面临幻觉挑战

在被称为「AI 春晚」的 OpenAI 首届开发者大会拉开帷幕后，很多人的朋友圈都被这家公司发布的新产品刷了屏，比如不需要写代码就能定制应用的 GPTs、能解说球赛甚至「英雄联盟」游戏的 GPT-4 视觉 API 等等。

02

我收集了12款自动生成器，无聊人士自娱自乐专用「建议收藏」

【导语】此前，AI科技大本营为大家介绍一个火爆文章生成器系统 BullshitGenerator，专以生成各种奇葩、“狗屁不通”的文章，还因此上了微博热搜，只要你在上面写了主题，这个生成器就能给你生成“长篇大论”，能力非凡。

02

阿里深度学习实践

近年来，随着大数据在互联网的蓬勃发展，很多人工智能的技术、应用像雨后春笋般涌现出来，如谷歌、Facebook、阿里、腾讯、百度等用得非常广泛，且各种应用都通过深度学习的方法推出。阿里巴巴这几年在深度学习方面颇有建树，特在“2015杭州·云栖大会”开设了深度学习专场，邀请七位专家从图形、图像、安全、声音、语音等方面全面介绍了利用深度学习技术、应用，以及分析包装深度学习技术的经验方法。华先胜：基于深度学习的大规模图像搜索、理解和人脸识别技术阿里巴巴搜索事业部研究员华先胜在“2015杭州·云栖大会”深度学习

04

阿里深度学习实践

近年来，随着大数据在互联网的蓬勃发展，很多人工智能的技术、应用像雨后春笋般涌现出来，如谷歌、Facebook、阿里、腾讯、百度等用得非常广泛，且各种应用都通过深度学习的方法推出。阿里巴巴这几年在深度学习方面颇有建树，特在“2015杭州·云栖大会”开设了深度学习专场，邀请七位专家从图形、图像、安全、声音、语音等方面全面介绍了阿里巴巴利用深度学习技术、应用，以及分析包装深度学习技术的经验方法。华先胜：基于深度学习的大规模图像搜索、理解和人脸识别技术阿里巴巴搜索事业部研究员华先胜在“2015杭州·云栖大会”

06

一文详解知识图谱关键技术与应用 | 公开课笔记

本课程从知识图谱的历史由来开展，讲述知识图谱与人工智能的关系与现状；知识图谱辐射至各行业领域的应用；在知识图谱关键技术概念与工具的实践应用中，本课程也会讲解知识图谱的构建经验；以及达观在各行业领域系统中的产品开发和系统应用。

05

用python的matplotlib和numpy库绘制股票K线均线和成交量的整合效果（含量化验证交易策略代码）用python的matplotlib和numpy库绘制股票K线均线的整合效果（含从网络接口

在用python的matplotlib和numpy库绘制股票K线均线的整合效果（含从网络接口爬取数据和验证交易策略代码）一文里，我讲述了通过爬虫接口得到股票数据并绘制出K线均线图形的方式，在本文里，将在此基础上再引入成交量效果图，并结合量价理论，给出并验证一些交易策略。

02

网站地图sitemap有什么用？网站地图如何制作

如果你是一座城市的游客，想要以合理安排好玩的线路，那么这座城市的地图将会是你的好助手。通过地图，你可以知道自己在哪里，哪里是市中心，哪个地方住宿方便，哪里是值得游玩的……而sitemap就是起到这样的作用，你可以理解它为网站地图或网页地图，通过可视化的方式，来展示网站的主要结构与内容分布：如tag页、列表页、分类页等。

03

抢先GPT-4！微软Bing突然升级「识图」功能，读梗看病写代码，样样精通

Bing表示，这图里不同寻常的部分太多了。首先，在出租车上熨衣服很离谱，其次，男人穿的衣服和出租车颜色一致，是不是在暗示什么？或者是某种巧合？

02

用PS拼一张海报

哈喽！各位小伙伴大家好呀！上期说了如何使用PS简单抠图，本期就再多讲一个如何拼一张海报，或者背景图吧，当举行活动或者发表文章配图，或者宣传报，都能用上的。小编演示所使用的是PS 2015 64位

02

技术分享 | WEB 端常见 Bug 解析

对于 WEB 产品来说，有一些常见的 Bug，本章节挑选一些比较典型的 Bug 进行举例介绍。

03

开源神经网络框架Caffe2全介绍

本文作者吴逸鸣，整理自作者在GTC China 2017大会上的演讲，首发于作者的知乎文章，AI研习社获其授权发布。我个人认为这是一份很值得分享的资料，因为这应该是第一次使用全中文来讲解Caffe

05

市北GMIS | 腾讯优图贾佳亚：人工智能多模态的未来

之前很多媒体、投资人、各类公司的创始人大佬问我一些问题：人工智能发展到现在，大家从不知道到知道，再到后来知道它有局限性、有发展性，那人工智能现在处于什么阶段呢？当我们对人工智能比较乐观的时候，这个乐观的心态能够走到哪一年？如果我们觉得比较悲观，发现很多问题人工智能其实做得并不好，那么我们应该怎么看待这些悲观的情绪？当很多学生选择以后职业，甚至选择以后自己想做研究生或者从事教育工作、研究工作的时候，他是不是还要以人工智能为核心？

01

成为架构师系列: 怎样画系统架构图? 背后的本质是对问题的本质思考

所谓的领域建模，是一种通过日常不断实践，来强化开发人员思维，逼迫开发人员进入深度思考的过程，并通过在这个过程中的不断锤炼，可以使得开发人员形成结构化思考方式的方法论。

01

AIGC席卷智慧办公，金山办公如何架构文档智能识别与理解的通用引擎？

如今，智慧办公是企业办公领域数字化转型的题中之义。作为国内最早开发的软件办公系统之一，金山办公如何应用深度学习实现复杂场景文档图像识别和技术理解？本文将从复杂场景文档的识别与转化、非文本元素检测与文字识别、文本识别中的技术难点等多个方面进行深度解析。作者 | 金山办公CV技术团队出品 | 新程序员在办公场景中，文档类型图像被广泛使用，比如证件、发票、合同、保险单、扫描书籍、拍摄的表格等，这类图像包含了大量的纯文本信息，还包含有表格、图片、印章、手写、公式等复杂的版面布局和结构信息。早前这些信息均采用

01

开源神经网络框架Caffe2全介绍

我个人认为这是一份很值得分享的资料，因为这应该是第一次使用全中文来讲解Caffe2和FB的AI应用的演讲观看这次演讲不需要机器学习／神经网络，甚至计算机科学的基础。它适合每一个愿意了解人工智能、神经网络和Caffe2的人。我准备了很久！（这才是主要原因哈哈哈，但第一次上台还蛮紧张在观看视频前你可能需要注意以下几点：该视频所有权解释权各种权全都归英伟达所有（点击阅读原文查看演讲视频）此次演讲只是谈论了我自己的一些看法，和FB无关我的演讲稿和视频里说的可能有一些出入。有的地方为了更好地让大家理解，

03

打造自己的搜索引擎顶

这周项目要做一个搜索引擎系统，于是，我看看了看上下左右，看来只有我来弄了~~

02

在echarts中图例legend和坐标系grid实现左右布局实例

将图例legend纵向排列（orient: ‘vertical’），宽度给150（width: 150），坐标系grid左侧距离200（left: 200），中间有50的边距

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭