文字可识别性海报_文字识别性别_海报文字排版设计图片 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

撸了这么多代码，你真的了解字体吗？

618设计没想法？这波灵感解读拿走不谢！

618作为电商活动一年中力度较大的一次，很多商家、平台、app都会不遗余力做一些活动，争取在下半年的各种大促打好前站、奠定好店铺的销售基础。作为设计师的我们，面对时间紧任务重，想要做出让人眼前一亮、同时能够为店铺和平台实现高销售转化的页面还是有比较大的难度的。不少同学不免抓耳挠腮不知如何下手，趁着马上就要接到运营的设计需求，先给大家分享一批优秀设计稿，希望这篇文章能够帮助大家找到灵感思路！

[官方]你好 GPT-4o [译]

我们很高兴地宣布，推出了全新的旗舰模型 GPT-4o，能够在音频、视觉和文本之间实时进行推理。

关于短视频平台开发框架结构以及界面设计分析

首页：短视频平台把视频放在了首页，界面则相对简洁，顶部导航栏只有菜单，关注，发现，同城录像等按钮。短视频是随机呈现的，用户只能够刷新页面更换想看的视频。但好在用户对所观看的短视频也有过滤选项，可以长按减少类似作品，提高了一定的精准性。也可以选择在顶部设置频道分类，用户可以横向切换。短视频平台开发基本都使用了瀑布两列式分布，这样可以很好的排列不同尺寸的视频。并显得错落有致。在上部加入了搜索栏的功能，用户可以直借搜索自己喜欢的用户，内容。增加显示了最近热门提示在搜索框中，或直接在导航栏开辟了一个热搜按钮，打开直接显示最近的日榜和周榜。

8个绝招，教你快速打造作品的全栈设计感

1、色彩舒适度我们都说“一见钟情”，人眼首先看到的，是事物的颜色，其次才是形状。所以，“色彩舒适度”决定了作品是否能在第一时间吸引用户，我们需要避免： ·杂七杂八/乱糟糟的色彩 ·颜色没有主次之分

场景文字识别技术，过滤黄赌毒

作者介绍：数据平台部OCR+团队负责人。2008年毕业于中国科学院研究生院，主攻模式识别、计算机视觉、图像处理、以及深度学习等方向。读研期间曾在模式识别顶级期刊PAMI（IEEE Transactions on Pattern Analysis and Machine Intelligence）发表指纹识别相关论文。此前在腾讯优图团队从事图像处理（人脸识别）相关工作，现在属于腾讯技术工程事业群\数据平台部\OCR+团队，主要从事文字识别、图像语义理解等相关工作。引言 OCR技术，通俗来讲就是从图像中

010

滴滴李先刚：语音识别在复杂场景的性能将显著提升

李先刚：我目前任职于滴滴出行AI Labs首席算法工程师，负责滴滴语音相关的技术和应用，关注的领域包括语音相关前沿算法（包括语音识别、说话人识别和自然语言处理等）和他们的产业应用（尤其是在出行场景中的应用）。

字体的力量：将PPT设计做到极致

总之，每一种字体都会体现出一定的设计理念。选用恰当的字体，会让整个页面看起来更加和谐，而字体使用不当，则会让页面看起来很奇怪。

你可能从不知道的ICON分类

图标设计，是ui设计中的最重要的设计元素之一，优秀的图标其识别性会让人一眼看出它的含义，而不需要大量的文字说明；

OCR大突破：Facebook推出大规模图像文字检测识别系统——Rosetta

作者 | Fedor Borisyuk，Albert Gordo，Viswanath Sivakumar

干货 | OCR技术在携程业务中的应用

袁秋龙，携程度假大数据AI研发团队实习生，专注于计算机视觉的研究和应用。在实习期间致力于度假图像智能化工作，OCR问题为实习期主要做的研究。

合合信息获中国信通院OCR服务智能化“增强级”等级评估，助力可信AI发展

近年来，我国对数据的重视程度不断加强。2022年1月，国务院印发的《“十四五”数字经济发展规划》进一步提出，到2025年要初步建立数据要素市场体系，并对充分发挥数据要素价值作出重要部署。然而，现阶段有大量的数据信息以图片形式存储，数据流通仍存在隐形的壁垒。

打开人工智能的“潘多拉魔盒”

数以百万计的人每天都在以某种形式使用着人工智能（AI），而其中大部分都是在不知不觉中进行的，本文将简单列举AI在文本、音频、图像、视频、互动等方面的应用。 📷 一、AI文本内容作诗、编剧、写稿等 AI已经可以自动生成古典诗和现代诗，部分AI已经通过图灵测试，但整体水平还未超人。完全由AI自动编出的剧本逻辑混乱，还称不上剧本，所以目前AI主要在人的配合下完成剧本创作，集中在科幻、恐怖2个题材上。人机协作分为：人创作主线，机器填充内容；机器生成初稿，人进行修改；人机接龙；机器提供编剧建议等几种方式。 📷 📷

微信今日正式上线智能开放平台

微信今日正式上线智能开放平台。语音识别和图像识别成为首批开放给第三方应用开发者的智能识别技术。通过调用相关技术接口，第三方应用也可以实现微信中已有的语音转文字、图片扫描等功能。微信模式识别中心团队向腾讯科技介绍，麦克风、摄像头等传感设备让人和机器的交互更加便利。但语音和图像识别的技术门槛还相对较高，如果微信能把已有的技术储备开放给开发者，将能帮助更多应用减少技术投入成本。语音识别技术主要体现在语音输入，可直接将用户的语音转化成对应的文字。用户不需要依靠键盘就能完成文字输入或者用语音进行功能操作。

App之可点击元素的设计

hi，这是系列文章：App之xxx的第3篇，前2篇我总结了 App之“文字”的设计技巧 App之底部导航栏的设计直接点击可以查阅以上2篇文章。我为什么写这个系列的文章。因为我正在做一款app，我在

我们教电脑识别视频字幕

本文介绍了一种基于深度学习的视频字幕识别和生成方法，包括字符级和单词级两个模块，以及针对视频字幕中字符和单词的识别和生成任务。首先，通过深度学习模型对视频中的字幕进行定位和提取，然后使用字符级和单词级两个模块分别进行字符和单词的识别和生成。实验结果表明，该方法能够有效地识别和生成视频字幕，对于艺术字体、手写字体等难以切分的情况，以及对于视频中的噪声干扰，都具有较高的鲁棒性。

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

我们都知道，大语言模型（LLM）能够以一种无需模型微调的方式从少量示例中学习，这种方式被称为「上下文学习」（In-context Learning）。这种上下文学习现象目前只能在大模型上观察到。比如 GPT-4、Llama 等大模型在非常多的领域中都表现出了杰出的性能，但还是有很多场景受限于资源或者实时性要求较高，无法使用大模型。

小模型也能进行上下文学习！字节跳动 & 华东师大联合提出自进化文本识别器

大语言模型（LLM）能够以一种无需微调的方式从少量示例中学习，这种方式被称为 "上下文学习"（In-context Learning）。目前只在大模型上观察到上下文学习现象，那么，常规大小的模型是否具备类似的能力呢？GPT4、Llama等大模型在非常多的领域中都表现出了杰出的性能，但很多场景受限于资源或者实时性要求较高，无法使用大模型。为了探索小模型的上下文学习能力，字节和华东师大的研究团队在场景文本识别任务上进行了研究。

OPPO Air Glass开发

如果没有机器的话：参赛者可以自己购买相关硬件，也可以在参赛报名时向大赛主办方免费申请参赛开发机。

无框界面

什么是无框界面纵使几大设计风格已形成寡头垄断（如苹果的圆角玻璃、谷歌的层级、微软的方块…），但界面设计的进化历程才刚刚开始。我曾在之前的《[译文] 去形式化——移动设计新趋势化》( http://www.jianshu.com/p/a4451588ea72 )写过关于去形式化的话题。在这个新趋势中，界面上的内容越来越重要，相对的，一切与内容无关的都被大大削减。去形式化是一张非常模糊的全景图，在演化中一些新的设计风格逐渐清晰起来，例如——无框界面。也许你已经发现了，今年来越来越多的网站和应用，尤其是

公众号开发改动&教程、源码分享

放了半年的公众号拿出来做了一些简单的开发。目前功能如下： 1、回复快递xxxxxx 自动识别快递公司 2、发送图片识别性别和年龄 3、其他文字信息原样返回测试图片：公众号编辑不方便，就不再重

012

GPT-4V只能排第二！华科大等发布多模态大模型新基准：五大任务14个模型全面测评

近期，多模态大模型（LMMs）在视觉语言任务方面展示了令人印象深刻的能力。然而，由于多模态大模型的回答具有开放性，如何准确评估多模态大模型各个方面的性能成为一个迫切需要解决的问题。

证件识别技术进化史

本文介绍了证件识别技术的起源、发展和应用前景。随着互联网和智能手机的普及，证件识别的需求也日益增加。本文主要从证件识别技术的起源、发展、实现方式、技术挑战和前景展望等方面进行了详细的阐述和分析。证件识别技术的应用范围广泛，包括金融、医疗、物流等行业，在医疗行业，可以用于电子病历的识别和医疗票据的识别；在物流行业，可以用于快递单据的识别和追踪等。证件识别技术的应用前景非常广阔，但同时也面临着一些技术挑战，如识别准确率、效率、适应性等方面的问题。

福利 | QQfamily旗舰店设计揭秘

7月底，首家QQfamily线下旗舰店在深圳欢乐海岸开业。集合了潮玩销售、主机游戏体验、游戏电影KTV聚会包房等消费场景的QQfamily主题店一开业即火爆。QQfamily潮流+游戏感的店装空间是如何打造的？本篇就来揭秘！ Chapter 1 玻璃钢设计 FRP Design 1.1 VR玩家QQ | VR player QQ 在店门口展示的玻璃钢的设计上，我们把QQ特征化地打造成可以代表整个店面空间的样子。我们认为，QQfamily旗舰店是游客暂时逃离现实、享受店内有趣好玩内容的空间，类似于

智能存储：一站式AI内容识别加速内容生产

导语数据万象内容识别基于深度学习等人工智能技术，与对象存储 COS 深度融合，底层直接调用COS的数据，实现数据存储、流动、处理、识别一体化，提供综合性的云原生 AI 智能识别服务，包含图像理解（解析视频、图像中的场景、物品、动物等）、图像处理（一键抠图、图像修复）、图像质量评估（分析图像视觉质量）、图像搜索（在指定图库中搜索出相同或相似的图片）、人脸识别、文字识别、车辆识别、语音识别、视频分析等多维度能力。用户可使用数据万象提供的自动化工作流或批量任务处理串联业务流程，大幅减少人力成本，缩短产出时间的同

利用面部识别算法和卷积神经网络的转移学习，分析朝鲜海报上的人物性别分布

众所周知，朝鲜是一个具有神秘色彩的国家。除了在电视或者网络上看到一些政治方面的新闻外，我们很难从网络上了解到朝鲜人民的日常生活状态。但是，科技是万能的。本文将利用面部识别算法和应用于卷积神经网络的转移

给KEEBOX插上Eagle的翅膀

KEEBOX是我自己“Eat My Own Dog Food”打造的个人软件工具箱，功能上有点儿包罗万象，其中这阵子用的最多的一个功能就是全画幅海报，因为我向我的读者许诺过，每天会在读者群里发送一副海报，所以就打造了这么一个工具，样子是这样的：

小处显逼格：细节提升气质 - 腾讯ISUX

时代总是在螺旋式地发展变化中，设计潮流也是如此。随着移动端扁平化设计推进，越来越多的设计师不满足于仅仅是色块、图标和系统字体的枯燥组合，而把更多的心思投入到精益求精的视觉设计中。从平面设计引申过来的技巧在这时起到了画龙点睛的作用：一些细节上的处理，为移动产品的界面大大地提升了品牌逼格。例如以设计精美著称的Yahoo的两款明星App产品Yahoo Weather!和Yahoo Digest。除了在产品设计上的极致和突出表现外，模糊和斜切的手法，给整个产品的品牌气质提升到了一个新的高度。 Yahoo Weat

【干货】5个设计Tips提升APP逼格

腾讯区块链-【画说梦想】小程序应用NFT数字交易应用案例分析

近日，腾讯SSV发布基于至信链的区块链公益项目平台应用-“画说梦想”，是通过AI语音和文字填写两种输入方式，采集用户的梦想数据，然后随机匹配公益画作，发布于NFT数字交易平台上，主要实现腾讯云公益平台上的45个公益项目，用户捐赠随机匹配支持，打造可持续美好的公益新模式。

双色调设计，两个颜色就够了

本文作者*：沈明，腾讯视觉设计师在为智能音箱设计品牌图像时，面对如何能更好体现出产品在“音乐”上的特质这个问题，我们寻找和尝试了很多方案，最终选择了双色调设计（Duotone）来展现音乐现场的独特氛围：这是一种在灯光笼罩下由声音、听众、乐手、乐器交织而成的音乐会现场感。表达不同情感的歌曲，现场会出现不同的灯光氛围。双色调设计能最大限度体现这种音乐会的现场感。腾讯听听音乐海报设计腾讯听听内测版包装设计双色调设计来源于双色印刷和波普艺术双色调设计（Duotone）来源于双色印刷，主

探索MEG脑指纹：评估、陷阱和解释

基于受试者的功能性连接组(FC)的个体特征(即“FC指纹”)已经成为当代神经科学研究的一个非常热门的目标，但脑磁图(MEG)数据中的FC指纹还没有得到广泛的研究。本研究中，我们研究来自人类连接组计划(HCP)的静息状态的MEG数据，以评估脑磁图FC指纹及其与包括振幅和相位耦合的功能连接指标、空间渗漏校正、频带和行为意义在内的几个因素的关系。为此，我们首先使用两种识别评分方法，区分识别率和成功率，为每个FC测量提供定量指纹评分。其次，我们探索了横跨不同频段(δ、θ、α、β和γ)的边缘和节点的MEG指纹模式。最后，我们研究了从同一受试者的MEG和fMRI记录中获得的跨模态指纹模式。我们的结果表明，指纹识别的性能在很大程度上取决于功能连接指标、频带、识别评分方法和空间渗漏校正。本研究初步提供了MEG指纹与不同方法学和电生理因素相关的第一个特征，并有助于理解指纹的跨模态关系。

多模态大模型「卷」向智能文档，只为解放打工人的双手

文档是重要的信息存储载体之一，人们每天接触和使用文档的频率也越来越高。相对应地，用户对文档处理和图像内容的安全要求逐渐提升，智能文档技术面临的挑战也更大。

AI绘画专栏之 SDXL 制作一张海报(45)

字体设计：放在水平面，倒影，特写数字艺术，西瓜肉和[西瓜汁：2]，小种子，白色背景，冰背景，\n光线追踪，真实感，照片，杰作，逼真，逼真，高对比度，8k高清高清详细逼真，详细，超详细，最佳质量，超高分辨率，（真实感：1.4），高分辨率，详细，原始照片，清晰

Ps|文字人物海报

为了突出主题，作者很多时候会使用放大、改变颜色等方式使文字更加引人注目，有的人还会将文字通过拼接转换等方式取代海报中的物体，这种方式常用于电影海报，动漫插图等方法。特别是文字人物海报给人以巨大的震撼，其文字破碎的留白也带给人较大的想象空间，接下来就为大家讲解如何制作文字人物海报。

商业海报设计手法-提升宣传时信息传达有效性

作者：ziqianwang 腾讯CSIG设计师 |导语在为产品/品牌做宣传的时候，海报的设计往往是很重要的一个环节，那么何为有效的海报设计呢？接下来和大家分享一下做有效性海报的设计知识点！什么是有效的海报设计？在了解这个之前，我们先来看一看海报的类型分别分为哪几种？海报分类电影 / 综艺海报：海报的一个主要类型，这类型的海报在表达的时，整体画面氛围元素和本身的影视作品是息息相关的，好的电影海报可以充分表达电影的故事感，并且达到刺激观众进行买票购买等行为。公益海报：社会性思考表达的一个

一览端到端人脸识别最新进展，上大&京东AI研究院综述被ACM旗舰期刊接收

端到端深度人脸识别系统由三个关键要素构成：人脸检测（face detection）、人脸对齐（face alignment）和人脸表征（face representation）。其中，人脸检测的作用是定位静止图像或视频帧中的人脸位置。然后，人脸对齐将人脸校准到一个规范的视角，并将人脸图像裁剪到一个标准化像素大小。最后，在人脸表征阶段，从对齐后的图像中提取具有鉴别性的特征用于识别。

业界 | 全球最权威人脸识别测试，中国团队依图科技夺得第一

机器之心报道作者：吴欣在最近公布的国际权威人脸识别供应商测试 FRVT（Face Recognition Vendor Test）结果中，中国公司依图科技获得了四项测试的第一名，超过了俄罗斯公司 Vocord（Vocord 是国际老牌安防厂商，长久以来超越 Google 等公司盘踞人脸识别算法第一名）。 FRVT 是由美国国家标准技术局 NIST(National Institute of Standards and Technology) 组织的人脸识别供应商测试，作为美国国家采购的官方指导，其测试的

【文本检测与识别白皮书-3.2】第一节：基于分割的场景文本识别方法

基于分割的识别算法是自然场景文本识别算法的一个重要分支(Wang 等，2012;Bissacco 等，2013;Jaderberg 等，2014)，通常包括3 个步骤:图像预处理、单字符分割和单字符识别。基于分割的自然场景文本识别算法通常需要定位出输入文本图像中包含的每个字符的所在位置，通过单字符识别器识别出每一个字符，然后将所有的字符组合成字符串序列，得到最终的识别结果。

动态 | 最权威的比赛，看全球人脸识别技术发展格局

AI 科技评论按：在最近公布的国际权威人脸识别供应商测试 FRVT（Face Recognition Vendor Test）结果中，中国公司依图科技获得了四项测试的第一名，超过了俄罗斯公司 Vocord （Vocord是国际老牌安防厂商，长久以来超越Google等公司盘踞人脸识别算法第一名）。 FRVT是由美国国家标准技术局NIST(National Institute of Standards and Technology)组织的人脸识别供应商测试，作为美国国家采购的官方指导，其测试的权威性是全球工业界

干货 | 玩转社交裂变，携程小程序营销实现方案

随着近两年小程序应用的普及，越来越多的商家通过小程序展开营销，相比APP，小程序有更大机动性，能够支持搜索、会话、微信群、朋友圈等场景。

微信 OCR（2）：深度序列学习助力文字识别

本文主要介绍了深度序列学习在OCR中的应用，包括CRNN、EDA、Encoder-Decoder、Attention模型等。这些模型在OCR领域取得了显著的成果，可以用于端到端的文本识别。其中，CRNN模型在文本识别任务上表现尤为突出，可以处理不同大小、字体、颜色的文本，并且不需要文本框标注。在实践中，使用Attention OCR模型可以更好地处理含有多个背景干扰的文本，并且可以适应不同排版和字体大小的文本，真正实现了端到端的文本识别。然而，该方法仍存在一些局限性，如识别结果字符内容可能乱序，以及不适用于文字内容较多的图片等。

语音直播平台源码打造不同服务场景常用技术解决方案

以声音这种更方便、亲近的交流方式能传递的信息比文字更多，语音、语气、语调甚至停顿长短都能反应一个人的情绪变化，不少年轻用户看来，声音可以让自己更贴切地感知到对方的存在。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐