在最新一期的 AAAI 2020 线上论文分享中,旷视研究院算法研究员万昭祎结合被接收的两篇论文,向我们介绍了旷视提出的高性能实时文字检测算法和更鲁棒的文字识别框架。
AI 科技评论按:随着深度学习的兴起和发展,计算机视觉领域发生了极大的变化。作为计算机视觉中一个重要的研究课题,场景文字检测和识别也无法避免地被这股浪潮席卷,一起进入了深度学习的时代。近年来,这个问题的研究者们都共同见证了思维、方法和性能方面的巨大变化,本次公开课的嘉宾将与大家分享相关内容。
上班扫脸打卡、自拍美颜、视频追踪逃犯……你能猜出这三者之间的共同之处吗?其实它们都采用了“人脸识别”技术。而通过Face++人脸识别云平台,这些人工智能技术正变得人人可用。 4年前,来自清华
由于深度学习和海量数据的涌现,场景文字识别技术获得飞速发展。但是先前同类方法存在种种缺点,为此,本文提出 TextScanner,一种鲁棒的基于分割的场景文字识别方法,可以正确读取字符数据,并在一系列相关的文字基准数据集上,取得了当前最佳的性能。本文是旷视研究院与华中科技大学的联合研究成果,已收录于 AAAI 2020。
9.20 - 9.25,作为全球OCR领域标杆性盛会,第15届国际文档分析与识别大会(ICDAR 2019)在澳大利亚悉尼召开,同时也揭晓了本年度ICDAR竞赛的结果并为冠军团队颁发获奖证书。 腾讯数平图像团队(Tencent-DPPR Team)依靠领先的文字检测与识别技术能力,在本次竞赛的三个大项比赛中(MLT19,LSVT,ReCTS, 共10个子任务)获得了7项第一,2项第二的优异成绩,并受邀在会议上做技术报告分享。这也是团队自2017年获得4项OCR冠军之后,
导语:在刚刚结束的第15届国际文档分析与识别大会(澳大利亚悉尼)上,腾讯数据平台部(下称“数平”)团队获颁7项冠军证书,并受邀在会议上做技术分享。 9.20 - 9.25,作为全球OCR领域标杆性盛会,第15届国际文档分析与识别大会(ICDAR 2019)在澳大利亚悉尼召开,同时也揭晓了本年度ICDAR竞赛的结果并为冠军团队颁发获奖证书。 腾讯数平图像团队(Tencent-DPPR Team)依靠领先的文字检测与识别技术能力,在本次竞赛的三个大项比赛中(MLT19,LSVT,ReCTS, 共10个
IEEE国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 大会官方论文结果公布,旷视研究院 16 篇论文被收录(其中含 6篇 Oral 论文),研究领域涵盖物体检测与行人再识别(尤其是遮挡场景),人脸识别,文字检测与识别,实时视频感知与推理,小样本学习,迁移学习,3D感知,GAN与图像生成,计算机图形学,语义分割,细粒度图像,对抗样本攻击等众多领域,取得多项领先的技术研究成果,这与已开放/开源的旷视AI生产力平台Brain++密不可分。本文把 16 篇论文汇在一起,逐篇做了亮点集锦式的抢先解读。 01 论文名称:DPGN: Distribution Propagation Graph Network for Few-shot Learning 论文链接:https://arxiv.org/abs/2003.14247 关键词:小样本学习,图网络
随着信息碎片化时代的来临,人们每天不得不被迫接受处理生活各种场景中无限砸向面前的信息,被各种终端图像、文字数据搞得力倦神疲。而针对大数据的处理,人工能力显然已经无法应对,人工智能与机器学习或将成为劳动力转移和工业革命的切口。过去一年来,研究人员和开发者在人工智能各领域取得多个重要突破。北京旷视科技旗下的 Megvii Image++团队近日刷新了2015 ICDAR 鲁棒阅读竞赛(Robust Reading Competition)和离线手写体汉字单字识别(公开测试集)双项赛事记录,实现了图像识别技术的又
今天,国际文档分析与识别大会(ICDAR)数据集最新结果公布,中国高校及企业包揽排行榜前五。据了解,云从科技提出的Pixel-Anchor框架在多个ICDAR测试子集(ICDAR2015以及ICDAR2017 MLT)上均获得了第一名的好成绩。ICDAR2015数据集前五名及框架名称分别是:云从科技(Pixel-Anchor)、南京大学与南京理工大学(PSENet)、旷视科技(Mask Text)、商汤科技(FOTS)、阿里巴巴(IncepText)。ICDAR2017 MLT数据集前五名及框架名称分别是云从科技(Pixel-Anchor)、阿里巴巴(ATL-cangjie)、商汤科技(FOTS、旷视科技(EAST++)、南京大学(PSENet_NJU)
2019年6月,两年一届的国际文档分析与识别竞赛(ICDAR)落下帷幕,这是全球文字识别(OCR)领域最顶级赛事。腾讯数平精准推荐团队(Data Platform Precision Recommendation, Tencent-DPPR)在本届比赛中斩获7项冠军,成绩遥遥领先其他参赛队伍。这也是继2017年团队勇夺4项官方认证冠军后再创佳绩,同时也标志着腾讯OCR技术稳居国际第一流水准。 国际文档分析与识别大会ICDAR(International Conference on Document A
2019年6月,两年一届的国际文档分析与识别竞赛(ICDAR)落下帷幕,这是全球文字识别(OCR)领域最顶级赛事。腾讯数平精准推荐团队(Data Platform Precision Recommendation, Tencent-DPPR)在本届比赛中斩获7项冠军,成绩遥遥领先其他参赛队伍。这也是继2017年团队勇夺4项官方认证冠军后再创佳绩,同时也标志着腾讯OCR技术稳居国际第一流水准。 国际文档分析与识别大会ICDAR( International Conference
【新智元导读】在3月27日举行的中国“AI春节”——2017新智元开源·生态AI技术峰会上,海康威视研究院院长浦世亮发表演讲《安防大数据驱动下的智慧生活》,介绍海康在智能+安防领域的技术探索。海康威视是全球视频监控No.1,近年来布局安全视频监控发展,物联网以及视频大数据和智能视频分析,产业表现强劲,在以 ImageNet 为代表的国际技术竞赛中也一直都有抢眼的成绩。 演讲中,浦世亮介绍了应对安防大数据三大挑战,以及海康威视的应对之道:挖掘无标签数据中的隐藏信息做额外反馈,化解标记数据成本高的问题;多传感器
机器之心原创 作者:吴欣 不断攀升的融资额背后,是正大幅抬高的创业门槛,人工智能创业还有小玩家的机会吗? 2017 年 10 月 31 日,中国人工智能创业公司旷视科技 Face++ (下简称旷视)宣布正式完成 C 轮 4.6 亿美金融资,本轮由中国国有资本风险投资基金(简称「国风投」)领投,蚂蚁金服、富士康集团联合领投。本轮融资由 C1、C2 两轮构成,同时引入包括中俄战略投资基金、阳光保险集团、SK 集团等新的重要投资者,腾达资本作为本轮融资独家财务顾问。 在宣传稿中提到,这一数字打破了国际范围内
比如你想爬一个网站的数据,你需要分析这个网站,要向哪个 url 发起请求,要向服务器传递哪些数据,拿到服务器的返回数据又要怎么解析出想要的数据。
在机器学习和计算机视觉领域,光学字符识别(optical character recognition, OCR)长期以来都是人们研究的重要主题之一。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本。
两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于 10 月 27 日 - 11 月 2 日在韩国首尔举行。近期,大会官方公布了最终的论文接收决定,旷视研究院共有 11 篇论文被收录,研究领域涵盖通用物体检测及数据集、文字检测与识别、半监督学习、分割算法、视频分析、影像处理、行人及车辆再识别、模型压缩、度量学习、强化学习、元学习等众多领域。本文把 11 篇论文汇在一起,逐篇做了亮点抢先解读。
当各路资本都蜂拥而至某一领域的时候,其也就结束了淘金的黄金时期,当前的人脸识别正处于这一阶段。
AI科技评论按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
疫情防控常态化下,健康码、通信行程卡已成为出入社区、办公园区、景区、交通枢纽等场合查验个人健康状况的必要条件。 然而,很多地方都还在采用人工的方式进行确认,不仅占用大量人力、财力,且存在各种问题。 为应对疫情常态化下爆发的各类防疫需求,腾讯云AI文字识别(OCR)特别推出了通信行程卡与防疫健康码识别两大能力,用AI助力各地开展疫情防控工作,提升识别录入效率,节省人工核对时间。 具体来说: 01 通信行程卡识别 文字识别(OCR)在助力抗疫方面对算力、并发、检测速度有着更高的要求,想满足各地大量识别请求并发
AI 研习社按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
以下文章来源于腾讯云AI ,作者Jerry 在人类灿若星海的历史进程中,科技创新的力量一直推动着代代革新,每次技术进步都会深刻影响着大众生活,甚至在经济发展中起到关键支撑作用。 近日,在2021上海国际消费电子技术展(Tech G)杰出科技奖(Great Tech Awards)年度评选中,腾讯云AI文字识别荣获人工智能组别——杰出科技创新奖。 上海国际消费电子技术展(简称Tech G),作为面向亚太及全球市场的科技行业盛会,聚焦人工智能、5G、虚拟现实和汽车技术等横跨不同市场的革命技术,致力于推动行
『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。 架构 使用WebRTC和WebVR进行VR视频通话 本文来自Google的开发专家Dan Jenkins,他喜欢将最新的Web API与RTC应用程序混合在一起。他还在Nimble Ape经营自己的咨询和开发公司。本文中,他给出了一个代码实现——通过使用WebVR将FreeSWITCH Verto WebRTC视频会议转换为虚拟现实会议的。LiveVideoStack对原文进
在人类灿若星海的历史进程中,科技创新的力量一直推动着代代革新,每次技术进步都会深刻影响着大众生活,甚至在经济发展中起到关键支撑作用。 近日,在2021上海国际消费电子技术展(Tech G)杰出科技奖(Great Tech Awards)年度评选中,腾讯云AI文字识别荣获人工智能组别——杰出科技创新奖。 上海国际消费电子技术展(简称Tech G),作为面向亚太及全球市场的科技行业盛会,聚焦人工智能、5G、虚拟现实和汽车技术等横跨不同市场的革命技术,致力于推动行业发展,助力科技技术的跨界应用,促进科技
在人工智能产业中,应用层是一个极大的部分,是人工智能技术最终的目的地。除了机器人、无人机和无人驾驶等硬件产品之外,人工智能的软件应用在单独商业化的同时,也在为这些硬件产品提供服务,像智能家居的语音控制
通过调用第三方人脸识别api,按照指定格式上传图片及必要的参数,然后api进行云端识别,
项目地址:https://github.com/PantsuDango/Dango-Translator
【新智元导读】没有什么技术是不能被取代的,旷视科技Face++联合创始人唐文斌认为,算法技术只是手段,最终是产品价值让用户买单。日前,唐文斌接受了新智元专访,谈了旷视科技Face++的商业模式、公司定位以及人才和发展观。他表示旷视不是一家技术公司,而是一家产品公司,一家以人工智能技术为核心的产品公司。 “没有什么技术是不能被取代的。”唐文斌说:“算法也好,技术也好,都是手段,最后能够提供出去的是产品价值。”这位三十刚出头的旷视科技Face++联合创始人,对这家中国人脸识别独角兽有着很清晰的定位:“旷视不是
【新智元导读】DeepMind迄今最强棋手AlphaGo Zero横空出世,其中一个重要组成部分是出自华人团队的深度残差网络ResNet。新智元采访了深度残差网络ResNet作者之一,旷视科技Face++首席科学家孙剑博士。孙剑认为,AlphaGo Zero技术提升足够伟大,但在真实技术落地过程中还有着众多局限。孙剑分享了他的最新工作——更小更好的神经网络,以及他的人才观。在采访中,孙剑还谈到,人脸识别远远没有被解决,“全世界的视觉研究人员一起来做都不够”。 2017年10月19日,DeepMind团队发表
数据显示,2020年,国内有35%的AI企业聚集计算机视觉领域,市场规模在所有领域中占比达57%,排名第一。
「TalentAI」将持续带来人工智能相关在招职位信息,欢迎正在找工作与看新机会的朋友关注,也欢迎企业伙伴与我们联系合作。 正值春招,近期岗位较多,欢迎大家关注「TalentAI」查看职位详情。 本期「TalentAI」推荐职位来自同花顺、面壁智能、小红书、京东科技、旷视、米哈游、达摩院、蚂蚁安全、卡方科技。 同花顺 浙江核新同花顺网络信息股份有限公司(同花顺)成立于1995年,于2009年在深交所上市(股票代码:300033),是国内第一家互联网金融信息服务行业上市公司。公司十分重视创新与技术研发,每年研
作者 | 阿司匹林 2 月 28 日,美国麻省理工学院(以下简称 MIT)与中国商汤科技 SenseTime 宣布成立人工智能联盟,共同探索人类与机器智能的未来。 该联盟将致力于全方位人工智能原创技术研发,涉及领域包括计算机视觉、脑科学智能算法、医疗图像、机器人等,将全力推动人工智能技术突破以应对更多全球性挑战,并将有力支持 MIT 在人工智能领域进行最前沿跨学科探索研究。 商汤科技是全球首家参与 MIT 最近成立的 Intelligence Quest (以下简称 IQ)项目的公司。这个项目发挥 MI
据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家。美国占据1078家居首,中国以592家企业排名第二,其后分别是英国,以色列,加拿大等国家。本文中选取了国外和国内部分有代表性的AI产业链条上相关公司就行分析(排名不分先后),希望对有志于从事人工智能相关工作或者想了解AI行业目前发展现状的朋友能有所帮助。小编会从AI芯片、应用层算法、应用领域等方面对相关公司进行盘点,由于部分公司可能会涉及产业链条上不同的领域,文中侧重选取了某些点进行分析阐述。备注:文中涉及到的企业估值均源于公开资料,本文对数字真实性不做任何担保;对于企业的明星指数是小编根据公开资料以及行业内部朋友反馈做的综合评估,不作为投资参考。
提到面部识别技术,很多人一定不会感到陌生,支付宝、微信这些日常使用的APP都具有人脸识别功能,在支付界面就可以设置人脸识别支付。而通常提到的面部识别技术,一般专指人脸识别技术。就在近日,旷视科技公布了“狗脸识别”的技术专利,把面部识别技术的应用扩展到宠物领域。
孙剑,博士,旷视科技(Face++)首席科学家、研究负责人。2003年毕业于西安交通大学人工智能与机器人研究所,毕业后加入微软亚洲研究院(Microsoft Research Asia),任至首席研究员。其主要研究方向是计算摄影学(computational photography)、人脸识别(face recognition)和基于深度学习的图像理解(deep learning based image understanding)。自2002年以来在CVPR、ICCV、ECCV、SIGGRAPH、PA
作者:张乾 【新智元导读】昨天,“2018北京人工智能产业高峰论坛”举办,北京前沿国际人工智能研究院也在会上宣告成立。在论坛上,来自中科院、商汤、旷视、腾讯AI Lab等学术与产业界大佬分享了人工智能当下的技术创新、发展趋势和存在的问题,干货满满。 2月8日,在北京市经信委和海淀区人民政府共同主办的“2018北京人工智能产业高峰论坛”上,北京前沿国际人工智能研究院宣布成立,李开复任首任院长,陈东平为理事长。 在论坛上,北京市经信委相关负责人介绍了北京人工智能产业的工作思路和新模式探索,中国科学院院士陈润生,
文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号。在过去的十几年中,研究人员一直在探索如何能够快速准确的从图像中读取文本信息,也就是现在OCR技术。
上一篇文章封装了request库用来发起http请求,然后获取了用户操作凭证access_token。上篇文章主要对百度AI文字识别接口最基础的通用文字以及手写文字图片进行了接入识别,本篇文章我们来接着看几个实用性比较强的文字识别接口。百度AI接口对接挺容易的,签名加密都没有涉及到。唯一的缺点就是接口文档写的不够完善,容易遇见坑。上篇文章只介绍了第一个实用性接口:身份证识别接口,我们当时只以正面照做了示例,该接口不支持图片url,而是需要将图片数据以BASE64编码。我们直接贴关键代码:
距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻,已经过去了整整一年的时间。在这一年里,国内外大量公司涌入大模型的“斗兽场”,加速大模型技术的迭代与跃迁。
Face++入榜2017全球最具突破性品牌,人脸识别领域力压Facebook人脸团队;国资委与图灵机器人签订意向合作协议,打造人工智能卡通大使小新;捷通华声助力“汇付天下”,整合多渠道搭建智能客服。
机器之心报道 编辑:蛋酱、泽南 科创板昨天传来好消息:「AI 四小龙」之一的旷视科技 IPO 过会了。 9 月 9 日晚间,上交所披露科创板上市委 2021 年第 66 次审议会议结果:旷视科技首发过会。 据其 9 月 2 日更新的招股书(上会稿)显示,旷视科技此次预计募集发行 2.53 亿份 CDR(存托凭证),拟募集资金 60.18 亿元。此次旷视科技从受理材料到过会历时 174 天,比起第一家以 CDR 方式登陆 A 股的九号公司(689009.SH)缩短了整整 387 天。 一直以来,旷视科技的上
首先鸣谢 @samayala22(加拿大)、@manjrekarom (印度)等社区同学为本文提及的技术点做出的卓越贡献 !期待更多社区伙伴加入算法优化工作中来,同时也希望这两位小伙伴早日学会中文,读懂我们的致谢~
---- 新智元报道 编辑:编辑部 【新智元导读】6月14日凌晨,旷视首席科学家、旷视研究院院长孙剑博士突发疾病去世,享年45岁。 6月14日凌晨,一位AI巨星陨落。 刚刚,旷视研究院发文,旷视首席科学家、旷视研究院院长孙剑博士去世。 我们万分难过,旷视首席科学家、旷视研究院院长孙剑博士因突发疾病抢救无效,于2022年6月14日凌晨,永远离开了我们。 孙剑博士一生专注于科研工作。他的不幸离世,让旷视失去了一位在人工智能技术领域探索和创新的领路人。每一位和他共事过的旷视同学,失去了一位智慧谦和
又一个国产深度学习框架开源了。3 月 25 日,旷视科技在北京发布了新一代人工智能生产平台天元(MegEngine),其「训练推理一体」、「动静合一」、「兼容并包」、「灵活高效」的强大性能或许将为 AI 领域带来新的风向。
为了抗击新冠肺炎病毒疫情,腾讯云AI即日起免费为战疫开发者提供人脸识别、文字识别、语音识别、语音合成、机器翻译、腾讯智能对话平台TBP等服务,直至疫情结束。所有为政府部门、医疗机构等开发疫情服务,以及提供远程办公、教学等服务的开发者和服务商,都可以免费或以一定优惠额度享受服务。
就在昨天(8月8日),旷视发起了一场“3D视觉产业先锋研讨会”,并正式对外推出了“软硬一体”的移动端3D感知全栈解决方案。
【新智元导读】The Inquirer网站称,苹果iOS 12系统将支持横向Face ID解锁,而2018年秋季新品发布会发布的三款iPhone手机,也都将支持Face ID解锁。苹果引领了3D视觉+AI的潮流,旷视对标苹果,整合技术、构建完整产业链,发布“软硬一体”的移动端3D感知全栈解决方案。
作者 | 阿司匹林 出品 | 人工智能头条(公众号ID:AI_Thinker) 今日(4 月 9 日),商汤科技(SenseTime)宣布完成 6 亿美元 C 轮融资。该轮融资由阿里巴巴集团领投,新加坡主权基金淡马锡、苏宁等投资机构和战略伙伴跟投。 商汤科技联合创始人、CEO 徐立表示:“商汤科技 C 轮融资将进一步夯实公司在人工智能领域的领军地位:首先,以商汤原创技术为核心,赋能更多行业;其次,与全球头部伙伴进行深度合作,进一步拓展商业版图;第三,强化上下游产业链,深化商汤在人工智能产业链布局。” 201
作者:TencentOCR团队 全球 OCR 最顶级赛事,TencentOCR 以绝对领先优势斩获三冠,腾讯技术再扬威名! 一、竞赛背景 2021 年 9 月,两年一届的 ICDAR 竞赛落下帷幕,这是文字识别(OCR)领域全球最顶级赛事。TencentOCR 团队在本届比赛中参加了视频文字识别竞赛,并包揽该赛道全部 3 项冠军,成绩遥遥领先。这也是继 2017 年团队勇夺 4 项官方认证冠军[1]、2019 团队勇夺 7 项冠军后[2],再创佳绩,同时也标志着腾讯 OCR 技术稳居国际第一流水准。
安防领域目前已经成为国家大力重视的方向。公安部科技信息化局党委书记谭晓准在2016年北京安博会“中国安防政府论坛”讲话中提及,在中央综治办、国家发改委、公安部等35个部委强力推进公共安全视频监控建设联网应用工作之下,2015年以来,各部门、行业安装的摄像机数量已近2500万。在国家“十三五”开局之年,进一步强化问题导向,突出重点、提速建设,力争到2020年,基本实现公共安全视频监控“全域覆盖、全网共享、全时可用、全程可控”。00万台摄像机仅工作一个小时,所产生的录像时长叠加,就需要2850年的时间才能播完。
领取专属 10元无门槛券
手把手带您无忧上云