首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯AI Lab宣布将于9月底开源“Tencent ML-Images”项目

腾讯AI Lab宣布将于9月底开源“Tencent ML-Images”项目

作者头像
腾讯技术工程官方号
发布于 2018-09-11 10:23:58
发布于 2018-09-11 10:23:58
4K0
举报

今日,腾讯AI Lab宣布将于9月底开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

该项目的开源,是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,为人工智能领域的科研人员和工程师提供充足的高质量训练数据,及简单易用、性能强大的深度学习模型,促进人工智能行业共同发展。

腾讯AI Lab此次公布的图像数据集ML-Images,包含了1800万图像和1.1万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。此外,腾讯AI Lab还将提供基于ML-Images训练得到的深度残差网络ResNet-101。该模型具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。

各大科技公司都非常重视人工智能基础能力的建设,都建立了仅面向其内部的大型图像数据集,例如谷歌的JFT-300M和Facebook的Instagram数据集。但这些数据集及其训练得到的模型都没有公开,对于一般的科研机构和中小企业来说,这些人工智能基础能力有着非常高的门槛。

当前业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images, 包含900万训练图像和6000多物体类别。腾讯AI Lab此次开源的ML-Images数据集包括1800万训练图像和1.1万多常见物体类别,或将成为新的行业基准数据集。除了数据集,腾讯AI Lab团队还将在此次开源项目中详细介绍:

(1) 大规模的多标签图像数据集的构建方法,包括图像的来源、图像候选类别集合、类别语义关系和图像的标注。在ML-Images的构建过程中,团队充分利用了类别语义关系来帮助对图像的精准标注。

(2) 基于ML-Images的深度神经网络的训练方法。团队精心设计的损失函数和训练方法,可以有效抑制大规模多标签数据集中类别不均衡对模型训练的负面影响。

(3) 基于ML-Images训练得到的ResNet-101模型,具有优异的视觉表示能力和泛化性能。通过迁移学习,该模型在ImageNet验证集上取得了80.73%的top-1分类精度,超过谷歌同类模型(迁移学习模式)的精度,且值得注意的是,ML-Images的规模仅为JFT-300M的约1/17。这充分说明了ML-Images的高质量和训练方法的有效性。详细对比如下表。

注:微软ResNet-101模型为非迁移学习模式下训练得到,即1.2M预训练图像为原始数据集ImageNet的图像。

腾讯AI Lab此次开源的“Tencent ML-Images”项目,展现了腾讯在人工智能基础能力建设方面的努力,以及希望通过基础能力的开放促进行业共同发展的愿景。

“Tencent ML-Images”项目的深度学习模型,目前已在腾讯多项业务中发挥重要作用,如“天天快报”的图像质量评价与推荐功能。如下图所示,天天快报新闻封面图像的质量得到明显提高。

优化前(左图)&优化后(右图)

此外,腾讯AI Lab团队还将基于Tencent ML-Images的ResNet-101模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。

自2016年腾讯首次在GitHub上发布开源项目(https://github.com/Tencent),目前已累积开源覆盖人工智能、移动开发小程序等领域的57个项目。为进一步贡献开源社区,腾讯相继加入Hyperledger、LF Networking和开放网络基金会,并成为LF深度学习基金会首要创始成员及Linux基金会白金会员。作为腾讯“开放”战略在技术领域的体现,腾讯开源将继续对内推动技术研发向共享、复用和开源迈进,向外释放腾讯研发实力,为国内外开源社区提供技术支持,注入研发活力。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯技术工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
局域网SDN技术硬核内幕 6 分布式任意播网关
先让我们回顾,昨天的文章《虚拟化网络的实现》中,我们提到的一个虚拟网络标准化模型:
用户8289326
2022/07/22
5850
局域网SDN技术硬核内幕 6 分布式任意播网关
局域网SDN技术硬核内幕 5 虚拟化网络的实现
在前一篇文章 《从计算虚拟化到网络虚拟化》中提到,将虚拟私有云(VPC)中,各个网络节点互联的是通过虚拟网元实现的。那么,在现实中,谁扮演虚拟网元的角色呢?
用户8289326
2022/07/22
5270
局域网SDN技术硬核内幕 5  虚拟化网络的实现
SDN Overlay技术白皮书(下)
5 SDN Overlay组网方案设计 Overlay控制平面架构可以有多种实现方案,例如网络设备之间通过协议分布式交互的方式。而基于VCF控制器的集中式控制的SDN Overlay实现方案,以其易于与计算功能整合的优势,能够更好地使网络与业务目标保持一致,实现Overlay业务全流程的动态部署,在业界逐步成为主流的Overlay部署方案。 5.1 SDN Overlay组网模型 图14 SDNOverlay组网模型 如上图所示,H3C的SDN Overlay组网同时支持网络
SDNLAB
2018/04/02
2.4K0
SDN Overlay技术白皮书(下)
云计算网络技术内幕 (18) 第聂伯河畔的浪漫战歌 (上)
在上期,我们提到,大型云计算平台的容器网络,需要考虑的一个关键因素,是应用调度层(容器)和资源层(虚拟机)的紧密结合。
用户8289326
2023/09/06
2160
云计算网络技术内幕 (18) 第聂伯河畔的浪漫战歌 (上)
SDN Overlay技术白皮书(上)
1 概述 1.1 产生背景 随着企业业务的快速扩展,IT作为基础设施,其快速部署和高利用率成为主要需求。云计算可以为之提供可用的、便捷的、按需的资源,成为当前企业IT建设的常规形态,而在云计算中大量采用和部署的虚拟化几乎成为一个基本的技术模式。部署虚拟机需要在网络中无限制地迁移到目的物理位置,虚拟机增长的快速性以及虚拟机迁移成为一个常态性业务。传统的网络已经不能很好满足企业的这种需求,面临着如下挑战: 虚拟机迁移范围受到网络架构限制 虚拟机迁移的网络属性要求,当其从一个物理机上迁移到另一个物理机上,虚拟机需
SDNLAB
2018/04/02
2.3K0
SDN Overlay技术白皮书(上)
云计算网络技术内幕 (19) 第聂伯河畔的浪漫战歌 (下)
在上期,我们复习了《钢铁是怎样炼成的》中,保尔,冬妮娅和达雅之间的故事,也理解了公有云的容器网络实现方式之一——TKE Global Router。
用户8289326
2023/09/06
2210
云计算网络技术内幕 (19) 第聂伯河畔的浪漫战歌 (下)
局域网SDN技术硬核内幕 9 从软件Overlay到硬件Overlay
IRB(Integrated Routing & Bridging)或DAG (Distributed Anycast Gateway),实现全网所有VM的同网段和跨网段转发;
用户8289326
2022/07/22
7540
局域网SDN技术硬核内幕 9 从软件Overlay到硬件Overlay
云计算与虚拟化硬核技术内幕 (18) —— 《凉州词》的故事
因此,秦少游在宿主机上引入了DPDK的同时,还增加了一块可编程的SmartNic。
用户8289326
2022/09/08
1.4K0
云计算与虚拟化硬核技术内幕 (18) —— 《凉州词》的故事
Neutron 理解 (1): Neutron 所实现的网络虚拟化
特别说明:本文于2015年基于OpenStack M版本发表于本人博客,现转发到公众号。因为时间关系,本文部分内容可能已过时甚至不正确,请注意。
SammyLiu
2019/06/28
3.7K0
Neutron 理解 (1): Neutron 所实现的网络虚拟化
vSwitch:虚拟和物理网络的纽带
云计算意味着可以更便捷的使用计算、网络、存储资源,每一个元素都可根据用户业务灵活组合配置,其中网络环境直接关系到云中的信息流通,如何构建控制、可靠、效率俱佳的网络环境,是云计算在IaaS层面必须面对的
SDNLAB
2018/04/03
1.5K0
vSwitch:虚拟和物理网络的纽带
局域网SDN技术硬核内幕 7 从二层到大二层
首先,我们知道,在同一台宿主机下,同一网段的虚拟机可以直接通讯,而在同一个二层域内,跨宿主机的虚拟机通讯则需要OVS在上连方向增加VLAN TAG,如图所示:
用户8289326
2022/07/22
4670
局域网SDN技术硬核内幕 7 从二层到大二层
容器网络硬核技术内幕 (17) 生命的火花
在《为人民服务重于泰山》中,我们提到,容器只有向外界提供服务,才有存在的价值,像泰山一样重,否则则像鸿毛一样轻。
用户8289326
2022/07/28
2790
容器网络硬核技术内幕 (17) 生命的火花
局域网SDN技术硬核内幕 13 二 从局域网到互联网
前面提到,在数据中心内部,通过层次化端口绑定和EVPN,云平台得以教会了让虚拟机通过硬件交换机封装VXLAN,实现同网段和不同网段的互联互通。
用户8289326
2022/07/22
4780
局域网SDN技术硬核内幕 13 二 从局域网到互联网
虚拟化及云计算硬核技术内幕 —— 小结 下
由于Intel为代表的处理器厂商发现,处理器主频的提升受到硅材料物理特性的限制,难以突破4.0GHz的瓶颈,从而转向在处理器集成电路上集成多个处理核心,以提升处理器的计算力。为了让多个处理核心可以运行多个不同的应用程序和服务,出现了把一台物理机资源分割为多个虚拟机的虚拟化技术。
用户8289326
2022/09/08
7080
虚拟化平台cloudstack(1)——介绍
什么是cloudstack CloudStack是一个开源的具有高可用性及扩展性的云计算平台。目前Cloudstack支持管理大部分主流的hypervisors,如KVM,XenServer,VMwa
cloudskyme
2018/03/20
2.6K0
虚拟化平台cloudstack(1)——介绍
局域网SDN技术硬核内幕 8 从二层交换到三层路由
昨天,我们在《从二层到大二层》中介绍了VXLAN二层转发的机制。同一个网段的虚拟机需要跨越三层网络通信时,可以将二层以太网数据包封装在VXLAN隧道中穿越三层网络。那么,当不同网段的虚拟需要通信时应当如何实现呢? 在Neutron中的实现如下图:
用户8289326
2022/07/22
6530
局域网SDN技术硬核内幕 8  从二层交换到三层路由
局域网SDN硬核技术内幕 20 亢龙有悔——规格与限制(上)
2016年基于EVPN+VXLAN的局域网SDN技术发端以来,在短短的三年来,已经取得了巨大的成功,如果某家网络方案供应商对该方案支持不完善,将会被排挤出主流圈子,而在大型数据中心或园区网络项目中,SDN的需求也逐渐成为必选项。
用户8289326
2022/07/22
4420
局域网SDN硬核技术内幕 20 亢龙有悔——规格与限制(上)
OpenStack走过“七年之痒” ,中国门徒的阵营如今更庞大了丨科技云·视角
人们常用“七年之痒”来形容婚姻中出现的疲劳期。从问世至今的7年来,它逐步从青涩走向成熟,途中经历了CloudStack的淡出、Nebula的陨落、Docker的崛起等众多决定行业走向的里程碑事件,甚至不乏有唱衰OpenStack的言论夹杂其中。但事实证明,这项开源技术和它的众多拥趸们依然处于“情感上升期”,OpenStack正在逐渐变成一种流行的使用规则。
科技云报道
2022/04/14
1.9K0
OpenStack走过“七年之痒” ,中国门徒的阵营如今更庞大了丨科技云·视角
SDN那些事:传统网络变身SDN、公有云及NFV 网络专题
SDN的概念已经提出很多年了,原以为SDN不会立刻在生产环境下部署,但是SDN的商用历程超出了我们的想象。 特别是很多公有云服务商面临业务快速发展的压力,在网络平台上,已经开始大规模部署基于SDN的网络。 SDN和公有云 随着数据中心向云架构转型,数据中心网络平台开始面临越来越大的挑战: 云计算时代的数据中心网络平台必须能够满足计算虚拟化的要求,提供足够的接入带宽,提供足够大的MAC地址表,提供一个“大二层”的环境满足虚拟机迁移的需求。 网络平台必须提供足够的灵活性,满足资源灵活部署,网络快速调整,网络属性
SDNLAB
2018/04/03
1.8K0
SDN那些事:传统网络变身SDN、公有云及NFV 网络专题
云计算网络技术内幕 小结 (上)
云计算的实质是将集中式的计算机基础架构拆散成为分布式的。具体而言,就是云服务器/容器、云存储和云数据库等云服务实例,取代了单机模型中的CPU,内存和硬盘等组件。
用户8289326
2023/09/06
3100
云计算网络技术内幕 小结 (上)
推荐阅读
相关推荐
局域网SDN技术硬核内幕 6 分布式任意播网关
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档