某中心卖家合作伙伴服务组织的研究人员与加州大学伯克利分校的同事联合公开发布了一个大规模产品图像及相关元数据数据集,旨在支持产品相关信息管理、信息检索和视觉理解研究。
该数据集可帮助开发更强大的基于图像的购物人工智能模型,或扩展零售商的产品图谱。伯克利分校电子工程与计算机科学教授表示:"计算机视觉是实证驱动的领域,其进展一直由数据集推动。在传统图像或视频收集中,我们对特定对象的信息了解甚少——通常只有一个类别标签,如'椅子'。而对于ABO中的对象,我们拥有属性、多视角图像和CAD模型。这使我们能够从图像中推断更多信息。预计这将推动计算机视觉多个领域的研究,特别是3D推理。"
名为Amazon Berkeley Objects(ABO)的数据集包含147,702种产品的图像,所有数据均标注有多语言标题、品牌、型号、年份、产品类型、尺寸和材料等元数据。具体包括:
数据集采用知识共享署名-非商业性4.0国际公共许可证(CC BY-NC 4.0),禁止商业使用但其他方面无限制。
整个数据集——包括静态图像、缩略图、360°旋转序列和3D模型——总大小近300GB。研究人员可通过数据集网站下载完整数据集,按产品名称或类型筛选浏览产品图像,或学习如何使用某机构云服务托管的版本而无需下载。
某中心高级应用科学家表示:"数据已成为人工智能和机器学习最重要的组成部分。在这个项目中,我们一直希望推动产品理解方面的重大创新,这些创新有可能惠及全球购物者。"
该数据集特别适用于:
数据集中的多视角图像和3D模型为研究人员提供了前所未有的丰富视觉信息,有望推动3D推理和物体理解领域的突破性进展。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。