首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大规模产品图像与元数据数据集发布

大规模产品图像与元数据数据集发布

原创
作者头像
用户11764306
发布2025-09-09 06:18:54
发布2025-09-09 06:18:54
970
举报

某中心与伯克利发布产品图像与元数据数据集

某中心卖家合作伙伴服务组织的研究人员与加州大学伯克利分校的同事联合公开发布了一个大规模产品图像及相关元数据数据集,旨在支持产品相关信息管理、信息检索和视觉理解研究。

该数据集可帮助开发更强大的基于图像的购物人工智能模型,或扩展零售商的产品图谱。伯克利分校电子工程与计算机科学教授表示:"计算机视觉是实证驱动的领域,其进展一直由数据集推动。在传统图像或视频收集中,我们对特定对象的信息了解甚少——通常只有一个类别标签,如'椅子'。而对于ABO中的对象,我们拥有属性、多视角图像和CAD模型。这使我们能够从图像中推断更多信息。预计这将推动计算机视觉多个领域的研究,特别是3D推理。"

数据集详情

名为Amazon Berkeley Objects(ABO)的数据集包含147,702种产品的图像,所有数据均标注有多语言标题、品牌、型号、年份、产品类型、尺寸和材料等元数据。具体包括:

  • 398,212张静态目录图像
  • 8,200组提供平面360°旋转的图像(每5°间隔拍摄,每个产品72个视角)
  • 7,900个完整3D产品模型,可沿任何轴旋转并在任何光照条件下的3D环境中渲染

数据集采用知识共享署名-非商业性4.0国际公共许可证(CC BY-NC 4.0),禁止商业使用但其他方面无限制。

数据规模与访问

整个数据集——包括静态图像、缩略图、360°旋转序列和3D模型——总大小近300GB。研究人员可通过数据集网站下载完整数据集,按产品名称或类型筛选浏览产品图像,或学习如何使用某机构云服务托管的版本而无需下载。

某中心高级应用科学家表示:"数据已成为人工智能和机器学习最重要的组成部分。在这个项目中,我们一直希望推动产品理解方面的重大创新,这些创新有可能惠及全球购物者。"

研究价值

该数据集特别适用于:

  • 产品信息管理系统开发
  • 视觉信息检索算法研究
  • 3D物体理解与重建
  • 计算机视觉模型训练与基准测试

数据集中的多视角图像和3D模型为研究人员提供了前所未有的丰富视觉信息,有望推动3D推理和物体理解领域的突破性进展。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 某中心与伯克利发布产品图像与元数据数据集
    • 数据集详情
    • 数据规模与访问
    • 研究价值
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档