首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

扎克伯格公开机器学习模型Segment Anything升级版

Meta 在去年震推出了机器学习模型 Segment Anything,能够自动识别和精准勾勒出图像中的任何对象。周一在 SIGGRAPH 大会上,Meta 首席执行官马克·扎克伯格首次公开了这款模型的升级版——Segment Anything 2(简称 SA2),标志着这一技术正式跨越至视频领域。

分割是一个技术术语,是指模型在审视图像时能够精准区分并标识出各个独立元素的能力,如“这是一只独立的狗,那是它身后的另一棵树”,而非混淆成“狗与树融为一体的奇异景象”。尽管这一技术概念已历经数十载的探索,但近年来,图像识别技术飞跃式进步,其中“分割一切”是向前迈出的重要一步。

SA2 的推出,是 Segment Anything 系列自然而然的延伸,它不仅局限于静态图像的识别,更将触角延伸至动态视频领域,实现了对视频内容的深度解析与即时分割。尽管理论上可以对视频的每一帧单独应用初代模型,但 SA2 的问世无疑为这一任务提供了更为高效、流畅的解决方案。

扎克伯格在与英伟达 CEO 黄仁勋的对话中提到:“科学家们现在可以利用 SA2 深入研究珊瑚礁、自然栖息地等复杂环境,而无需实地拍摄,这无疑为科研探索开辟了全新的途径。”

值得注意的是,处理视频数据对计算资源的需求远超静态图像,但 SA2 能够在不过度依赖大型数据中心资源的情况下高效运行。当然,它仍然是一个庞大的模型,需要强大的硬件才能运行,但即使在一年前,快速、灵活的分割也几乎是不可能的。

与首代模型一样,SA2 同样采取免费开放的策略。目前还没有关于托管版本的消息,Meta 贡献了一个包含 50,000 个视频的大型标注数据库,供全球开发者与研究人员使用。此外,据论文透露,另一份内部专用的、规模超过 100,000 视频的数据库也被用于 SA2 的训练过程中。

Meta 长久以来一直是“开放 AI”领域的倡导者与领导者,而近期 LLaMa、Segment Anything 系列模型及更多免费资源的推出,更是将 AI 技术的可及性提升到了新的高度,尽管围绕“开放性”的争议依然存在。

对此,扎克伯格坦言:“SA2 不仅仅是一个软件工具,它需要一个繁荣的生态系统来支撑其发展。我们选择开源,并非出于纯粹的利他主义,而是坚信这样做能够汇聚全球智慧,共同推动我们构建的产品达到前所未有的高度。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OaeJjHK8sp9JnGrkXQ0aXcVw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券