3月15日,“2024中国人工智能多模态大模型企业综合竞争力20强研究报告”(简称“AI多模态大模型企业20强”)正式发布。
三六零(下称“360”)人工智能通用大模型“360智脑”入选,并作为安防领域多模态大模型应用标杆案例被重点引入。
据了解,360集团是国内较早布局多模态技术的大模型厂商,2023年6月360召开智脑发布会,国内首发“文生视频”多模态功能。
研报显示,自OpenAI对外发布文生视频大模型Sora以来,多模态大模型作为人工智能的核心组成部分,以其强大的学习能力和巨大的应用潜力,正在重塑千行百业。
研报综合考虑企业经济抗衡力、行业影响力、技术竞争力、商业角逐力4个一级指标,营收规模、数据优势、模型规模、算力能级等15个二级指标,最终形成了企业在人工智能多模态大模型领域的竞争力综合评价指标体系。
机构研究发现,从多模态大模型的应用场景来看,相较语言大模型赋能行业,多模态大模型更加偏重落地场景,商业变现路径更加清晰。在“明星案例”部分,360智脑-视觉大模型作为安防领域多模态大模型应用案例被重点引入。
研报调查显示,自2023年5月31日360发布360智脑-视觉大模型后,经过5个月的内测,已经在连锁巡店、公共场所安全巡检、物业管理、4S店库存车管理等多个场景应用落地,并于去年10月上线开放公测。基于360的AI智能摄像机和简单易用的视觉云SaaS平台,已经为超过5万家企业提供数字化解决方案。
据了解,360智脑-视觉大模型基于360搜索超10亿组互联网图文对进行清洗训练,融合了千亿参数的360智脑大语言模型进行训练。为进一步提高模型训练精度,在一期就结合360安防的百万级安防行业精标数据进行对齐微调。
现阶段,360智脑-视觉大模型主要聚焦开放世界目标检测(OVD)、图像内容描述、视觉问答(VQA)三项能力。其中,开放世界目标检测是通过学习互联网上海量的图文数据,让模型能够融会贯通地泛化到未预定义的目标类别。
领取专属 10元无门槛券
私享最新 技术干货