首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

vivo发布全新AI战略,实现三大系统体验重构

10月10日,2024 vivo开发者大会在深圳国际会展中心举办。vivo正式发布全新AI战略——“蓝心智能”,以及全面升级的蓝心大模型矩阵、OriginOS 5、蓝河操作系统2(BlueOS 2)等系统和模型层面的进展。

蓝心智能指的是将大模型技术与手机操作系统深度融合的个人智能。vivo AI研究院院长周围解释,以蓝心大模型为技术底座,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务; 同时,蓝心智能将全方位守护用户的隐私安全; 通过系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。

为了达成这一点,vivo从三个方面用AI重构了系统体验。首先是重构人与设备的交互体验,让交互更自然更符合直觉。在蓝心大模型的加持下,手机将具备更强大的分析能力,无论是按压屏幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。而依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,让蓝心小V在文本能力外,进一步具备强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟人声甚至理解对话中的情绪。

第二个方面是重构人与数字世界的服务体验,让智能更加个人化,也就是构建简单高效的服务获取能力和主动服务能力,从而让手机成为智能温暖的个人助理。vivo依托蓝心大模型对手机的基础功能进行了全面升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo还构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。

第三个方面是重构人与物理世界的连接体验,让沟通更顺畅和温暖。去年,vivo读谱功能的发布,让喜爱音乐的视障人士可以利用手机学习乐谱和乐器。而今,vivo利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。vivo希望通过AI技术跨越沟通的鸿沟,帮助障碍人群去追逐梦想,去探索世界的美好。

会上,周围也展示了基于蓝心大模型技术打造的手机智能体。在演示中,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。这是手机自动化的一小步,却是解放用户双手的一大步。随着AI发展,未来PhoneGPT一定会带来更多的应用场景,更好的智能体验,让小V成为更懂你的私人助理。

而蓝心智能的能力底座是vivo自研的蓝心大模型矩阵。vivo今年全面升级语言大模型和端侧大模型能力,带来vivo自研的语音大模型、图像大模型以及多模态大模型。

在去年带来了的三款端侧大模型之后,vivo正式发布全新30亿参数量级的蓝心端侧大模型3B。在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型。相比蓝心7B,蓝心 3B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA,内存占用仅1.4GB。

除此之外,vivo还同步带来了可以准确理解自然语义,模拟人声的全新自研蓝心语音大模型、强化中国特色与东方美学的融合生成能力的蓝心图像大模型以及升级视觉感知理解能力的蓝心多模态大模型。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oi7Duavow2j6gHkbYZLLV2ow0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券