10月10日,在2024 vivo开发者大会上,vivo正式发布全新AI战略——“蓝心智能”,同时带来全面升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)以及vivo在安全、人文、生态合作等方面的最新成果。
vivo高级副总裁、首席技术官施玉坚首先登台,重点回顾了vivo在过去一段时间内取得的成绩。他提到,在过去三年和今年前三季度,vivo始终稳居国产手机销量第一。不久前,vivo还空降凯度BrandZ最具价值中国品牌百强榜单,因在消费电子赛道的稳健表现,vivo同时荣获凯度BrandZ创新明星品牌奖。
vivo高级副总裁、首席技术官施玉坚现场演讲
vivo发布全新AI战略——蓝心智能
去年11月,蓝心大模型在SuperCLUE、CMMLU、C-EVAL等多个大模型榜单上,综合能力排名第一。截至今天,vivo的AI能力已覆盖全球60多个国家和地区,服务超过5亿手机用户,大模型token输出量超过了3万亿个。
而在此次大会上,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围正式发布了vivo的全新AI战略——蓝心智能。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
蓝心智能是将大模型技术与手机操作系统深度融合的个人智能。周围解释,以蓝心大模型为技术底座,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务; 同时,蓝心智能将全方位守护用户的隐私安全; 通过系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。
为了达成这一点,vivo从三个方面用AI重构了系统体验。首先是重构人与设备的交互体验,让交互更自然更符合直觉。在蓝心大模型的加持下,手机将具备更强大的分析能力,无论是按压屏幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。而依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,让蓝心小V在文本能力外,进一步具备强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟人声甚至理解对话中的情绪。
第二个方面是重构人与数字世界的服务体验,让智能更加个人化,也就是构建简单高效的服务获取能力和主动服务能力,从而让手机成为智能温暖的个人助理。vivo依托蓝心大模型对手机的基础功能进行了全面升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
vivo基于蓝心大模型技术做出的一次全新探索,即“PhoneGPT”也就是手机智能体。在演示中,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。这是手机自动化的一小步,却是解放用户双手的一大步。随着AI发展,未来PhoneGPT一定会带来更多的应用场景,更好的智能体验,让小V成为更懂你的私人助理。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
基于多模态大模型,vivo让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。vivo希望通过AI技术跨越沟通的鸿沟,帮助障碍人群去追逐梦想,去探索世界的美好。
全新蓝心大模型矩阵正式发布
在今年的开发者大会上,vivo发布了全新自研蓝心大模型矩阵。全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。这预示蓝心智能,向着个人化和多元化发展迈出重要的一步。
在语言大模型上,千亿级蓝心云端大模型,重点优化了意图理解与分发和任务规划能力。相比去年,整体能力提升30%,在SuperCLUE和C-EVAL榜单上继续领跑国内第一梯队。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
用户的隐私安全始终是vivo打造蓝心智能的首要原则,继去年带来了三款端侧大模型之后,vivo正式发布全新30亿参数量级的蓝心端侧大模型3B。在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型。相比蓝心7B,蓝心 3B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA,内存占用仅1.4GB。
除此之外,vivo还同步带来了可以准确理解自然语义,模拟人声的全新自研蓝心语音大模型、强化中国特色与东方美学的融合生成能力的蓝心图像大模型以及升级视觉感知理解能力的蓝心多模态大模型。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
原系统5(OriginOS 5)正式亮相:自然流畅超有AI
本次vivo延续“自然舒适、符合直觉”的设计理念,将自身在AI、续航、通信等领域的技术成果,以及对手机基础体验、设计、人文等层面的思考集中落地,推出新一代操作系统——原系统5(OriginOS 5)。
在原系统5中,作为AI重构系统体验的基础,蓝心小V与Jovi语音正式合并,带来了更加自然的语音交互体验。新增了长按屏幕底部,呼出“小V搜索”等一些列全新的交互方式。基于蓝心多模态大模型技术,vivo全新推出小V圈搜功能,在既有的文本搜索基础上,通过图像识别与圈选交互的结合,精准搜索对象,为用户带来更加便捷的“一圈即搜”。
原系统5还全新升级了“原子岛”功能,除通知功能外,其拥有蓝心小V强大的意图识别能力,不断分析和判断用户当前的需求,主动为用户提供后项服务。并且以更灵活的设计,一按一复制,或者一按一拖拽,满足用户的多任务需求。
除此之外,原系统5升级了以桌面组件的形式为你全天提供智慧服务的“小V建议”、支持同声传译的“小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”,通过蓝心智能为用户带来了触手可及的智慧体验。
流畅方面,原系统5构建了包括光影、交互、形态切换以及场景过渡在内的全方流畅体验,进行了超过1000项流畅体验优化,旨在将“自然舒适,符合直觉”的使用感受贯穿于系统的每一个场景。
在系统底层层面,原系统5的不公平调度机制再一次迎来了3.0版本的重大升级,首次引入GPU不公平调度机制、Ledger内存账本机制、内存账本等,之前倍受用户称赞的虚拟显卡升级到了性能更加强劲的2.0版本,集成了极速响应动效架构、合成渲染加速器、图形链路协同引擎三大核心技术,全面优化从触控到反馈界面的全链路体验。
在网络通信方面,原系统5在用户场景驱动下实现了全新技术突破和全面体验升级。基于蓝牙,实现了行业首创的公里级无网通信技术,在无网空旷环境下,支持最远超过1.5公里的点对点语音对讲和文字聊天。
蓝河内核加持,蓝河操作系统2:全栈自研,为AI而生
继去年11月vivo首次发布自研蓝河操作系统(BlueOS)之后,今年的开发者大会上,能力全新升级的蓝河操作系统2同步亮相,其搭载着基于Rust语言编写的实时操作系统内核——蓝河内核,其具备安全、通用、高性能的特性,能够兼容不同的嵌入式平台,具备完整的系统调度、内存管理、文件系统、网络和设备管理能力。而蓝河操作系统2也将成为行业首个全栈由Rust语言编写的操作系统。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
蓝河操作系统2构建了更加智慧的系统架构,首先最底层是由vivo自研的蓝心大模型,和VCAP推理计算加速平台共同构成的底座。蓝河从设计之初就整合了蓝心大模型矩阵,支持不同参数蓝心大模型的灵活端云部署,并且支持视觉、语音等多种AI算法。另外,VCAP保障了各种AI算法在端侧的高效运行。
以用户为中心 实现开放智联
现阶段,vivo智能车载已实现覆盖规模行业领先,连接超过170个汽车品牌,覆盖超过8500款车型。vivo以开放共赢的态度积极推动行业技术发展。 为实现智能车载、数字车钥匙技术升级,vivo牵头发起ICCOA联盟,推出的协议覆盖了市场上超过350W辆汽车。
在家居智能设备互联的场景中,vivo深度参与matter生态建设,适配可连接的品类在联盟中有超过1200多个SKU。同时,vivo还支持CCSA等权威协会,帮助制定了20余项IoT行业标准。
有AI无碍,以科技照亮美好未来
去年,vivo推出了首款集手语识别与合成于一体的软件“手语翻译官”,并在CCL2024手语数字人翻译质量评测中,获得了第一名的成绩。今年,为了协助国家通用手语的普及与推广,我们在“手语翻译官”中升级了“手语学习”功能,希望可以帮到更多的人学习手语。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
同时,基于蓝心语音大模型,“vivo听说”新增了方言自由说功能,目前支持6种方言,以解决各地区间的沟通障碍问题,也让用户可以以自己最熟悉的乡音与手机进行交互。而为了让更多人的乡音能被语音大模型识别,接下来,我们会把越来越多的语种适配进手机的各种功能中,让手机的语言交互更自然,更符合人的直觉,让人与人之间的的沟通更流畅,更温暖。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲
除“vivo听说”外,“vivo看见”同样得到了语音大模型加持,新增了实时问答功能,成为行业首款多模态大模型视觉辅助产品。基于多年的技术积累与行业实践,vivo为8月28日正式开馆的国家无障碍环境展示馆制作了行业首款视障用户导览软件。通过vivo手机产品和“vivo看见”的视觉辅助功能,为展馆提供助力。
携手全球开发者及合作伙伴共同绘制开放未来
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围表示,一花不是春,独木不成林。vivo始终秉持“协同发展,互信共赢”的合作理念,不断深化并整合底层核心技术,涵盖提升应用体验的度量系统能力、引领创新的AI和蓝河操作系统技术、开放智联的IoT技术等。
领取专属 10元无门槛券
私享最新 技术干货