首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >微软研发语音驱动,或将打开VR游戏新方向

微软研发语音驱动,或将打开VR游戏新方向

作者头像
VRPinea
发布于 2018-05-15 02:22:20
发布于 2018-05-15 02:22:20
1.1K0
举报
文章被收录于专栏:VRPineaVRPinea

今日,微软宣布自定义语音服务成为加入微软识别服务行列的最新程序。自定义语音服务是一款可以高度灵活地把语音转换成文字的程序,它可以被认为是更智能版的Siri或Google Assistant。

自定义语音服务结合了两种尖端技术来实现。第一个技术被称为CRIS,即自定义识别智能服务。微软称,该服务为公司提供了部署定制的语音识别的能力。

开发者可以通过上传音频文件样本,将识别器根据特定环境进行自定义。在不同的环境下,比如工厂或户外,这可以使用户获得更好的识别。这意味着CRIS能够使给定组织通过构建自己独特的词汇语音指令来进行语音命令。

与CRIS一同加入微软识别服务行列的是LUIS(语言理解智能服务)。LUIS被微软描述为一个“目的引擎”,它能够帮助计算机理解用户言语背后的意义。比如,发生在当前的语音指令可能是一个特定的词或短语,但计算机需要由程序员映射到一个给定的行动。

“找到咖啡”或“给我咖啡”都将打开你的地图应用程序并直接指向附近的咖啡店。开启LUIS,你可以使用“找到咖啡”、“带我去喝咖啡”、“我需要咖啡”、“我需要提神”、“我不能让我的眼睛睁开”等多种说法来找到一个咖啡店。

LUIS被用来了解用户的目的是什么,而不仅仅是用户说了什么。有了它的帮助,程序员可以花费更少的力气,来处理更多的可以被用户使用的语音指令。

自定义语音服务虽是一种服务,但微软自身并不一定会围绕这个服务构建产品。这种工作将由类似Human Interact这样的VR内容工作室完成。

Human Interact的最新上市项目Starship Commander,是一款充分利用微软新技术,从而用声音操控进行体验的VR游戏。该款游戏将带来目前在沉浸式应用程序中,最为复杂的语音交互引擎。

Starship Commander比拥有立体声的游戏更加重视交互性。用户将扮演一艘星际飞船的飞行员,其任务则由一台超级计算机和全息上司下发。你可以同这两个角色对话,并通过不同的语音指令的分支选项来探索世界。

CRIS在Starship Commander的应用

Starship Commander是通过CRIS 和LUIS构建的。因此,游戏中的人物都能够理解和应对关于飞船和外星人的特定词汇。即使用户没有给出准确的措辞,LUIS也能够正确地理解并映射到一个给定的结果。“让我们继续”、“继续推动故事发展”,你可以通过不同的说法推动游戏进行。尽管特定组合的单词没有连接到特定的命令,但使用了微软新技术的引擎能够根据用户的目的映射出结果。

用声音控制的VR游戏无疑会带来更好的沉浸感,你可以与虚拟人物进行更多交流。游戏角色的好感度系统也可以进一步拓展,以带给玩家更真实的游戏体验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 VRPinea 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
语音控制化繁为简,让你在VR中的交互方式更自然
带上VR头显,转动头部寻找有效的文字信息,再控制手柄一一删选,确认最终选项,这是现阶段VR中最常见的一种交互方式,但操作复杂,且不方便,并不符合VR所想带给玩家的那种自然感与沉浸感。在VR交互方面,目
VRPinea
2018/05/16
2.1K0
数字未来设计趋势|交互篇
回顾互联网发展历程,从桌面端拨号上网到高速5G的移动互联网,随时随地互联互通对现实生活的影响力也逐步提升,虚拟与现实的距离也逐渐缩小。未来数字世界在沉浸感、参与度、永续性等方面对体验提出了更高的要求。
晓吾
2022/04/28
7890
数字未来设计趋势|交互篇
2021-2022 设计趋势ISUX报告·数字未来篇
背景 回顾互联网发展历程,从桌面端拨号上网到高速5G的移动互联网,随时随地互联互通对现实生活的影响力也逐步提升,虚拟与现实的距离也逐渐缩小。未来数字世界在沉浸感、参与度、永续性等方面对体验提出了更高的要求。本文将从虚拟世界的视角,对设计挑战和机遇进行总结和预测。 电影《头号玩家》里的“绿洲”描绘了一个庞大的虚拟数字世界,在这里人们用数字化身来控制、并相互竞争以提高自己的地位,这被视为未来虚拟世界该有的样子。不过目前落地概念是由Roblox在招股书里描述的8个关键词:身份,朋友,沉浸感,多样性,低延迟,
腾讯ISUX
2022/03/29
8750
被全球大作信赖的语音服务GME,助力出海游戏粘住全球玩家
游戏内置语音,已经成为游戏不可或缺的功能之一。玩家通过游戏内置语音与队员/好友沟通,加强团队操作协同,大幅提升沉浸式游戏体验、对战质量、玩家粘性、游戏社交性。因此,在游戏出海发行的趋势下,选择一款全球服务的游戏语音互动服务提供方至关重要,从而保障游戏玩家在世界各地都能拥有极致流畅的游戏语音体验。 服务好游戏的全球语音互动场景,有以下 5 大挑战:全球顺畅通信有挑战、海外布点服务器成本高、海外玩家机型众多、海外合规政策复杂、海外玩家语种多沟通难。「腾讯游戏多媒体引擎 GME」助力游戏开发者轻松搭建全球语音互动
腾讯游戏多媒体引擎GME
2022/08/16
1.3K0
被全球大作信赖的语音服务GME,助力出海游戏粘住全球玩家
Web与人工智能时代
摘要 “人工智能”一词最初是在1956年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能(Artificial Intelligence)英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技
IT大咖说
2018/04/03
1.7K0
Web与人工智能时代
【AGI-Eval行业动态】OpenAI 语音模型三连发,AI 语音进入“声优”时代
美东时间 3 月 20 日,OpenAI 发布了三款全新语音模型,分别是自动语音识别模型(ASR) GPT - 4o Transcribe 和 GPT - 4o Mini Transcribe,以及语音合成模型(TTS) GPT - 4o Mini TTS。
AGI-Eval评测社区
2025/04/08
3770
【AGI-Eval行业动态】OpenAI 语音模型三连发,AI 语音进入“声优”时代
被全球大作信赖的语音服务GME,助力出海游戏粘住全球玩家
游戏内置语音,已经成为游戏不可或缺的功能之一。玩家通过游戏内置语音与队员/好友沟通,能够加强团队操作协同,大幅提升沉浸式游戏体验、对战质量,增强游戏粘性及社交性。因此,在游戏出海发行的趋势下,选择一款全球服务的优质游戏语音互动服务提供方,保障游戏玩家在世界各地都能拥有极致流畅的游戏语音体验至关重要。
腾讯云音视频
2023/08/11
4300
被全球大作信赖的语音服务GME,助力出海游戏粘住全球玩家
微软和谷歌:宿命对手的 AI 竞赛
微软和谷歌都相信,未来将是人工智能的世界。这两家公司有不同的传统,也有差异化的竞争优势。而新一轮的人工智能产业竞赛,有一个显著的特点是各公司不再在同一个切入口角逐,而是基于自身在此前的发展中积累的优势,选择一个入口进军人工智能行业。那么微软和谷歌,它们到底打算怎么做? 未来,机器人就是应用程序,人工智能将会进入我们的生活,微软现任CEO萨蒂亚·纳德拉在今年的微软Build世界开发者大会上说。 这不由得让人想到微软对家用电脑的颠覆。微软在20世纪80年代凭借MS-DOS在家用电脑操作系统上崭露头角,成
新智元
2018/03/15
9490
微软和谷歌:宿命对手的 AI 竞赛
微软亚洲研究院副院长周明:微软的 NLP 帝国
【新智元导读】 微软几乎所有和 AI 相关的重要产品,背后都体现了 NLP 技术的重要性,这也是微软亚洲研究院深耕已久的领域。微软亚洲研究院副院长、ACL主席周明博士以《自然语言处理前沿技术》为主题,分享了微软对包括神经网络翻译、聊天机器人、阅读理解等板块在内的 NLP 领域的思考,并接受了新智元等媒体的采访。周博士指出,“语言智能是人工智能皇冠上的明珠”,他认为目前 NLP 技术的发展呈现出六大趋势,同时为大家阐述了未来的 NLP 技术的六大研究方向。 自然语言处理对于微软有多重要? 微软几乎所有和 AI
新智元
2018/03/28
1.3K0
微软亚洲研究院副院长周明:微软的 NLP 帝国
2025语聊系统源码开发深度解析:WebRTC与AI降噪技术如何重塑语音社交体验
随着 5G 技术普及和 Z 世代社交需求升级,语音语聊系统源码 已从早期的简单语音群聊进化为融合实时互动、场景化服务的综合性平台。根据行业数据,2024 年国内语聊赛道同比增长 21%,海外市场如中东、东南亚等地的语音社交用户规模持续扩大。在技术实现层面,语音语聊系统开发需重点关注以下核心方向:
山东布谷科技_孙哥
2025/05/23
1560
2025语聊系统源码开发深度解析:WebRTC与AI降噪技术如何重塑语音社交体验
微软首位华人“全球技术院士”黄学东:10个神经网络造就工程奇迹
【新智元导读】微软语音识别技术24年老将黄学东近日被评为“微软全球技术院士”,成功摘下这一微软技术的“桂冠”。 黄学东于1993年加入微软。1995年,黄学东最终把洪小文也拉入微软。黄学东还曾在Bing工作,一直跟随沈向洋博士。接受新智元的专访时,他谈到了去年微软对话语音识别词错率低至5.9%背后的故事。 同时,黄学东认为语音识别的下一个大难关是语义理解,目前看来最有希望的路线是 LSTM + Attention。 黄学东,微软语音识别技术 24 年老将,IEEE/ACM 双科院士,微软深度学习工具包CNT
新智元
2018/03/27
1.4K0
微软首位华人“全球技术院士”黄学东:10个神经网络造就工程奇迹
针对VR系统的虚拟环境操纵攻击
虚拟现实 (VR) 已进入人们的生活。 虽然围绕 VR 和特别是沉浸式 VR 的兴奋不断增加,但必须关注这些平台的安全性。 虽然对于安全研究人员来说,沉浸式 VR 需要安全是显而易见的,但在探索沉浸式对人的影响时,先前的工作并没有以系统的方式对其进行检查。 本文工作不仅创造和假设潜在的 VR 攻击,而且还实施它们。 此外,通过一项人类参与者欺骗研究说明,确实能够在物理空间中将 VR 用户移动到攻击者喜欢的位置,而无需他们的知识或同意。 希望这项工作能促进该领域未来的研究,尤其是因为沉浸式 VR 对其用户具有心理和生理影响。
CDra90n
2023/06/28
5050
针对VR系统的虚拟环境操纵攻击
让 Agent 具备语音交互能力:技术突破与应用前景(16/30)
在当今数字化时代,人机交互方式正经历着深刻的变革。从早期的命令行界面到图形用户界面,再到如今日益普及的语音交互,人们对于与机器沟通的便捷性和自然性有了更高的追求。Agent 作为一种能够自主执行任务、与环境进行交互的智能实体,赋予其语音交互能力具有重要的现实意义和广阔的应用前景。这不仅可以提升用户体验,使人们能够更加自然、流畅地与 Agent 进行沟通,还能拓展 Agent 的应用场景,如智能家居、智能客服、智能车载系统等领域,让智能服务更加贴近人们的生活和工作。
正在走向自律
2025/01/02
5010
让 Agent 具备语音交互能力:技术突破与应用前景(16/30)
纷纷入局VR/AR的国内外零售巨头们,今年还好吗?
7月中旬,小编着重为大家介绍了零售巨头亚马逊在VR/AR方面的部分动作。例如,在印度开设11家VR快闪店,试水未来全新购物体验;在圣地亚哥国际动漫展上搭建5574平方米的场地,推出史上最大规模VR体验;以及其就VR+新零售的相关布局。
VRPinea
2018/09/28
6760
未来5-10年,NLP将走向成熟
近日,微软亚洲研究院(MSRA)副院长周明在「自然语言处理前沿技术分享会」上,与大家讲解了自然语言处理(NLP)的最新进展,以及未来的研究方向,以下内容由CSDN记者根据周明博士的演讲内容编写,略有删减。 周明博士于1999年加入微软亚洲研究院,不久开始负责自然语言研究组。近年来,周明博士领导研究团队与微软产品组合作开发了微软小冰(中国)、Rinna(日本)、Zo(美国)等聊天机器人系统。周明博士发表了120余篇重要会议和期刊论文(包括50篇以上的ACL文章),拥有国际发明专利40余项。 MSRA在机器翻
CSDN技术头条
2018/02/12
1.1K0
未来5-10年,NLP将走向成熟
微软语音AI技术与微软听听文档小程序实践 | AI ProCon 2019
【导语】9 月 7 日,在CSDN主办的「AI ProCon 2019」上,微软(亚洲)互联网工程院人工智能语音团队首席研发总监赵晟、微软(亚洲)互联网工程院 Office 365资深产品经理,Office 小程序负责人张鹏共同发表《微软语音AI与微软听听小程序实践》的主题演讲,分享微软人工智能语音的技术以及微软听听小程序的落地实践。
AI科技大本营
2019/10/08
2K0
微软语音AI技术与微软听听文档小程序实践 | AI ProCon 2019
在库克的带领之下,苹果为VR/AR领域打了一剂强心针
WWDC 2017于今日凌晨1时(北京时间)在美国加州圣何塞麦克恩利会议中心举行。在本届WWDC上,苹果一口气公布了许多新内容,除了系统软件方面的更新与升级,在硬件方面也推出了多款新品,如iPad、i
VRPinea
2018/05/16
8790
投融资汇总 | 本周(10.29-11.04)旷视科技创下AI融资金额新纪录
AI创企融资金额再创新高,3R(VR、AR、MR)融资事件比之上周有所增加。 本周硬科技领域投融资事件共36起,其中人工智能领域占比最多,共有23起融资事件;3R(VR/AR/MR)发生5起融资事件,新能源发生2起融资事件和1起收购事件,物联网有2起融资事件,而未来医疗、新材料、基因工程则分别有1起融资事件。 在本周人工智能领域的投融资事件中,最引人注意的是旷视科技获得了4.6亿美元的C轮融资,创下了AI创企融资额度的最新记录。与此同时,据相关知情人透露,依图科技也获得了新一轮融资,不过,因为这一消息还未得
镁客网
2018/05/30
6090
Gamescom 2018|德国科隆游戏展首日,NVIDIA等大厂VR/AR动态频发
硬件厂商NVIDIA、戴尔、Psychsoftpc,以及游戏厂商暴雪、Wargaming、索尼、网易等,均带来VR/AR相关新品/游戏体验。
VRPinea
2018/09/28
7440
Google VS 亚马逊 VS 微软,机器学习服务选谁好?
译者 | reason_W 编辑 | Just 对大多数企业来说,机器学习听起来就像航天技术一样,属于花费不菲又“高大上”的技术。如果你是想构建一个 Netflix 这种规模的推荐系统,机器学习确实是这样的。(注:Netflix是美国流媒体巨头、世界最大的收费视频网站,曾于 2017 年买下《白夜追凶》全球播放权。)但受万物皆服务(everything-as-a-service)这一趋势的影响,机器学习这一复杂的领域也正在变得越来越接地气。所以现在哪怕你只是一个数据科学领域的新手,并且只想实现一些很容易
AI科技大本营
2018/04/26
2.1K0
Google VS 亚马逊 VS 微软,机器学习服务选谁好?
推荐阅读
相关推荐
语音控制化繁为简,让你在VR中的交互方式更自然
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档