7月12-14日,由中国计算机协会 CCF 主办、雷锋网和中国香港中文大学(深圳)承办的 CCF-GAIR 2019 全球人工智能与机器人峰会(以下简称CCF-GAIR2019)在深圳盛大开幕。思必驰CTO周伟达出席大会,从智能语音在5G时代下的IOT应用与挑战交流分享。
IOT和5G的相爱相杀
2019年是5G预商用的一年,人们开始对未来生活的各式各样的幻想,IOT会因为5G从万物互联变成万物智联——AIOT全场景无线物联。
人们可以通过车设备控制家电,
在户外运动时打开家中的门窗;
也可以躺在床上了解汽车的燃油余量
……
当全世界都沉浸在科技革命带来的兴奋之时,技术出身的周伟达进行了理性的思考。
图:思必驰CTO周伟达
在CCF-GAIR 2019【5G+AIoT专场】论坛中,他表示,语音交互技术在IOT方向的应用仍旧面临诸多挑战,例如,降低运转功耗、克服远场&高噪环境、全场景多设备的智能交互。随后,周伟达介绍了思必驰的语音交互技术方案,迎击挑战。
图:语音交互技术在IOT方向的应用与挑战
5G时代不仅仅只是简单的运速升级,更承载了丰富内容和更多的可能,对智能移动设备而言,纷繁多样的新功能更意味着对蓄电能力和功耗带来的挑战。尤其对加持了语音交互功能的设备而言,剩下能真正留给语音采集、唤醒、识别以及声纹等语音算法的功耗空间非常之少。
针对IOT低功耗的强需求,思必驰推出“算法+芯片”的解决方案。
在算法层面,通过模拟硬件VAD与数字VAD+Buffer算法,在兼顾性能的同时寻找到低功耗的平衡点,安静环境下设备将处于微功耗的待机状态,对信号采集与识别进行降频与降级处理。当设备检测到目标人声的命令,才会逐级信号处理和唤醒。此外,通过加强本地识别算法,提高响应速度,减少功耗。
第三方通用芯片产品研发与AI市场需求、AI算法、AI数据不能形成闭环,专用芯片的研发与应用将大大提升产品功效。对此,思必驰携手深聪自研 AI语音专用芯片,通过低功耗IP模块、低功耗芯片工艺、分级与复用等技术,将算法+芯片深度融合,取代通用芯片+通用算法的解决方案,打造可编程、定制化专用型 AI 深度学习架构。
对语音交互类产品而言,应对远场&高噪环境可谓是家常便饭。
周伟达提到,今后每个人可能会需要操控多种多样的智能产品,Anyone需要Anytime在Anywhere操控Anything。
思必驰在打造了智能电视、智能冰箱、智能音箱、智能空调等诸多IOT产品同时,积累了丰富的市场经验,推出众多解决策略。例如,多麦克风阵列方案(双麦、线性/环形四麦、线性/环形六麦)能够实现精准的声源定位,线性麦克风阵列可实现180°范围拾音,环形麦克风阵列可实现360°全范围拾音。同时,产品间亦可组成无规则麦克风阵列,协同工作。
同时,软件算法降噪让语音交互精准度事半功倍。思必驰-上海交大实验室研发的VDCNN算法大大降低环境噪声影响,降低词错率;借助生物特征检测算法的骨传导及空气传导技术进行相互补充得到纯净声音。同时,针对自噪声大的产品,深度优化回声消除算法有效抵消设备自身噪声。
全双工系统的智能响应、智能打断、智能纠错、抗干扰的优势增强设备识别精准度。未来,借助多模态交互方式,智能产品在远场&高噪环境下的应用将更加得心应手。
全屋互联,全场景的智能交互将是智能设备未来的必然走向。
思必驰推出了多设备联动机制,通过正面唤醒、就近唤醒、多模态直视唤醒,以及根据用户语义分析用户意图,以唤醒相应设备。同时,通过高可用定制的DUI开放平台,以及海量内容资源& AI技能,满足用户在多场景下的多样化需求。借助与众多合作伙伴打通智能家居平台,实现全场景下的互联互通
写在最后
不可否认,5G或许拥有创造一个新时代的本领,其与IOT的结合既为大众带来利好,更为科技带来机遇,与之相伴,挑战不可避免,快速响应市场需求和用户需求,嗅觉敏锐才能让我们更好的把握风向。
领取专属 10元无门槛券
私享最新 技术干货