与设计 Chatbot 相比,语音助手的设计有哪些注意事项?
语音输入又有哪些优点和缺点?
点击下方视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!
图文版本送给不方便打开的朋友 (°u°)」
上一季中,我们介绍了设计开发 chatbot 的方法。
为chatbot加上语音识别、语音合成等模块,基本就是一个能听会说的语音小助手。
不过语音助手的设计上还是有不少独特的注意事项,比如形象设计。
听觉形象可以借由音色、节奏、音调、响度做出设计。沉稳缓慢的语调能表达出服务与尊敬,戏谑与快节奏适合聊八卦,软萌萌的声音适合和小朋友聊天。
比如唤醒。
实体按键可以唤醒,虚拟按键也可以唤醒,用得最多的还是通过「唤醒词」进行语音唤醒。唤醒词不能太常见,最好在 3-4 个字节左右,不然很容易「误触」。
再比如,区分用户。
如果是在多人家庭中存在的语音交互设备,最好能利用声纹识别认出不同的用户,并根据日常的聊天内容为他们设置标签。这样即使他们说出同一句话,也能了解语言背后的真实意图。
设计能听会说的小助手的过程,就是「语音交互设计」。
与文字输入相比,语音交互输入信息的优点在于速度快、能解放双手、没有学习成本。
但不免也有缺点。比如接受信息速率较低、无法保护隐私、也无法适应复杂的任务。
在各个API 开放平台,都有语音识别、语音唤醒、语音合成的接口可供调用。
感兴趣的话,不妨自己试试看吧!
「知智一分钟」是由「KnowingAI知智」推出的,以人工智能基础知识为主的短视频栏目。
每次一分钟,轻松了解 AI 领域基础概念!
「知智一分钟」现已入驻 B 站,
欢迎投硬币投香蕉发弹幕吐槽我们!
领取专属 10元无门槛券
私享最新 技术干货