是否有可能获得用户使用alexa-sdk响应Alexa命令所需的时间?为了使它更直观,我试图测量以下内容:Alexa says: "Welcome to my app, say next to go to the next section"User says: "Next"
我在文档中找不到任何东西,我通常会尝试在做出响应之前和之后使用类似process.hrtim
我编写了一个脚本来使用Speech to text API。它可以很好地处理一个音频(它是一个转换为wav的m4a ),但对于另一个类似的音频(同源,m4a转换为wav),它会失败很多(遗漏了大部分文本)。这两个音频听起来很相似(至少对我来说是这样),但结果却大相径庭。我已经设置了元数据和配置,我不知道还可以尝试什么来改善结果。 相关参数: metadata = { "original_mi