我正在尝试在OpenTok会话中实时转录音频。OpenTok应用编程接口似乎没有该功能。有没有办法以某种形式捕获数据,并将其推送到另一个脚本/工具中进行转录?
问题不在于转录,而在于访问实时音频流数据并实时使用它。
发布于 2020-09-15 20:51:40
您可以在client SDK中通过https://tokbox.com/developer/sdks/js/reference/OT.html#getUserMedia访问音视频流(MediaStream)。
您可以使用WebAudio规范提供的接口对音频进行操作。
从音频MediaStreamTrack对象发布音频。例如,您可以使用AudioContext对象和Web audio API动态生成音频。然后,可以调用createMediaStreamDestination().stream.getAudioTracks()on AudioContext对象来获取音频MediaStreamTrack对象,以用作传递给OT.initPublisher()方法的optionsobject的audioSource属性。有关基本示例,请参阅GitHub上的立体音频示例OpenTok-web-samples存储库。
上面这个GitHub示例是关于注入音频流的。但是,您也可以在注入音频之前提取/捕获音频。请在此处查看详细信息...https://developer.mozilla.org/en-US/docs/Web/API/Web_Audio_API。
https://stackoverflow.com/questions/63887997
复制相似问题