我喜欢在散步或开车的时候听播客风格的音频,我也喜欢借助Mac OS Yosemite的文本到语音转换功能来学习。我想下载长达一小时的音频文件,以便在车里听(我已经足够习惯于有时听起来像机器人的tts声音)。
如何将文本到语音转换下载到音频文件,如mp3?我可以“按键时说出选定的文本”,然后按option+esc键,但下载音频不是很容易吗(不做录制tts音频播放等繁琐的事情)?
我想要静音音频文件中的特定单词。我有一个应该静音的单词列表。我曾尝试使用此代码将音频文件转换为文本,但我如何才能获得每个单词的时间帧,以便我可以将它们静音?audio)
audio_file = r.record(source) # using googlespeech recognition
text
在我的webapp中,我尝试调用make a HTTP request到一个Google API,它接受一些文本(比如"Hello World"),并返回一个与语音等效的MP3文件。还有许多其他页面看起来已经过时了--看起来这个功能已经被google删除了,或者正在接受不同的rest调用?我没有看到任何关于如何调用Google API for TTS的文档(比如在google Translate api 中)。我有一个谷歌云API帐
我正在尝试使用google could APIs转换语音到文本,像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US,这段代码,我能够转换完美,文本是基于音频的US,口音或UK。如何通过google could API转换这个印度口音,我需要做哪些改变。谢谢
桑迪普。