我正在考虑移植一个语音2D HTML5网络游戏,我已经为iPhone和安卓构建了一个Unity2D。我是一个完整的web开发人员,而不是一个,所以一个代理机构会帮助我构建这个统一应用程序。在与他们签约之前,我需要确保Speech to Text (STT)和Text to Speech (TTS)服务都能为、和English提供,否则我会先浪费很多钱。
对于Web,Webkit语音(、、、)可以通过浏览器轻松访问。我发现IBM有一个API可用,并且有和的演示程序,我发现他们这里有一个,但是我没有测试Unity的技能集。
我正在寻找关于优秀的STT和TTS API的指导,该机构可以使用这三种外语
我已经做了一个使用谷歌语音到文本api的语音到文本的工作程序,它记录语音并将其复制到.txt中。然而,谷歌语音api不会听很长时间(大约9秒),有没有办法增加这一点,或者有一个更好的应用编程接口在python中使用,可以边听边写? import time
import speech_recognition as sr
import sys
import fileinput
r=sr.Recognizer()
#tells the program to use a mic and to listen
with sr.Microphone() as source:
audio=r.lis