我一直在研究的发行说明和特性,因为我想在我的项目中也加入手势识别。
在上面的页面中,第一行提到“Kinect for Windows SDK使开发人员能够创建支持手势和语音识别的应用程序”。SDK提供语音识别API,可以轻松使用。但是,我不认为SDK中有任何手势识别API可用。Skeleton Tracking的API很容易使用,但随后必须对它们进行定制,以获得手势识别。
我看过Windows Media Center的视频,这些视频可以通过手势等控制,也可以通过其他应用程序控制。我想知道是否所有这些应用程序都是定制的,并且必须编写自己的手势识别代码。
目前,在我的项目中,我使用的是Codep
我需要一个自动语音转录工具,我的视频编辑项目。我正在使用python语音识别库。为了将大音频文件拆分为小部分,我安装了pydub,并在脚本中添加了它的功能。虽然我检查并解决了ffmpeg的env路径问题,但仍然给出了以下错误:
Traceback (most recent call last):
File "..\VideoEditing\speech_transcript.py", line 4, in <module>
from pydub import AudioSegment
ModuleNotFoundError: No module name
我试图使用语音识别为我的深度学习聊天机器人,以获得输入的用户。实际上,我的语音识别功能代码是:
def get_audio():
r = sr.Recognizer()
with sr.Microphone() as source:
r.pause_threshold = 1
r.adjust_for_ambient_noise(source, duration=1)
audio = r.listen(source)
said = ""
try:
prin