今
日
鸡
汤
机不可失,时不再来。
大家好,我是Python进阶者。
前几天在Python白银交流群【云何应住】问了一个Python处理语音消息识别的实战问题。问题如下:
import speech_recognition as sr #导包
r = sr.Recognizer()
mic = sr.Microphone()
with mic as source:
r.adjust_for_ambient_noise(source)
audio = r.listen(source)
print(r.recognize_google(audio, language='zh-CN')) #language='zh-CN'识别成中文 这段代码是语音识别的功能,用的是speechRecognition库,我运行报错,麻烦知道的朋友给处理一下,报错截图如下
这里【啥也不懂】给了一个指导:
这个问题其实已经很明显了,需要魔法才行。
可以看到加了魔法,就可以顺利解决了。当然了,也有一些其他的库,如pyaudio、whisper等等,部署起来可能会麻烦一些。
后面了解到他是要给客户做个离线的产品,这里【瑜亮老师】和他交流了一些想法,受益颇丰。
甚至你可以给客户说,离线版的本身就有语音识别率的问题,会有一些识别错误。在线版的会识别率更高,看看客户是否愿意更改为联网版。先给客户一个心理暗示,让他有个准备。本身中文就有一音多字的情况,语音转文字肯定会有一些困难的。
你得让客户先有个心理准备,让他知道语音转文字会有一定的错误率,而原因就是中文的一音多字。这样客户才不会对你“精益求精”的提出很多“合理建议”(无理需求)
顺利地解决了粉丝的问题。
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!