我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature
我有三种型号:
raw_couponcouponstore
如果我正在循环浏览raw_coupons,那么如何将其保存为优惠券,只有在该商店不存在相同的coupon_code时才能保存它?下面的代码可以更清楚地说明:
raw_coupon.each do |raw_coupon|
coupon = Coupon.new
coupon.store_id = raw_coupon.store_id
coupon.coupon_code = raw_coupon.coupon_code
coupon.save if [coupon_code for this store doesn
我可以在上看到Google上的操作确实支持SSML,但是我在我的代理中遇到了问题。
我正在使用带有PHP的DialogFlow。
为了测试它,我的webhook通过'speech‘参数提供了以下响应:
<speak>First sentence. <break time="1s"/> Second sentence. <prosody pitch="+5st">and now high pitched</prosody></speak>
通过谷歌助手在我的三星S8上测试,它是以男性声音读取的(这