首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Sensory&Philips-Enhance ASR with Speech Enhancement

    Sensory, a Silicon Valley company enhancing user experience and security for consumer electronics, announced today its collaboration with Philips, a provider of advanced speech enhancement technologies, to offer a combined technology suite. This would package Sensory’s best-in-class speech recognition technologies TrulyHandsfree™ and TrulyNatural™ with Philips BeClear Speech Enhancement™ algorithms, resulting in significant accuracy improvement in noisy environments. By processing an audio signal with Philips’ echo cancellation, noise suppression and/or beam-forming processors before passing it to Sensory’s speech recognition engine, much of the unwanted ambient noise in a signal can be filtered out, leaving the critical speech portion of the signal largely untouched. This process allows Sensory’s already noise robust speech recognizer to decipher near- and far-field speech more accurately in conditions where very high ambient noise is present.

    01

    揭秘语音到语音翻译黑科技,来挑战国际口语翻译大赛

    机器之心发布 字节跳动AI Lab机器翻译团队 作者:董倩倩 语言是人类社会最自然、最有效的交流方式之一,是人类文化融合和信息传播的主要工具。随着全球化与信息化时代的到来,国际间的交流以及信息传播呈现爆发式增长,让计算机理解不同语言并实现语言之间的自动翻译成为人类社会的迫切需求。 语音作为一种自然、便捷且传递信息丰富的语言承载形式,是人类与机器交互的理想方式。 道格拉斯・亚当斯在小说《银河系漫游指南》中提到过一种叫做巴别鱼的神奇生物:体型很小,靠接受脑电波为生。人们可以携带它,它从脑电波中吸收精神频率,转化

    02

    使用Python进行语音活动检测(VAD)

    现今,在线通讯软件对于高质量的语音传输要求日益提高,其中,有效识别和处理音频信号中的人声段落成为了一个不可忽视的挑战。语音活动检测(Voice Activity Detection,VAD)技术正是为此而生,它可以识别出人声活动并降低背景噪声,优化带宽利用率,提升语音识别的准确性。据报道,谷歌为 WebRTC 项目开发的 VAD 是目前最好的 VAD 之一,它快速、现代且免费(WebRTC,即Web Real-Time Communication,作为一种支持网页浏览器进行实时语音、视频通话和点对点分享的技术,内置了一套高效的VAD算法)。下文将详细介绍webrtcvad模块,并演示如何用Python搭建一个简单的人声语音活动检测系统。

    01
    领券