首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【重磅】DeepMind发布最佳语音神经网络生成模型,与人类差距缩减50%以上

    【新智元导读】本文介绍的是WaveNet——一个原始音频波形深度模型。我们展示了,Wavenet能够生成模仿人类的语音,听起来要比现有最好的文本到语音转化系统更自然,将与人类表现的差距缩减了50%以上。 在我们的展示中,相同的网络能被用于合成其他的音频信号,比如,音乐。在这里,我们提供了一些样本——自动生成的钢琴曲。 会说话的机器 让人能与机器对话是人机交互长期以来的一个梦想。近年来,随着深度神经网络的应用(比如,谷歌的语音搜索),计算机理解自然语音的能力取得了革命性的进展。但是,用计算机生成语音仍然大量地

    05

    【刘挺】文本情感分析攻克机器人情商难题

    技术的创新在不断地“刷新”着传媒的体态,如何尽可能地做到对技术的日新月异“运筹帷幄”,让技术为“我们”所用,这个探讨,我们一直在进行中。在人工智能与传感技术正席卷几乎所有行业的当下,传媒业已然迎来挑战。机器人写作、无人机新闻打开“天眼”、传媒“算法”革命、微软“小冰”客服…… 在自然语言处理领域,文本情感分析将是攻克机器人理解文字语言情感的一项重要技术。借此新华网“感知未来——首届‘智能+’传媒超脑论坛”召开之际,新华网融媒体未来研究院特邀哈尔滨工业大学教授、社会计算与信息检索研究中心主任刘挺,与我们一起探

    010

    CNN 在语音识别中的应用

    本文介绍了语音识别技术中的端到端模型、基于CTC的序列模型、基于序列学习的注意力机制模型、基于3D卷积神经网络的语音识别系统等。其中,端到端模型可以直接从原始音频数据中学习到针对语音识别的抽象表示,具有较好的可扩展性和鲁棒性;而基于CTC的序列模型则通过连接主义学习的方法,将CTC定义的序列映射问题转化为神经网络中的参数优化问题,进一步提高了语音识别的准确率;基于序列学习的注意力机制模型则借鉴了语言学中的注意力机制,通过对输入序列进行加权处理,进一步提高了模型的识别准确率;基于3D卷积神经网络的语音识别系统则利用3D卷积核对输入序列进行卷积处理,提取出序列中的特征信息,进一步提高了模型的识别准确率。

    03
    领券