首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    程序员读书节重磅直播丨王泉:入门声纹技术之声纹分割聚类与其他应用

    声纹识别技术是声纹技术中最为核心的一项,和指纹识别、人脸识别一样,声纹识别也是生物特征识别技术的一种,该技术利用算法和神经网络模型,让机器能够从音频信号中识别出不同人说话的声音。 在10月19日的分享中,谷歌声纹识别与语言识别团队负责人王泉老师着重介绍了声纹识别技术以及相关的音频基础知识,并详细阐述深度学习时代最前沿的声纹识别模型,包括各种推理逻辑和损失函数的设计思路,以及数据处理方面的相关话题。 但是许多人误以为声纹技术等价于声纹识别,却不知道声纹技术还有着许多十分重要且有趣的其他应用。所以在「从算法到应

    01

    读书节公开课丨王泉:入门声纹技术之音频基础与声纹识别

    博文视点程序员读书节活动进行中,持续关注每日推送更多精彩活动享不停。 ◆ 广义上讲,所有可以区分每个人不同声音的特征,都可以称为「声纹」。由于这些特征的存在,声纹和指纹一样,衍生出各种实用的技术。 声纹技术中最为核心的一项便是声纹识别技术。和指纹识别、人脸识别一样,声纹识别也是生物特征识别技术的一种,该技术利用算法和神经网络模型,让机器能够从音频信号中识别出不同人说话的声音。除了声纹识别之外,声纹技术也被广泛用于声纹分割聚类, 以及构建更为强大的语音识别、语音合成以及人声分离系统。 为了帮助大家更好的了解声

    01

    入门声纹技术(二):声纹分割聚类与其他应用(附赠书)

    机动组声纹技术系列分享第2期 声纹识别技术是声纹技术中最为核心的一项,和指纹识别、人脸识别一样,声纹识别也是生物特征识别技术的一种,该技术利用算法和神经网络模型,让机器能够从音频信号中识别出不同人说话的声音。 在10月19日的分享中,谷歌声纹识别与语言识别团队负责人王泉老师着重介绍了声纹识别技术以及相关的音频基础知识,并详细阐述深度学习时代最前沿的声纹识别模型,包括各种推理逻辑和损失函数的设计思路,以及数据处理方面的相关话题。第一讲回顾:入门声纹技术(一):音频基础与声纹识别。 但是许多人误以为声纹技术等价

    02

    NLP入门+实战必读:一文教会你最常见的10种自然语言处理技术(附代码)

    大数据文摘作品 编译:糖竹子、吴双、钱天培 自然语言处理(NLP)是一种艺术与科学的结合,旨在从文本数据中提取信息。在它的帮助下,我们从文本中提炼出适用于计算机算法的信息。从自动翻译、文本分类到情绪分析,自然语言处理成为所有数据科学家的必备技能之一。 在这篇文章中,你将学习到最常见的10个NLP任务,以及相关资源和代码。 为什么要写这篇文章? 对于处理NLP问题,我也研究了一段时日。这期间我需要翻阅大量资料,通过研究报告,博客和同类NLP问题的赛事内容学习该领域的最新发展成果,并应对NLP处理时遇到的各类状

    02

    大数据时代,我们应该准备些什么?

    最近打车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用。 我相信现实生活中,这样忽视人工智能时代已悄然来临的人不是少数,而且还很多。 毕竟,从事数据行业的人连2%都不到,更别说真正理解数据的人了。 你也许会说,人工智能是那么高深的技术,我又不做相关的技术,了解那么多干什么。 其实,今天我们谈的不是什么复杂的人工智能高深技术,请注意文章前面的标题:时代。 是的,我们谈的是一个新时代下的个人选择问题。说的更本质一些,其实是在说,这样一个新时代(人工智能时代),人类的思维发生了怎样的改变?进而,我们思考这种思维改变会给个人未来的成长带来怎样巨大的改变和机会。 进一步,你最后会明白这几个问题的答案: 1)为什么中学老师在许多年之后总是感叹: 最终,真正有出息的,都是当年成绩一般般的... ... 2)从1984年洛杉矶奥运会开始,到尽头,国人关注奥运会已经32年了。当年的金牌得主们,除了李宁和郎平,剩下的谁记得呢? 3)为何以前起作用的死磕思维,在人工智能时代,不是最好的人生策略选择。而理解和解答所有的这些问题的前提是,你要真正明白什么才是人工智能时代的核心? 好了,废话不多说,我们先来看看在没有人工智能之前,人类的思维模式是怎样的? 1.单维度死磕思维 在这之前,计算机并不擅长于解决人类智能的问题,也就是我们现在所说的人工智能。 怎样才算人工智能呢? 真正科学定义这个概念的是电子计算机的奠基人 阿兰·图灵(Alan Turing)。

    02

    前沿人工智能技术,日益改变我们生活

    人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。那么人工智能,现在的那些技术是很前沿的呢? 人工智能 1,自然语言生成:利用计算机数据生成文本。目前应用于客户服务、报告生成以及总结商业智能洞察力。 2,语音识别:将人类语音转录和转换成对计算机应用软件来说有用的格式。目前应用于交互式语音应答系统和移动应用领域。 3,虚拟代理:弗雷斯特公司声称,“虚拟代理可谓是媒体界目前竞相

    010

    【OCR】CTC loss原理

    在图像文本识别、语言识别的应用中,所面临的一个问题是神经网络输出与ground truth的长度不一致,这样一来,loss就会很难计算,举个例子来讲,如果网络的输出是”-sst-aa-tt-e’', 而其ground truth为“state”,那么像之前经常用的损失函数如cross entropy便都不能使用了,因为这些损失函数都是在网络输出与ground truth的长度一致情况下使用的。除了长度不一致的情况之外,还有一个比较难的点在于有多种情况的输出都对应着ground truth,根据解码规则(相邻的重复字符合并,去掉blank), path1: “-ss-t-a-t-e-” 和path2: "–stt-a-tt-e"都可以解码成“state”,与ground truth对应, 也就是many-to-one。为了解决以上问题,CTC loss就产生啦~ 2 CTC loss原理

    02
    领券