Loading [MathJax]/jax/output/CommonHTML/jax.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >“工业听诊”中多声源事件检测与定位

“工业听诊”中多声源事件检测与定位

作者头像
用户7699929
发布于 2020-08-27 07:01:03
发布于 2020-08-27 07:01:03
1.8K00
代码可运行
举报
文章被收录于专栏:一刻AI一刻AI
运行总次数:0
代码可运行

众所周知,基于领先的声音事件定位和检测技术,可以研发“声学照相机”和“工业听诊器”等产品,并在电力、水利、轨道交通、汽车制造等行业领域发挥效用,保证工作人员的安全以及节省成本。声学照相机可以利用高精度麦克风阵列技术定位声源位置,再配合摄像头,实现可以直接在设备上看到声源位置,方便工作人员的日常设备检修。利用声音定位和检测技术,可以设计工业质检系统实现实时检测设备声音,避免设备故障导致生产中断,还可通过声音监测产品质量,避免不良品流向市场。

多声源检测与定位系统(sound event detection and localization,SEDL)的目标是输出声音的标签和声音方位信息(仰角和方位角)。

一、数据库

数据库的形成是在不同的室内环境(2019年5个,2020年15个)通过球型Eigenmike麦克风阵列采集真实位置的脉冲响应(impulse responses ,IRs),与真实的声音事件进行卷积,获得某个位置的声音信号。

球型Eigenmike麦克风

当声源位置距离1m时,方位角范围[180° , 180°]每隔10°,仰角范围[40° , 40°]每隔10°,会产生324个方位的IRs;当声源位置距离2m时,方位角范围[180°,180°],每隔10°,仰角范围[20°,20°],每隔10°,会产生180个方位的IRs,由方位角-仰角-距离组成的IRs总共会有504个。利用采集的IRs与合成声音数据库,其中包含400个采样频率为48000Hz的一分钟的声音,为了创造真实的声学环境,在采集的IRs中添加30dB自然噪声。

以DCASE2019 Task3数据库为例,与DCASE2020 Task3格式有所不同

训练及测试文件命名格式为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
split[number]_ir[locationnumber]_ov[number of overlapping sound events]_[recording number per split].wav

评估数据集由100个录音组成,不包含任何位置信息,也不包含以下命名约定中重叠声音事件的数量:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 split[number]_[recordingnumber per split].wav

两年中数据集中声音类别分别为:

数据集链接:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
2020年:
https://zenodo.org/record/3870859
2019年:
https://zenodo.org/record/2599196#.Xy-3-DW-uUk
https://zenodo.org/record/3377088

二、输入特征

1. Log-Mel

语音识别中常用到频域特征梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,MFCC)特征,基于对人耳听觉研究发现,人耳对不同频率信号敏感度不同,在1000Hz以下,与频率成线性关系;反之,与频率成对数关系。因此,引入Mel频率,Mel频率与实际的频率关系。

提取过程:

2. 广义互相关(GCC-Phat)

由于麦克风阵列中阵元距离声源的间距不等,当声波传递到阵元时,会在其之间产生延时差值,时间差结合阵元结构的几何关系,可以估计出声源的方位信息。

噪声、混响对相同位置同一声源产生广义互相关函数特征的谱峰相似,鲁棒性能较好。利用深度学习或者机器学习的方法,不直接计算其峰值,减少噪声和混响对其产生的干扰。选择其作为声源信号方位的估计特征。

3. 声强矢量(Intensity vector)

瞬时声强矢量:

声强矢量中包含声波能量方位信息,其反方向可以理解为其方位信息。

三、网络结构

模型选择CRNN [1]:

四、网络结构

利用单独的指标对声音事件检测与声音方位估计进行评价。对于声音事件检测的评价标准错误率(Error Rate, ER)和F分数(F-score),对于声音事件检测一般是基于1s的声音片段,当某一声音事件在该时间片段中超过一般时,则认为该时间片段中包含该事件。对应声音事件方位的估计评价标准,声音事件估计坐标为:声音事件参考坐标为。对于整个数据集的方位估计误差对于整个数据集的方位估计误差DOAerror为

其中,

N表示整个数据集方位估计总数。

考虑到估计DOA与参考DOA数量不对等时,提出了召回率(Frame Recall,FR)

通过召回率检测整个网络声音事件与方位检测系统性能。

参考文献:

[1]Cao Y, Iqbal T, Kong Q, et al. Two-stage sound event localization and detection using intensity vector and generalized cross-correlation[J]. Tech. report of Detection and Classification of Acoustic Scenes and Events 2019 (DCASE) Challange, 2019.

[2]Kong Q, Cao Y, Iqbal T, et al. Cross-task learning for audio tagging, sound event detection and spatial localization: DCASE 2019 baseline systems[J]. arXiv preprint arXiv:1904.03476, 2019.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-08-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一刻AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
竞购TikTok,AI算法成为中心
同样与美国总统特朗普交好的企业软件巨头Oracle随后加入收购战局,正在与美国风险投资公司合作,想击败微软,从字节跳动手中收购TikTok在美国、澳大利亚、新西兰和加拿大的业务。
科技云报道
2022/04/16
5520
竞购TikTok,AI算法成为中心
Linkedin之后,这25个香饽饽科技公司即将被收购!
并购市场着实是火了,的的确确On Fire了。就在前不久: Linkedin 262亿美元,Marketo 18亿美元,Demandware 28亿美元,Qlik 30亿美元纷纷“出嫁”,所以在这里我
人称T客
2018/03/22
1.2K0
沃尔玛正式入局!宣布购买TikTok新公司7.5%股份
周六,美国商务部表示将在周日全面禁止TikTok和WeChat,所有美国用户将不再能够从Apple和Google Play应用商店下载TikTok或WeChat。除其他功能外,美国微信用户也将无法使用短信应用程序发送付款。
大数据文摘
2020/09/27
4690
沃尔玛正式入局!宣布购买TikTok新公司7.5%股份
字节割肉不能活?TikTok最早将于周二提起联邦诉讼
刚刚,美国国家公共电台(NPR)援引知情人士报道称,TikTok最早将于周二提起联邦诉讼,挑战总统特朗普在美国封禁该视频共享服务的行政命令。
新智元
2020/08/11
3770
字节割肉不能活?TikTok最早将于周二提起联邦诉讼
TikTok美国数据或将由甲骨文存储,字节跳动无权访问
根据路透社消息,有知情人士称,字节跳动旗下抖音海外版 TikTok 即将与甲骨文公司达成协议,TikTok 将把美国用户的信息交给甲骨文存储,而字节跳动将无法访问。字节跳动希望以此消除美国监管部门对这款流行短视频应用数据完整性的担忧。
深度学习与Python
2022/03/24
5260
苹果道歉、Zoom持续发力硬件、甲骨文也要收购TikTok、微软将停用IE浏览器等| Decode the Week
根据微软365的博客,从2021年8月17日起,微软的许多自有服务将不再支持 google Internet Explorer 11,包括 Outlook、 OneDrive、 Office 365等(https://techcommunity.microsoft.com/t5/microsoft-365-blog/microsoft-365-apps-say-farewell-to-internet-explorer-11-and/ba-p/1591666)。
LiveVideoStack
2021/09/01
6100
苹果道歉、Zoom持续发力硬件、甲骨文也要收购TikTok、微软将停用IE浏览器等| Decode the Week
开源支撑下的Perplexity不止于OpenAI套壳
Perplexity CEO Aravind Srinivas 是谷歌创始人Larry Page的忠实粉丝。但是他认为自己找到了一种方法,不仅能与谷歌搜索竞争,还能与OpenAI的通用预训练transformer(GPT)竞争。
云云众生s
2024/03/28
8650
开源支撑下的Perplexity不止于OpenAI套壳
TikTok携手甲骨文“云上加州”,独家解读数据受托人模式
编者按:北京时间9月15日,据甲骨文证实,它已经与TikTok母公司字节跳动达成协议,成为其“可信技术提供商(trusted tech partner)”,TikTok案也终于有了初步结果。这里提到的合作方案,是指甲骨文作为数据合作方,由甲骨文为TikTok提供云服务,类似苹果在中国由云上贵州进行数据合规的方案。
大数据文摘
2020/09/18
1.4K0
TikTok携手甲骨文“云上加州”,独家解读数据受托人模式
零一万物刷榜,Zilliz 呛声:面向投资人编程;李彦宏称“程序员将会消失”,周鸿祎回怼;TikTok 危在旦夕 | Q资讯
美国会议员再抛“封禁 TikTok”无理法案,TikTok 拼死一战 ; 李彦宏:以后不会存在“程序员”这种职业了 ; 向量数据库一夜易主?零一万物与 Zilliz 开战?; 甲骨文因 AI 需求强劲,股价创历史新高;欧盟委员会对阿里巴巴全球速卖通提起正式调查;阿里旗下 11 款应用启动鸿蒙原生开发;腾讯收编字节跳动两个游戏工作室并成立新公司;支付宝租赁行业治理成果公布;消息称字节跳动旗下 Pico 将推出新款 VR 头显 Pico 4S;麦当劳遭遇系统故障,官方回应“崩了”;联手 OpenAI,全球首个 GPT 机器人来了;OpenAI 首席技术官:Sora 或将在今年向大众推出;程序员职业危机!全球首个 AI 软件工程师问世……
深度学习与Python
2024/03/18
2350
零一万物刷榜,Zilliz 呛声:面向投资人编程;李彦宏称“程序员将会消失”,周鸿祎回怼;TikTok 危在旦夕 | Q资讯
外媒曝出TikTok收购案背后利益往来,甲骨文CEO曾向共和党捐了25万美元
贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI TikTok的收购案,最近进展到哪一步了? 9月24日,量子位报道了TikTok起诉特朗普政府,因为官司,收购暂停。 至今这个案子没有任何进展曝出。 但昨天,外媒The Verge曝出了一则内幕。 原来甲骨文CEO在收购TikTok的前几天,向一位共和党参议员“送出”25万美元,最终甲骨文战胜微软,赢得这场收购战。 而关键点是,这位涉事议员正是收购方案的始作俑者。 甲骨文用25万美元换来什么? 昨天,The Verge详细报道了这一利益输送的情
量子位
2023/03/10
2310
外媒曝出TikTok收购案背后利益往来,甲骨文CEO曾向共和党捐了25万美元
微软拟1049 亿收购全球最大语音识别公司 Nuance,后者是 Siri 幕后英雄
作者 | 刘燕 Nuance 已是没落的语音识别巨头,微软欲花 160 亿美元买下它,这笔交易值吗? 1微软拟斥资 160 亿美元收购 Nuance 北京时间 4 月 12 日,根据彭博社的报道,微软正在就收购全球最大语音识别公司 Nuance Communications Inc. 进行深入谈判。据悉,微软可能愿意为收购这家公司支付高达 160 亿美元(1049 亿元人民币)的收购价格。 报道称,两家公司之间的谈判“正在进行中”,尚未最终敲定。CNBC 援引知情人士消息称,交易可能最早于周日签署,最早于周
深度学习与Python
2023/04/01
5930
微软拟1049 亿收购全球最大语音识别公司 Nuance,后者是 Siri 幕后英雄
Mellanox真牛X,引无数英雄竞折腰!
据媒体报道,英特尔已出价55亿美元竞购Mellanox Technologies。
SDNLAB
2019/05/07
7850
Mellanox真牛X,引无数英雄竞折腰!
盘点:近两年人工智能和机器学习领域部分收购案
随着全球科技巨头纷纷加入对顶尖人工智能人才和技术的争夺战,该市场正在蓬勃发展。据统计,仅在2018年,微软就进行了5笔人工智能收购,领跑人工智能市场的收购大军。
人称T客
2018/12/25
6620
美国意欲封禁Tiktok:到底在恐惧什么?
在承受了印度的禁令之后,日前,美国众议院通过法案,禁止在政府设备上使用TikTok。而关于TikTok的禁令,很可能在11月美国大选前有最终结论。
程序员小猿
2021/01/19
7470
美国意欲封禁Tiktok:到底在恐惧什么?
苹果1.8米连接线卖949元;达摩院发布AI Earth:更高效了解;谷歌、微软、苹果、Mozilla 四巨头合作 | EA周报
据彭博社报道,知情人士透露,小米、OPPO和vivo正在与印度的手机代工制造商进行谈判,希望利用当地公司可以享用的现金激励措施。其中,OPPO和 vivo已经开始与Lava International Ltd.进行谈判,而小米正在接洽Dixon Technologies India Ltd.。如继续推进,最快今年计划由Lava和Dixon来组装手机并进行出口。
yuanyi928
2022/03/29
3800
Facebook收购Giphy、华为“新”瓶装“旧”酒、TikTok被指侵犯儿童隐私法等|Decode the Week
尽管特朗普政府禁止美国公司与中国公司开展业务,但华为通过新瓶装旧酒的策略,继续发布带有Google应用程序的Android手机。由于禁令,华为不能够发布带有Google应用的新手机,因此只能重新发布旧版本。
LiveVideoStack
2020/05/26
5540
Facebook收购Giphy、华为“新”瓶装“旧”酒、TikTok被指侵犯儿童隐私法等|Decode the Week
160亿美元!全球智能语音巨头Nuance将被微软收购,或对苹果产生重大影响
报道称,微软正在进行一项高级谈判,以高达160亿美元的价格收购智能语音巨头 Nuance Communications。
新智元
2021/04/14
5630
重磅!博通拟收购VMware,谈成估计要400多亿美元
---- 新智元报道   编辑:时光 拉燕 David 【新智元导读】博通将收购VMware,价码多少?为何收购?收购之后将会产生什么影响? 据彭博社等多家媒体报道,半导体巨头博通(Broadcom)正在谈判收购虚拟软件巨头VMware。 知情人士表示,这笔交易还没有最终确定,他没有被授权公开讨论此事,目前也没有公布任何潜在的交易条款。 此次收购将进一步使博通的业务呈现多元化,从半导体业务转向企业软件业务。 截至当地时间周五收盘,VMware的市值为403亿美元,预计潜在的交易价格可能会更高。 他,
新智元
2022/05/25
4800
重磅!博通拟收购VMware,谈成估计要400多亿美元
腾讯所有事业群继续人员缩减;字节跳动更新价值观;传阿里正逐步解除与蚂蚁集团的业务往来 | Q资讯
整理 | 蔡芳芳 字节跳动更新价值观;蔚来回应测试车坠楼事件:这是一起(非车辆原因导致的)意外事故;腾讯所有事业群继续人员缩减;消息称阿里正逐步解除与蚂蚁集团的业务往来;TikTok 将美国全部用户流量导至甲骨文云;Linux 之父发话:Rust 即将出现在 Linux 内核中;StackOverflow 2022 年度调查报告:JavaScript 连续霸榜,Java 被挤出前五,Rust 最受欢迎;微软禁止俄罗斯用户从官网下载 Win11/10 系统…… 科技公司 字节跳动更新价值观 据晚
深度学习与Python
2023/03/29
1K0
腾讯所有事业群继续人员缩减;字节跳动更新价值观;传阿里正逐步解除与蚂蚁集团的业务往来 | Q资讯
687亿美元!动视CEO丑闻曝光3天,微软立即开始重金收购谈判
---- 新智元报道   编辑:时光 桃子 拉燕 【新智元导读】1月18日,687亿美元收购动视暴雪,微软完成史上最大收购案!近日,美国监管文件描述了这场收购谈判细节。值得注意的是,微软听闻动视CEO丑闻后立即进行了收购谈判。 1月18日,微软完成史上最大收购案:以687亿美元收购了动视暴雪。据称,这场收购是在微软游戏CEO菲尔·斯宾塞(Phil Spencer)听闻动视CEO丑闻后立即进行收购谈判。 近日,一份美国监管文件描述了这场收购谈判细节。传送门:https://www.documentcl
新智元
2022/03/04
2900
推荐阅读
竞购TikTok,AI算法成为中心
5520
Linkedin之后,这25个香饽饽科技公司即将被收购!
1.2K0
沃尔玛正式入局!宣布购买TikTok新公司7.5%股份
4690
字节割肉不能活?TikTok最早将于周二提起联邦诉讼
3770
TikTok美国数据或将由甲骨文存储,字节跳动无权访问
5260
苹果道歉、Zoom持续发力硬件、甲骨文也要收购TikTok、微软将停用IE浏览器等| Decode the Week
6100
开源支撑下的Perplexity不止于OpenAI套壳
8650
TikTok携手甲骨文“云上加州”,独家解读数据受托人模式
1.4K0
零一万物刷榜,Zilliz 呛声:面向投资人编程;李彦宏称“程序员将会消失”,周鸿祎回怼;TikTok 危在旦夕 | Q资讯
2350
外媒曝出TikTok收购案背后利益往来,甲骨文CEO曾向共和党捐了25万美元
2310
微软拟1049 亿收购全球最大语音识别公司 Nuance,后者是 Siri 幕后英雄
5930
Mellanox真牛X,引无数英雄竞折腰!
7850
盘点:近两年人工智能和机器学习领域部分收购案
6620
美国意欲封禁Tiktok:到底在恐惧什么?
7470
苹果1.8米连接线卖949元;达摩院发布AI Earth:更高效了解;谷歌、微软、苹果、Mozilla 四巨头合作 | EA周报
3800
Facebook收购Giphy、华为“新”瓶装“旧”酒、TikTok被指侵犯儿童隐私法等|Decode the Week
5540
160亿美元!全球智能语音巨头Nuance将被微软收购,或对苹果产生重大影响
5630
重磅!博通拟收购VMware,谈成估计要400多亿美元
4800
腾讯所有事业群继续人员缩减;字节跳动更新价值观;传阿里正逐步解除与蚂蚁集团的业务往来 | Q资讯
1K0
687亿美元!动视CEO丑闻曝光3天,微软立即开始重金收购谈判
2900
相关推荐
竞购TikTok,AI算法成为中心
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验