Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >谁说偷窥一定要趴墙头?这个系统可用声波「看见」墙后物体

谁说偷窥一定要趴墙头?这个系统可用声波「看见」墙后物体

作者头像
机器之心
发布于 2019-06-23 12:27:36
发布于 2019-06-23 12:27:36
1.3K0
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

参与:路、张倩

传统的非视距成像方法多是利用光波进行图像重建,最近斯坦福和英特尔实验室的研究者提出一种新方法,用声波的方式进行穿墙探测,并进行图像重建。该研究表示,声学方法可以「看到」墙那面的多个事物,且允许的距离范围较大,同时成本较低、时间较短。相关研究已被 CVPR 2019 接收。

我站在墙前,想看到拐角处我视线范围之外的事物,除了伸长脖子或者走过去,还有别的方法吗?

非视距成像(Non-line-of-sight (NLOS) imaging)技术利用角落或障碍物周围墙壁反射的光波,重建出图像,从而看到视线之外的事物。但这种光学方法中用到的硬件非常昂贵,且对距离的要求较高。

那么,如果不使用光波,转而使用声波呢?

来自斯坦福大学与英特尔实验室的研究人员想要试试看,他们构建了一个硬件原型 :一个装有现成麦克风和小型汽车扬声器的垂直杆,参见下图:

原型系统图。该原型包括一个垂直安装在 1 米平移台上的 16 个扬声器和麦克风线性阵列。功率放大器和一组音频接口驱动扬声器并从麦克风录音。

在实际操作中,扬声器会发出一串啾啾声,声音以一定角度弹到附近的墙壁上,然后撞到另一面墙上的隐藏物体:一张字母 H 形状的海报板。然后,科学家们一点一点地移动设备,每次都发出更多的声音,最后声音以同样的方式反弹回麦克风。

2D 声学 NLOS 扫描系统的可视化。

接下来,研究人员使用地震成像的算法,对字母 H 的外观进行粗糙重建。

地震学中有类似的问题,利用冲击波进行探测并重建地下结构的图像。

该研究对字母 H 的重建结果如下图所示:

上图只是一个「隐藏物体」的图像重建结果,那么如果有多个隐藏物体,系统也能够很好地执行图像重建吗?

答案是:YES!

下图展示了该系统对 4 个隐藏物体的图像重建结果:

从这些实验结果上来看,利用声音信号进行 NLOS 成像是可行的。那么,它的效果能不能比得上基于光波的 NLOS 成像方法呢?

研究者也进行了对比。如下图所示,给出两个字母 L 和 T,光学方法需要使用的设备比较昂贵,且只能生成 T 的图像,对于距离较远的字母 L 则没有成功重建图像,此外,该方法需要花费的时间较长,超过一小时。

相比之外,该研究所提出的声学方法能够重建出两个字母的图像,且时间较短,只用了四分半钟!距离也比光学方法高出 2 倍。

这项技术距离应用还需要数年的时间,但作者表示,该技术的超声波版本最终可能会应用于自动驾驶汽车上,用来探测看不见的障碍物。或者,你可以用它来监视隔板另一边的同事(可怕!

原理介绍

研究者参数化了声学波场,使得发射扬声器和接收麦克风位于 {(x, y, z)∈R×R×R | z = 0} 平面上。该波场是 τ (x_t, y_t, x_r, y_r, t) 的 5D 函数,其中,x_t、y_t 表示扬声器的空间位置,x_r、y_r 表示麦克风位置,t 表示时间(见图 1 和图 2)。

图 1. 该研究提出的声学 NLOS 成像方法概览图。调制声波从扬声器发出,穿过墙角到达隐藏物体,在反射回来时由一个麦克风记录下来。处理后的测量值(左下)包含峰值,表示声音从扬声器直接传播到麦克风的路径长度(A,峰值被剪切)、传播到墙并回返的路径长度(B),以及到隐藏物体并回返的路径长度(C)。从一系列扬声器和麦克风的位置捕捉这些测量值,用于重建隐藏物体的 3D 几何形状(右下)。

图 2:场景几何和测量值捕获示意图。声阵列发出声信号,该声信号通过墙壁反射到隐藏物体,然后反射回来。由于墙壁在声波波长上的镜面散射,测量数据似乎是从位于墙壁后面的镜像体中捕获的,就好像墙壁是透明的一样。发射信号的频率随时间而线性变化。对于单个反射器来说,返回信号是延迟版的发射信号(右上角)。接收和发射信号混合在一起并进行傅里叶变换,在与反射器距离成正比的频率上产生一个波峰(右下角)。

图 1 和图 2 进一步显示了测量值的几何结构。在声学波长上,墙充当一个类似镜面的反射器,将发射信号 g 散射到拐角,到达隐藏物体,然后返回到声波阵列。

由于墙的镜面散射,在测量中,隐藏物体似乎位于墙外的一个位置。因此研究者选择忽略墙,以使图像重建步骤建模从位于透明墙后面的虚拟对象捕获的测量值。对于同样具有镜面散射的光滑隐藏物体,研究者假设虚拟物体的表面法线指向声阵,这样就可以观测到信号。这一假设也被提出,例如,雷达系统通过墙壁成像并捕获镜面散射 [1, 3, 42]。

如何利用声音

声波散射

下图 3 概述了声波散射双向反射分布函数(BRDF):

图 3:声波散射 BRDF 示意图。在大于波长的平坦表面上进行镜面散射(中左)。在等于波长的墙角几何结构上进行逆反射散射(retroreflective scattering,中右)。对于小于波长的表面,物体周围的衍射会导致漫散射(右)。

信号随距离的衰减

对比光学 NLOS 成像中常见的漫反射,声学信号衰减与 1/(r_t+r_r)^2 成正比,而光学信号衰减与

成正比。研究者在图 4 中通过实验验证了这种衰减。

图 4:信号衰减(左)和分辨率分析(右)。研究者利用 log-log 尺度上的线性回归,绘制了角反射器和平面镜面散射目标的测量值。角反射器的信号衰减约为 d^ −1.92,而平面目标的信号衰减约为 d^−1.89,与预期的 d^−2 衰减基本吻合。图中还展示了漫反射光学 NLOS 成像的 d^−4 衰减。与典型的光学方法相比,该研究给出了一系列声信号带宽范围下不同距离对应的横向分辨率(lateral resolution)。

传输信号

下图 2 描述了信号传输的过程。

如何生成图像

当信号发射位置和接收位置相同时,即 x_t = x_r,y_t = y_r,研究者使用闭合解(closed-form solution)进行图像重建。也就是光学 NLOS 成像方法中所说的「共焦」扫描。研究者对空间位置接近的扬声器和麦克风进行声学共焦测量。

共焦测量能够对隐藏物体的 3D 几何形状进行高效的重建,但是在更常见的非共焦测量情况下如何进行高效重建呢?

研究者首先调整非共焦测量,使其模拟共焦采样网格捕捉到的共焦测量。然后再执行常规的地震成像步骤,即动校正(NMO, normal moveout correction)和倾角时差校正

图 5:动校正和倾角时差校正图示。

下图 6 展示了如何通过非共焦测量,来改善信号质量、提升空间采样。

图 6:在有两个隐藏物体时,图像重建的流程。

实现

除了本文开头所提原型系统所需的硬件设施之外,在软件方面,该系统中所有步骤都使用 Python 实现。目前,该研究已经开源,包含研究所用数据集和软件。

GitHub 地址:https://github.com/computational-imaging/AcousticNLOS

关于该研究更多内容,参见以下视频:

参考链接:

https://www.sciencemag.org/news/2019/06/scientists-use-sound-see-around-corners http://www.computationalimaging.org/publications/acoustic-non-line-of-sight-imaging/ http://www.computationalimaging.org/wp-content/uploads/2019/03/cvpr_2019_2059.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
真透视眼!西北大学开发新全息成像设备,用算法重构散射光,未来可透过皮肤看血管
但是你有没有想过,我们的手掌是有骨头的,光被骨头挡住,应该会跟拍X光一样,显示出一个轮廓清晰的阴影,为什么没有呢?
大数据文摘
2021/11/23
4310
让智能音箱胡言乱语、乱下指令,只需要一部手机+一个喇叭
智能音箱近两年走入了很多家庭的生活,成为了娱乐、购物、日程管理、儿童陪伴甚至教育方面的帮手。但是,智能音箱的安全问题也日益受到关注。继今年 11 月份,有研究使用激光黑掉智能音箱后,又有新的破解方法来了。这回直接用定向声波。
机器之心
2019/12/24
9290
1.43千米外隔墙透视!这项黑科技已被中科大潘建伟团队实现
但已经被中科大潘建伟、窦贤康、徐飞虎带领的团队实现了,而且距离高达1.43千米。这项技术称为远距离非视域成像。
深度学习技术前沿公众号博主
2021/03/12
4650
超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像
英国科学家现在找到了一种方法,可以让智能手机和笔记本等日常物品具备类似蝙蝠的环境感知能力,像超胆侠一样厉害。
新智元
2021/05/28
4810
超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像
CovertBand:连“啪啪啪”都能识别的身体运动信息测试
近期,华盛顿大学Paul G. Allen计算机学院通过研究,实现了一种基于声纳并名为CovertBand的测试,通过该测试,可以对特定范围和有隔离屏障内目标人物的位置及身体运动信息进行捕捉,进而推断出目标人物的当前身体运动状况,甚至连”啪啪啪”运动也能被识别!在提倡数据安全和隐私保护的今天,该项研究试图证明,在毫不知情的前提下,你的身体运动动信息可能正被测试者能通过智能设备进行窃取。 实现方法 把CovertBand测试应用伪装一个第三方安卓手机APP,设法在目标人物手机上成功完成安装后,当手机播放音
FB客服
2018/03/01
9920
CovertBand:连“啪啪啪”都能识别的身体运动信息测试
斯坦福华人教授:声波、光波,其实都是RNN!机器学习模型对应物理系统
近来,物理、数学与机器学习领域之间相互交叉,促进了使用机器学习框架来优化物理模型,并进一步促进研究人员开发了许多令人兴奋的新机器学习模型(例如神经ODE,哈密顿神经网络等),它们借鉴了物理学的概念。
新智元
2020/02/13
1K0
美大使馆遭遇声波攻击,浙大WitAwards获奖团队协助调查
照片来源:路透社 Alexandre Meneghini 声波之谜 根据外媒报道,至少 24 名美国驻古巴大使馆工作人员在 2016 年 12 月到 2017 年 8 月期间听到过尖锐声音,并受声波影
FB客服
2018/03/22
9920
美大使馆遭遇声波攻击,浙大WitAwards获奖团队协助调查
CVPR 2019最佳论文得主专访:非视距形状重建的费马路径理论
Robin.ly 是立足硅谷的视频内容平台,服务全球工程师和研究人员,通过与知名人工智能科学家、创业者、投资人和领导者的深度对话和现场交流活动,传播行业动态和商业技能,打造人才全方位竞争力。
OpenCV学堂
2019/07/16
9580
CVPR 2019最佳论文得主专访:非视距形状重建的费马路径理论
多模态人机交互国内研究进展
在大数据可视化领域,国内的发展也已经逐渐走向成熟,每年都有许多可视分析系统不断涌现。近年,沉浸式大数据可视化得到了发展,浙江大学的探索了如图 1所示的无缝结合羽毛球比赛数据绘制的2D和3D可视化视图的问题,Chu等人(2022)探索了结合高度来凸显羽毛球数据中多个战术之间存在的差异性问题,如图 2所示。由此可以看出,沉浸式大数据可视化对数据分析和展示问题提出了有效的解决方法。
一点人工一点智能
2022/12/27
1.4K0
多模态人机交互国内研究进展
声学相机:用“眼睛”听见声音的奥秘
说到终极武器,它的核心秘密是“机器听觉”。我们知道人类的听觉系统犹如一台精密的生物仪器:双耳通过时间差与强度差的微妙感知,能瞬间分辨出雨滴敲窗与孩童笑声的方向;而机器听觉依赖麦克风阵列与算法模型,虽能精准识别语音指令,却难以像人类般在交响乐中锁定单簧管音轨,或在装修工地中区分电钻与锤击声。这种差异源于感知维度的局限——人类听觉融合了经验记忆与情感共鸣,而机器仅能处理数字化的声波参数。正因如此,​声音可视化技术应运而生,成为跨越物种感知鸿沟的桥梁。它通过波束成形聚焦声源、扫描成像还原三维声场,将声波的振幅、频率等参数转化为动态热力图或频谱动画。例如,声学相机能通过麦克风阵列同步接收多个通道的声音信号,依据相控阵波束形成原理计算得到设备基准发射面上的声场分布云图。测量中同步记录设备的可见光图像,以其为背景,通过几何配准将声场分布彩色等高线云图与可见光图像叠加显示,获得声学成像结果。声学成像结果中直观显示了声源空间位置、强度和频谱等特征。
黄成甲
2025/04/01
4580
清华大学课题组联合美团研发无人机声波定位技术获ACM SenSys顶会大奖
11月6日至9日,第20届国际计算机学会(Association for Computing Machinery,简称ACM)嵌入式网络感知系统大会(Conference on Embedded Networked Sensor Systems ,简称SenSys)在美国波士顿召开。清华大学软件学院何源副教授课题组和美团无人机团队合作论文“麦巢:辅助无人机精准降落的远距离即时声源定位技术”(MicNest:Long-Range Instant Acoustic Localization of Drones in Precise Landing)获得了大会最佳论文奖第二名(Best Paper Runner-Up)。
美团技术团队
2022/12/16
7810
清华大学课题组联合美团研发无人机声波定位技术获ACM SenSys顶会大奖
神秘的“声波攻击”到底是什么?
5 月 24 日,CNN 发布了一篇报道,报道指出,美国驻广州总领事馆发布了一则针对在华美国公民的健康警报,称一名在中国的美国政府雇员早前感受到了“微妙、模糊、但是反常的声音和压力”,其后被诊断为“轻度创伤性脑损伤”。美国国务卿蓬佩奥发言表示这种状况与此前美国驻古巴大使馆遭遇“声波攻击”的工作人员的医学表征基本相同。美国因此与中国外交部联系,暗指中国发起了声波攻击。
FB客服
2018/07/30
2.3K0
神秘的“声波攻击”到底是什么?
华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
作为计算机视觉领域内最负盛名的学术会议,今年的 CVPR 已于当地时间 6 月 16 日在美国加州长滩开幕。
机器之心
2019/06/21
4840
华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
只要算法够厉害,白墙能当镜子用:我初中物理都白学了 | Nature新论文
一篇新论文登上了Nature,论文中显示,仅仅用一台普通的数码相机,仅仅凭借墙上模糊不清的光影,就能还原最初的画面。
量子位
2019/04/24
6190
只要算法够厉害,白墙能当镜子用:我初中物理都白学了 | Nature新论文
深度解析机器视觉四大光学成像方法
工业4.0时代,三维机器视觉备受关注,目前,三维机器视觉成像方法主要分为光学成像法和非光学成像法,这之中,光学成像法是市场主流。
一点人工一点智能
2023/03/17
1.1K0
深度解析机器视觉四大光学成像方法
墙变成镜子!美国西北大学华人研发最强透视相机,光波全息成像「看穿一切」
据此,西北大学的研究人员发明了一种新的高分辨率相机,可以透过散射介质,如皮肤、雾,甚至可能是人类头骨等等看到之前他们看不见的东西。
新智元
2021/11/25
5790
毫米波雷达跟激光雷达_毫米波雷达市场
激光雷达的波长介于750nm-950nm之间, 以单线或多线束机制辐射光束,接收目标或环境的反射信号, 以回波时间差和波束指向测量目标的距离和角度等空间位置参数。 激光雷达主要优点如下: (1)波长短,测量精度高 (2)多线束的探测, 可以实现对场景的三维成像。 激光雷达的主要缺点是: (1)抗干扰能力低, 易受天气影响, 在雨雪雾等天气的作用下, 激光雷达使 用受限。 (2)激光发射、被测目标表面粗糙等因素都对测量精度有影响。 (3)结构复杂, 除激光器本身, 还必须添加精密伺服机构, 实现对探测空域 机械扫描, H前的成本以数万美元计。
全栈程序员站长
2022/10/01
8770
利用声学密码分析攻击破译4096位RSA加密算法
引言:计算机科学家开发出了一种可靠提取密钥的新攻击技术:捕捉计算机在展示加密信息时产生的高声调音频。这项密码破解技术(PDF)属于物理攻击,攻击者需要将智能手机的麦克风直接对准目标计算机的风扇通风口,但研究人员提出可以用监听声音的恶意程序感染智能手机,或者其它方法在目标计算机附近安放监听设备。攻击利用了运行GnuPG的计算机CPU产生的不同声波特征,研究人员发现他们能区分不同RSA密钥之间的声波特征,通过测量CPU解密密文时的声音,能完整提取出解密密钥。在演示中,研究人员成功利用一部三星No
FB客服
2018/02/01
2.3K0
利用声学密码分析攻击破译4096位RSA加密算法
MIT非视线成像“透视相机”:隔墙观物、影中窥人!
2012年,MIT计算机视觉科学家安东尼奥·托拉尔巴(Antonio Torralba)在西班牙海岸度假时,发现他酒店房间墙壁上的杂散阴影似乎不是由任何东西投射出来的。
新智元
2018/09/25
1.5K0
MIT非视线成像“透视相机”:隔墙观物、影中窥人!
智能语音交互中的麦克风阵列技术
近年来,随着语音识别技术的发展成熟,语音交互越来越多的走进我们的生活。从苹果手机Siri助手的横空出世开始,各大公司纷纷效仿开发自己的语音助手和语音识别平台,手机端的近场语音交互日趋成熟。后来Amazon发布Echo智能音箱,开启了智能硬件远场语音交互时代。相比于Siri手机端近场的语音交互,Echo音箱的语音交互支持距离更远,交互更加自然便捷,它使用了麦克风阵列来保证远距离复杂背景噪声和干扰环境下的良好拾音效果,随后麦克风阵列逐渐成为了后续语音交互智能硬件的标配。
DancingWind
2019/08/01
11K0
智能语音交互中的麦克风阵列技术
推荐阅读
真透视眼!西北大学开发新全息成像设备,用算法重构散射光,未来可透过皮肤看血管
4310
让智能音箱胡言乱语、乱下指令,只需要一部手机+一个喇叭
9290
1.43千米外隔墙透视!这项黑科技已被中科大潘建伟团队实现
4650
超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像
4810
CovertBand:连“啪啪啪”都能识别的身体运动信息测试
9920
斯坦福华人教授:声波、光波,其实都是RNN!机器学习模型对应物理系统
1K0
美大使馆遭遇声波攻击,浙大WitAwards获奖团队协助调查
9920
CVPR 2019最佳论文得主专访:非视距形状重建的费马路径理论
9580
多模态人机交互国内研究进展
1.4K0
声学相机:用“眼睛”听见声音的奥秘
4580
清华大学课题组联合美团研发无人机声波定位技术获ACM SenSys顶会大奖
7810
神秘的“声波攻击”到底是什么?
2.3K0
华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
4840
只要算法够厉害,白墙能当镜子用:我初中物理都白学了 | Nature新论文
6190
深度解析机器视觉四大光学成像方法
1.1K0
墙变成镜子!美国西北大学华人研发最强透视相机,光波全息成像「看穿一切」
5790
毫米波雷达跟激光雷达_毫米波雷达市场
8770
利用声学密码分析攻击破译4096位RSA加密算法
2.3K0
MIT非视线成像“透视相机”:隔墙观物、影中窥人!
1.5K0
智能语音交互中的麦克风阵列技术
11K0
相关推荐
真透视眼!西北大学开发新全息成像设备,用算法重构散射光,未来可透过皮肤看血管
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档