NEXTTECH | 编译
你可能已经听说过、或是亲身经历过:
和父母打电话被劝赶快生个娃,转眼打开某宝某东,满眼都是“母婴用品”促销的推荐。
工作不顺心,和朋友语音吐槽要离职,接下来两天,各种猎头HR的电话接到怀疑人生。
每到这个时候,内心闪过100句mmp后,第101个念头一定是:我不是用户,我只是一个行走的互联网大数据。
在移动互联网时代,个人隐私早就是天方夜谭。
但比起收集定位、短信、通讯录,电话监听的门槛就高了不少,毕竟,如果没有靠谱的语音识别,这些“偷”来的电话录音无法产生任何价值。
所以,遇到上述情况,我们往往会自我安慰:不过是「孕妇效应」,是你自己想太多…
但…等你看了下面这些强大的音频分析AI算法后,不知道还能不能淡定地拿着手机。
AI能从你的一通电话里“偷”到哪些信息呢?
我们翻阅各种论文、报道,做了个不完全统计:
你是谁?你从哪里来?你身居何处?你性别为何?芳龄几许?讲什么语言?
你是不是在撒谎?你的健康状况、有无疾病、情绪状态如何?
你讲话时是不是喝大了、有没有在偷吃东西?
你对正在谈论事件的态度倾向,是否会和对方起冲突?
甚至,通过收集背景声,算法还能实时掌握你周围环境的动态。
简而言之一句话,通话5分钟,AI就能扒到你连内裤都不剩…
“听声辨息”
“听声辨息”的恐怖不止是隐私信息的无底线被盗取,更在于它全天候在线的特性。在离不开手机的移动互联网时代,身边随时跟着一个竖着耳朵的间谍。
考虑到数据量的问题,其实这些专攻音频分析的AI算法并不会一字一句细抠你的话。听不懂你在叽里呱啦什么不重要,只要分析说话方式,它就能给出一个大致的用户画像——
你的身份职业、家乡性别、年龄语言,都能分析个八九不离十。
举个最简单的栗子,根据口音判断出老家简直easy~
同样一个英语单词three,找中国人、日本人、法国人和南美人,就能读出“sree”“free”“特嗨~”以及不可描述,却带着性感大舌音的不同效果。
甚至坊间一度流传,印度的Siri一定要发“西里”才能开启。
英文口音虽然不至于像传说中的神级浙江方言一样,隔着村就听不懂,但还是带着浓厚的地域特色。
就靠着这点口音特点,剑桥大学的研究团队就开发了一款语音识别的app,通过用户对26个单词的发音生成热图,并判断他们的国籍出生地。
还有更高级的音频AI,甚至能从话里话外听出你是否在撒谎,判断你的情绪状态,连你喝醉了嗨起来都别想骗过它。
还能在你说话的同时,检测到你正在吃的东西,从而分析你牙口好不好,是否有健康问题。
这可不是天方夜谭,越来越多科学证据表明,许多精神和身体上的状况都会反映到说话的方式中,大家最熟悉的例子,就是感冒的鼻音与睡觉的呼噜声。
如果哪天你发现自己说话含糊不清,拉长调子,或者鼻音很重,可能就是疾病的前兆。
有些病可能会让你的声音带有短暂的尖锐感或颤抖,这些轻微的变化人耳很难察觉,这时AI就可以帮上忙了——助力诊断人类疾病。
如果说客观分析不算难事儿,有些音频AI还能做出带有个人色彩的主观预判。
它可以通过分辨发言者的说话态度,猜出人们的言下之意,并预测发言者之间是否会发生冲突。去年开发的一项AI系统,甚至可以通过听取夫妇间的彼此交谈,判断他们的婚姻是否能长久。
当AI开始侵入我们生活的方方面面,我们甚至连说话都要小心翼翼,毕竟隔墙有“耳”,想想都觉得不寒而栗……
一句话看透一个人
这些具有音频分析功能的AI都基于同一项技术——机器学习。音频数据被添上指示标签,算法通过处理成百上千这样的数据,逐渐开始建立音频特征与标签之间的关联性。
这些所谓的“语音特征”通常只是音频中的一些细微波动。例如,用于检测性别的AI系统将记录智能手机中的语音,并对其进行处理,从而提取特征。
一个小数值波动的背后,代表的可能是截然不同的特性。通常,这些语音特征代表的是每连续20毫秒的周期中,幅度和频率的信息。
在人类的说话过程中,幅度和频率都会有不同程度的波动,而男女之间这种波动方式也略有不同。机器学习系统可不仅仅是记录这种特征,还会观察它随时间变化的程度、频率以及方式。
如果语音来源于智能手机,剪辑过的音频会被上传至互联网服务器。通过服务器的处理后,系统会计算并统计数据,并进行最后的机器学习部分。
在这个过程中,AI执行的大多数是“概念性任务”,在某种程度上还是要依赖于人类智能。它们的任务是分析与理解,为人类提供信息。它们不能贸然行动,因为最终决定权还是在人类手中。
Big Brother is watching you
但…人类和机器的分界线正在变得模糊淡化。
许多AI系统开始越俎代庖,有些甚至能够在没有人为干预的情况下独自采取行动——那些帮你开灯、拉窗帘、讲段子、撩小姐姐的智能音箱,就是活生生的例子。
当然,这都是AI使用得当的例子。然而,AI的发展一旦失控,它们的未来就是乔治·奥威尔在《1984》中所描述的思想警察,穿着便衣混迹于人群中,即使我们缄默无言,它仍能对我们的思想了如指掌。
将智能手机变为永久麦克风并不是什么难事,提供便利和触犯底线之间,几乎全看APP厂商们的主观意愿。
所以,很多专门致力于守护人们隐私安全的民间组织也应运而生,它们有各种奇怪的名字:“世界隐私论坛”、“为未来而战”和“电子前线基金会”。
隐私安全就像悬在每个头上的达摩克利斯之剑。
《华尔街日报》曾经做过一项统计,在一个不能再普通的周末,即使你不出户,但社交软件、外卖、浏览的网页信息,就能让你在不知不觉中交出 53 条个人信息。
这还仅仅是手机,别忘了躺在家里的智能音箱、隔墙有耳的监控探头。
隐私换取了便利的底线在哪儿?这恐怕是大数据时代,一个最难解的迷思…
「NEXTTECH团队」等你来
兼职内容作者 | 翻译实习生 | 内容实习生
领取专属 10元无门槛券
私享最新 技术干货