谷歌和一群游戏科学家已经对多年的海底录音进行了人工智能调查,希望能够创建一种可以发现座头鲸交谈的机器学习模型。这是该公司新推出的“人工智能”计划的一部分,该计划明显主要用于面部识别和广告定位。
鲸鱼在寻找更好的觅食地,更温暖的水域,在社交聚会时旅行的时间相当多。但这些运动很难追踪。幸运的是,鲸鱼互相呼唤并以独特的方式唱歌,这些歌曲可以在水下远距离传播。
因此,通过在海底部署的全球听力设备网络,您可以跟踪鲸鱼的运动 - 如果您想听多年的背景噪音是可以获取的。这就是我们在很长一段时间内工作的方式,计算机帮助减轻了负担。谷歌团队与NOAA合作,认为这是机器学习系统与人才的良好匹配。
这些AI模型非常适合浏览特定模式的大量噪声数据,这就是为什么它们应用于像射电望远镜和闭路电视摄像机那样的大量数据。
在 这种情况下,数据是来自太平洋各地的十几个水听器的数年录音。这个数据集已经在很大程度上进行了筛查,但谷歌的研究人员希望看到一个AI代理人是否可以做 一次艰苦而耗时的工作,首先通过它并用物种名称标记有趣的声音 - 在这种情况下,它可以很容易地成为一个不同的鲸鱼或其他东西。
鲸歌,未知的“窄带”噪音。
有趣的是,但回想起来并不奇怪,音频没有被分析 - 相反,音频变成了可以寻找模式的图像。这些频谱图是一段频率随时间变化的声音强度的记录,并可用于各种有趣的事情。碰巧它们也可以被机器学习和计算机视觉研究人员很好地研究,Google开发了各种有效方法分析它们。
机器学习模型提供了座头鲸呼叫的示例,并学习了如何在一组样本数据中以合理的准确度识别它们。为此,AI进行了各种实验以确定哪些设置是最佳的 - 例如,什么长度的剪辑易于处理而不是过长,或者可以安全地忽略哪些频率。
最后的努力将数据年份划分为75秒的剪辑,模型能够以90%的准确度确定剪辑是否包含“驼背单位”或相关的鲸鱼声音。当然,这不是一个小错误,但是如果你相信机器,你可以节省相当多的时间 - 或者你的实验室助理的时间。
第二种努力依赖于所谓的无监督学习,其中系统类型设定了关于鲸鱼声音和非鲸鱼声音之间的相似性的规则,创建了研究人员可以分类并找到相关群体的情节。
可视化无监督模型如何分类各种声音。
它提供了更有趣的可视化,但它更难以解释,并且无论如何似乎没有像更传统的方法那样产生一组有用的分类。
与在各种学术领域中类似的机器学习应用一样,这不会取代仔细人类的观察和文档,而是会丰富它们。从科学中脱离一些笨拙的工作,研究人员可以专注于他们的专业,而不是陷入重复统计和长达数小时的数据分析会议。
领取专属 10元无门槛券
私享最新 技术干货