By 超神经
场景描述:面对天文学实验产生的海量数据,机器学习和神经网络等 AI 技术可以大大提高数据处理效率,GAN 可以修复已经损坏或丢失像素的图像,或使模糊的照片变得清晰。此外,AI 还能给科学研究提供一些新的思路。
关键词:黑洞,天文学,大数据
2019 年 4 月 10 日晚 9 点,参与 EHT 计划的科学家们,将在全球多地发布黑洞的照片。这个神秘的,充满了幻想的天体,将在今晚露出它的真实面目!
这是历史上首次,碳基生命直接「看到」黑洞。但是你可知道,如果没有 AI 技术助力,这个时刻恐怕还遥遥无期。
模拟的黑洞图片
面对天文学实验所产生的数据大潮(动辄每天产生数 TB 的数据),仅仅依靠人类团队去处理是无法想象的。于是,AI 成为科学家的重要工具。
令人绝望的天文学海量数据需要 AI
天文学已经被大量的数据包围很久了,数据量大到令人绝望。
比如 Square Kilometer Array,一台 20 世纪开始启用的射电望远镜,它现在每年产生的数据,相当于整个互联网的流量。
如果没有超级计算机的助力和智能算法的协助,此次黑洞「照片」的公布时间还会被无限延后。
AI 的介入,让事情变得更加明朗。通过机器学习,神经网络等 AI 技术,能够以最少的人工输入,获得高效可靠的成果。
当前,天文学研究中实际上已经引入了很多人工智能的内容,例如:使用机器学习算法进行天文观测资料的归档、分类;使用机器学习模型进行空间天气预测、太阳活动预报,发现新的天体等。
堪萨斯大学的研究者表示,在过去的五年里,使用机器学习进行研究的天文学论文,数量增加了至少 5 倍。
1
利用 AI 分析数据
早在2007年,科学研究者 Schawinski 曾面临一项艰巨的任务:根据外表面对数千个星系进行分类。
因为在当时,这个任务并没有现成的软件可用,他便想了一个办法:将任务众包给普通网民,让网民帮助标记完成分类,可谓一项大工程。但是到了今天,利用 AI,这项艰巨任务只需要一个下午便可完成。
据纽约大学的天文学家 David Hogg 介绍,自己的工作已离不开 AI,他一直在使用神经网络等技术,从光谱中对星星进行分类,并通过数据驱动的模型,来研究星星一些物理属性。
在去年 12月,发表于 Astronomy & Astrophysics 上的一篇论文中,苏黎世联邦理工学院的一个团队,用生成模型来研究星系在演化过程中所经历的物理变化,他们的模型创建了人工数据集,用来作为模拟测试物理过程的一种方法。例如他们用模型模拟探究了,恒星形成过程中形成速率急剧下降的现象,与星系环境密度的增加有关。
使用生成建模,天体物理学家可以研究星系从宇宙的低密度区域到高密度区域时的变化,以及这些变化导致的物理过程
2
利用机器学习算法获得新发现
在海德堡理论研究所,Kai Polsterer 领导着一个天文信息学小组,他们专注于研究以数据为中心的天体物理学方法。最近,他们使用机器学习算法从星系数据集中提取红移信息(一种证明宇宙膨胀的效应),而这在以前是一项艰难的任务。
荷兰莱顿天文台的研究员 Elena Rossi ,在研究极其罕见的超高速恒星时,通过构建神经网络模型,从数据中提取出所需特征,进一步过滤和提取。
该算法在「盖亚」卫星公布的照片中,从 10 亿颗恒星中,筛选出了 80 个候选超高速星。经过科学家的最终分析,确认了 6 颗超高速星。对于首轮搜寻来说,这个数字已经是份不错的收获。
但 Polsterer 也指出, AI 系统还不够完善,算法大多数只能去做训练过的工作。有时候,它会发生一些错误。比如给它一个星系的图片,软件可以估计星系的红移信息以及年龄 ,但是随便给系统提供图片,比如自拍或者一条鱼,它也将输出一个结果。
所以在这个阶段,AI 的使用还离不开人类科学家的监督和训练。
AI 已经成功「狩猎」系外行星
尽管还有些路要走,AI 在天文学上已经有了一些成果。比如寻找系外行星。
从宇宙中「狩猎」系外行星,是一件相当困难的事情。与它们的宿主恒星相比,系外行星不仅不能发热,而且也过于渺小,就像是在几千英里之外,寻找一只在探照灯下飞行的萤火虫。
以往天体物理学家寻找系外行星的方法,主要是通过人工和自动化软件,对 NASA 开普勒项目的大量数据进行分析。
当一颗绕轨道运行的行星挡住了一些光线时,恒星的测量亮度会轻微下降。开普勒太空望远镜观测了 20 万颗恒星的亮度,用了 4 年时间来寻找由行星凌空而产生的特征信号。
这些数据点能组成约 2 千万亿个可能的行星轨道,要在如此庞大的数据库中发现一颗行星,即便是最强大的电脑也需要耗费大量时间。机器学习的出现,有效地缩短了这个时间。
2017 年,一位热衷太空探索的 Google AI 研究员 Chris Shallue 与 UT 奥斯汀(得克萨斯大学奥斯汀分校)的天体物理学家 Andrew Vanderburg 一道,通过 TensorFlow 模型在距地球 2545 光年远的开普勒 90 星系中成功发现两颗新行星:80g 和 90i 。
开普勒 90 星系和太阳系的动态对比
为了提高 TensorFlow 模型识别行星的准确率,避免将其他天体如星斑和双星误认为行星,工程师们使用了超 15,000 个被标记过开普勒信号的数据集来训练该模型。他们的结果也证明,机器学习的准确率超过了 90%,也就是说,AI 用来探索宇宙,发现新天体是可行的。
就在前几天,德克萨斯大学的学生 Anne Dattilo ,借助简单的 AI 算法,从开普勒望远镜的观测数据中,又发现了两颗远在 1300 光年外的系外行星。
当数据形成海洋的时候,人工处理只能是大海捞针,但交给 AI ,也许就是小菜一碟。
为了「看见」黑洞,花了两年来处理数据
回到「看见」黑洞这件事,也许此类发现在很长时间里都不会影响我们的日常。但不要忘了,几千年前的人们开始仰望星空,才有了今天恢宏的航天探索,而 AI 的介入,也许就是给我们的探索加上了翅膀。
长久以来,人们对黑洞的认知,除了理论上的概念描述,就是一些科幻渲染以及艺术想象的图片。
电影星际穿越中,物理大佬 Kip Stephen Thorne 模拟出来的经典黑洞
黑洞的称呼是一个很形象的叫法,说明了它「来者不拒」的特性:具有巨大质量的天体,会形成极强的吸引力,任何经过它的物体都会被吸收进去,甚至连光线都无法摆脱。
准确点说,它具有超强引力,使得光无法逃脱它的势力范围。而这个范围被称为黑洞的「事件视界」。在事件视界之内,光线被「吞噬」,而且黑洞自己不发光,就不能直接观察到它。
那么这一次的新闻发布,又是怎么观察到的呢?
其实这次,还是专注于黑洞所引发的周围效应。有些时候,黑洞周围的气体云会靠的很近,在巨大引力作用下,气体云会围绕黑洞旋转,形成一个物质盘。气体因摩擦而被加热,发出强烈的辐射。而且旋转速度越来越快,最终穿过事件视界,永远地消失在黑洞中。事件视界望远镜要观察的, 正是那围绕着黑洞轮廓的碟形光环。
但要观察到这个现象,除了需要选择距离大小合适的黑洞,还要分辨率足够大的望远镜。
2017 年,来自全球的多个望远镜,通过干涉测量的成像技术,组成了一个强大的观测阵列,称为「事件视界望远镜」 ( EHT ),而观测的对象,则是选择了银河系中心的人马座 A* 黑洞和星系 M87 黑洞。
EHT 的望远镜分布地图
在作出这样的部署后,才刚刚够格拍摄到黑洞。而且,这些射电望远镜也不是直接拍摄得到图片,而是收集到大量的数据,最后再由科学家处理成为图像。
而从「拍摄」完成,到最终的发布,这一等就是漫长的两年。因为数据量高达 PB 量级,除了从各地运输汇总数据以外,最终的分析和计算,也耗费了大量的时间。根据相关报道,在处理中,也用到了「主成分分析」等相关技术。
从 1783 年,科学家首次提出黑洞的概念,到现在距离黑洞真相最近的时刻,已经过去了 230 多年,而我们将有机会成为知晓谜底的第一批观众。
至于具体的细节和最终的成果,就一起期待今晚的发布会吧! EHT 项目组和中国科学院,将在上海天文台发布这一最新成果。
发布会时间为北京时间 2019 年 4 月 10 日 21:00,全球六个地方同时发布,除了上海,还分别有比利时布鲁塞尔(英语)、智利圣地亚哥(西班牙语)、日本东京(日语)、中国台北(中文)和美国华盛顿(英语)。
让我们共同期待这一历史时刻的到来!
超神经小提醒
直播链接:
1. 新华网:
http://www.xinhuanet.com/politics/ksh/zhibo/201904/3731328.html?type=pc?type=mobile
2. 看看新闻:
http://live.kankanews.com/zhibo//6283.html