来源:Google
编译:Bing
几千年来,人们仰望星空,欲探寻宇宙的奥秘。古人观察到除了有固定在夜空中的天体外,还有看似无规则运动的天体,这就是行星。古希腊人将其称之为“planētai”,意为“游走者”(wanderers)。经过几个世纪的研究,我们知道了地球和其他几个行星都围绕着太阳运转,而宇宙中还存在着许多类似太阳一样的恒星。
今天,在光学望远镜、宇宙飞行、数字相机和计算机技术的帮助下,人类将探索的疆界扩展到太阳系之外,探测到了其他恒星及其周围的行星。研究这些系外行星或许能揭开宇宙深处的秘密,那里究竟有什么?宇宙某一处还有类似太阳系和地球这样的星系或行星吗?
虽然有了高科技的帮助,但寻找系外行星仍是世界难题。与其所在星系的恒星相比,系外行星通常非常黑暗、寒冷、难以发现,就像从几千英里外的探照灯旁发现一只飞舞的萤火虫那样难。但是借助机器学习,谷歌帮助NASA取得了一些进展。
开普勒任务(Kepler Mission)是NASA第10号发现任务,是专门用来观测在银河系中恒星系统宜居带或宜居带附近发现的几十个地球大小的行星,并分析在银河系数十亿个恒星系统中有多少这样的行星。
在分析过程中,天体物理学家使用的主要方法是通过自动化团建和人工分析该任务中的大量数据。四年以来,开普勒望远镜观察到了约20万颗恒星,每30分钟拍摄一张照片,创造了约140亿个数据点。这140一个数据点可能转化为2万亿个行星轨道!即使对最强大的计算机来说,这样巨大的信息量分析起来也是一个巨大的工程。为了让这一过程更快、更高效,研究人员决定采用机器学习的方法。
当轨道上的行星挡住了恒星的光线时,恒星的亮度会略微减小。四年间,开普勒望远镜观测了20万颗恒星的亮度,寻找这种由行星引起的特征信号
机器学习是教授计算机识别特殊模式的方式,对于大量数据的处理尤其有用。关键在于让计算机根据样本自己学习,而不是用特定的规则编程。
谷歌的研究人员Chrirs Shallue与德克萨斯州大学奥斯汀分校(UT Austin)的天体物理学家Andrew Vanderburg合作,将机器学习技术送到太空,教它如何识别遥远恒星周围的行星。
在含有15000个标有开普勒信号的数据集中,研究人员创建了一个TensorFlow模型来区别行星与非行星。为了做到这一点,模型必须学会区分由行星引起的变化和其他天体(如星斑或双子星)引起的变化之间的区别。当我们拿数据集之外的信号测试模型时,它辨别行星的正确率高达96%。这就成了!
将机器学习模型应用之后,研究人员为了缩小搜索范围,观测了已知的670颗恒星,它们都容纳了两颗以上的系外行星。在这一过程中,我们发现了两颗新的行星:开普勒80g和开普勒90i。而后者正式开普勒90恒星的第八颗行星,这也使开普勒90成为太阳系外的第一个拥有8颗行星的星系。
关于开普勒90i,它只有地球体积的30%,表面温度高达华氏800度(约为426摄氏度),所以并不是个宜居的星球。它的公转周期为14天,也就是说人类如果在那里,两个星期就要过次生日。
探索的脚步并未到此为止,目前科学家们只是观察了2万颗恒星中的670颗,也许未来,机器学习还将发现更多未知的行星。
开普勒90星系与太阳系对比
机器学习模型论文地址:www.cfa.harvard.edu/~avanderb/kepler90i.pdf
原文地址:blog.google/topics/machine-learning/hunting-planets-machine-learning/
领取专属 10元无门槛券
私享最新 技术干货