众所周知,电脑能够击败围棋冠军、模拟恒星爆炸并预测全球气候。人们正逐渐将机器训练成无可挑剔的问题解决者和快速学习者。
目前,华中师范大学的物理学家及其合作者已经证实电脑能够用于解决宇宙最大的奥秘。该团队通过输入成千上万的高能粒子碰撞模拟图像来训练电脑识别图像中的重要特征。研究人员将强大的阵列(称为神经网络)编程为一种类似蜂房的数字大脑,用于分析和解释碰撞中留下的颗粒碎片的图像。在这样的测试中,研究人员发现神经网络在识别大约18000张图像的重要特征时,成功率高达95%。
The colored lines represent calculated particle tracks from particle collisions occurring within Brookhaven National Laboratory's STAR detector at the Relativistic Heavy Ion Collider, and an illustration of a digital brain. The yellow-red glow at center shows a hydrodynamic simulation of quark-gluon plasma created in particle collisions. Credit: Berkeley Lab
这项研究成果已于1月15日在《自然-通讯》(Nature Communications)杂志上发表。下一步研究计划是将相同的机器学习过程应用于实际的物理实验数据。
发表在《自然·通讯》的文章
强大的机器学习算法允许神经网络在处理更多图像后改进其分析能力。这项根本技术还被用于面部识别和其他基于图像的物体识别应用。本研究中使用的图像与美国布鲁克海文国家实验室相对论重离子对撞机和欧洲核子研究中心实验室的大型强子对撞机的重离子对撞机实验紧密相关。(ps.这两个实验华中师范大学都参加了。)这些图像再现了亚原子粒子“汤”的状态,这种超高温流体态就是在宇宙诞生后仅存在百万分之一秒的夸克胶子等离子体。
“我们尝试着去发现夸克胶子等离子体最重要的性质”该研究团队中的华中师范大学粒子物理研究所所长王新年教授表示,夸克胶子等离子体的一些性质因为其存在时间极短且发生在极为微小的尺度而蒙上了一层神秘的面纱。
实验中,物理学家通过粒子对撞机粉碎重核,比如粉碎剥离电子后得到的金原子核和铅原子核。这些碰撞会释放出原子核内部的粒子,甚至打破由夸克和胶子紧紧束缚形成的质子和中子,使夸克和胶子处于自由移动的状态,形成一个瞬间的亚原子尺度的火球——夸克胶子等离子体。
研究人员希望通过研究夸克胶子等离子体形成的条件,比如说该状态形成所需要的能量以及它转变成流体状态时的温度和压强,进而在物质组成粒子及性质和宇宙成型阶段的研究这两方面得到新的启发。
但是碰撞中物质相变所涉及的“状态方程”的严格测量的确有极大挑战性。实验中,初始态会影响最后粒子的输出,而从中提取与这些条件无关的状态方程则非常之难。
“核物理领域中的圣杯就是发现高能相互作用中的相变过程并从实验数据中确定状态方程,”王新年教授说道,“这就是我们还得从实验中探索的夸克胶子等离子体最重要的性质。”
据悉,该项最新研究的第一作者庞龙刚,曾是华中师范大学博士后,现为美国加州大学伯克利分校博士后。他介绍说,他是2016年在法兰克福前沿研究所做博后的时候开始对人工智能应用于解决科学问题的潜力产生了兴趣。他与法兰克福高等研究中心的合作者周凯,苏南发现有一类具有深度卷积神经网络的人工智能(AI),这类AI的发明源于动物大脑对图像处理的架构的启发,而且它在处理科学类图像时有很好的适用性。
“这类神经网络能够从相机输入中识别出图样并对运动和位置做出评估”庞龙刚表示,“我们当时就认为,如果我们具有一些可视化的科学数据,我们也许能够得到一个抽象的概念或者有价值的物理信息”
The diagram at left, which maps out particle distribution in a simulated high-energy heavy-ion collision, includes details on particle momentum and angles. Thousands of these images were used to train and test a neural network to identify important features in the images. At right, a neural network used the collection of images to created this "importance map" - the lighter colors represent areas that are considered more relevant to identify equation of state for the quark-gluon matter created in particle collisions. Credit: Berkeley Lab
王新年教授进一步解释说,“我们尝试通过此类机器学习,从众多图样中得到一个与状态方程有关的独特模式或关联”,所以经过训练的神经网络能在图像中精确定位并发现那些与科学家们尝试解决的问题最有联系的关联。
用于分析所需的数据积累需要很强的计算机方面的资源,庞龙刚博士说,因为有时候仅仅得到一个图像就需要花一天的时间去做计算,而当我们使用大量的GPU做并行运算时,我们只需要20分钟就可以得到一个图像。GPU是图形处理部件,最开始开发用于改善电脑游戏体验,至今已被用于很多方面。在他们的研究中,他们大部分的计算工作是在德国GSI和中国华中师范大学的GPU簇群上完成的。华中师范大学即将建成的核物理高性能计算中心的GPU簇群将会为以后的研究提供更加强大的计算能力。
研究人员表示,使用复杂神经网络的好处在于它们能够辨认在最初的实验中都没有发现的特征,这就像实现了大海捞针一样。而且它们还能从模糊的图像中提取有用的信息。
“即使你的图像分辨率较低,你仍然可以得到一些有用的信息”庞龙刚博士说到。
机器学习应用于真实重离子碰撞实验数据分析引起了广泛的讨论,模拟的结果也将有助于解释真实数据。
“机器学习在高能粒子物理领域中将会有很多应用”王新年教授表示,不仅仅是粒子碰撞实验中。
据悉,参与该项研究的还有法兰克福前沿研究所,歌德大学,GSI亥姆霍兹重离子研究中心的Hannah Petersen 和 Horst Stocker 教授。 这项工作得益于美国能源部基础能源科学处,国家科学基金会,Helmholtz协会,GSI,SAMSON AG,歌德大学,中国国家自然科学基金,国家重大基础研究发展计划和亥姆霍兹国际反离子和离子研究设施中心的支持。
领取专属 10元无门槛券
私享最新 技术干货