

物质科学
Physical science


近日,吉林大学张立军课题组与新加坡国立大学Shen Lei课题组合作,在Cell Press细胞出版社旗下期刊Matter & Light在线发表题为“Motif-to-spectrum learning enables interpretable discovery and inverse design of optical absorbers”的研究论文。团队提出了一种新型谱学习框架SpecGAT,开展了对55万种候选材料的高效光吸收性能评估,并进一步与生成模型融合,实现了以目标光谱为导向的光吸收材料逆向设计新范式。


▲长按图片识别二维码阅读原文
研究背景:
光吸收谱是表征光电材料性能的核心指纹,刻画了材料在不同光子能量下捕获光子的能力,直接决定其在太阳能转换、光探测与光催化等领域的应用潜力。尽管基于第一性原理的计算方法能够高精度预测光吸收谱,但其高昂的计算成本严重制约了在大规模材料空间中的高通量筛选。近年来,机器学习在材料科学中迅猛发展,已成功用于预测带隙、形成能等标量性质,甚至实现晶体结构的逆向生成;然而,面向连续、高维且物理信息丰富的光谱数据的建模仍面临严峻挑战——现有方法或难以兼顾光谱细节的准确性,或缺乏与材料结构生成的有效耦合,导致“从光谱到材料”的逆向设计路径尚未打通。
针对这一瓶颈,吉林大学张立军课题组与新加坡国立大学Shen Lei课题组合作,提出了一种新型谱学习框架SpecGAT(spectra-focused graph attention network),开展了对55万种候选材料的高效光吸收性能评估,并进一步与生成模型融合,实现了以目标光谱为导向的光吸收材料逆向设计新范式。文章发表于Matter & Light第一期。
成果介绍:
在数据层面,由于现有材料数据库鲜有光吸收谱标签,因此作者通过高通量计算构建了包含1859个八面体基元半导体的光吸收谱数据集。
在模型层面,这项工作提出了一个预测光吸收谱的多层注意力图神经网络SpecGAT。模型以材料的晶体结构和电子带隙共同作为输入,通过捕捉结构基元+电子先验信息引导,在与E(3)NN、CGCNN、M3GNet的横向对比中实现了最高精度(图1)。

图 1 模型准确性评估结果。
作者首先利用训练好的模型做快速的材料预测与筛选(图2)。通过对GNoMe中约55万个候选晶体中的半导体进行光吸收谱预测,识别出在近红外、光伏和紫外区域的百种潜在强光吸收材料,为未来的材料数据挖掘和理论分析提供了支撑。

图 2 基于GNoMe数据库的光吸收材料预测与筛选结果。
与上述“直接预测并筛选”互补的问题是,能否将谱模型与结构生成模型结合起来实现材料的逆向设计。作者将SpecGAT学习到的材料表示作为一种衡量光吸收强度的编码,此编码被作为生成模型的目标条件指导晶体结构生成,最终获得了几十种具有强光吸收性质的新型铋基硫族化合物(图3)。

图 3 铋基硫族化合物的逆向生成结果。
总之,这项工作不仅成功实现了面向光吸收谱的数据库级高通量材料性能预测与高效筛选,更进一步将谱学习模型与生成式人工智能深度融合,构建了“目标光谱 → 晶体结构”的逆向设计通路。这种数据驱动的机器学习框架有望被推广到其他类型的功能材料研究中。

相关论文信息

原文刊载于Cell Press细胞出版社
旗下期刊Matter & Light,
点击“阅读原文”或扫描下方二维码查看文章

▌论文标题:
Motif-to-spectrum learning enables interpretable discovery and inverse design of optical absorbers
▌论文网址:
https://www.sciencedirect.com/science/article/pii/S3117584826000128
▌DOI:
https://doi.org/10.1016/j.matlit.2026.100012