PART 01
文章信息
题目: A machine learning approach to identifying perovskite materials in A₂BB′X₆ compounds
作者: Yuxin Zhan;Xiaojie Ren;Jing Yi;Shuai Zhao;Zhanglin Guo
单位: 重庆理工大学物理与新能源学院;重庆市新能源储能材料与器件重点实验室;九州大学国际碳中和能源研究所
期刊: Journal of Materials Chemistry C,2025年,13卷,22354–22364
DOI: https://doi.org/10.1039/d5tc03018h
PART 02
一句话亮点
仅基于 元素统计特征 构建机器学习模型,即可 以 92.1% 的准确率判别 A₂BB′X₆ 化合物是否形成钙钛矿结构 ,显著降低实验与计算筛选成本。
PART 03
研究背景与科学问题
A₂BB′X₆ 型双钙钛矿因其在光电、能源转化和催化领域的应用潜力而备受关注,但 并非所有满足化学计量比的化合物都能形成钙钛矿结构 ,实际中常生成非钙钛矿相。 传统判据(如 Goldschmidt 容忍因子、Bartel 因子)主要针对 ABX₃ 体系, 忽略了 B′ 位阳离子的关键作用 ,在 A₂BB′X₆ 体系中预测准确性受限。
本研究聚焦核心问题:
如何在 不依赖复杂 DFT 计算或实验合成 的前提下,快速判别 A₂BB′X₆ 是否形成钙钛矿结构?
哪些 原子层面的统计特征 主导了双钙钛矿结构的形成?
PART 04
技术原理与创新点
数据集构建
整合 Materials Project 数据库与文献数据,建立包含 1902 种 A₂BB′X₆ 化合物 (钙钛矿/非钙钛矿)的高质量数据集。
特征工程策略
从 A、B、B′、X 四个晶位提取 Shannon 离子半径、电子亲和能、原子体积等 19 个原子统计特征 ,并基于配位数与高自旋假设进行统一处理。
特征筛选与建模
采用 mRMR 方法与 Gradient Boosting 分类器筛选出 6 个最优特征子集;
对比 CatBoost、Gradient Boosting、Random Forest 与 TabPFN 四类模型。
模型可解释性
引入 SHAP(Shapley Additive Explanations),定量揭示不同晶位特征对结构形成概率的贡献。
创新点在于:提出一种 仅依赖成分信息的、可解释的结构形成性判别框架 ,专门面向 A₂BB′X₆ 双钙钛矿体系。
PART 05
实验验证与性能
最佳模型性能(Gradient Boosting)
准确率(Accuracy): 92.1%
AUC: 0.924
5 折交叉验证 AUC:0.93–0.96
关键影响特征(SHAP 分析)
B 位 Shannon 半径(SrB)与 B′ 位电子亲和能 对是否形成钙钛矿影响最大;
A 位离子半径较大(SrA > 1.3 Å)有利于钙钛矿稳定。
模型外推验证
对 10 种文献中已实验验证的新材料进行预测, 9 种钙钛矿与 1 种非钙钛矿均被正确判别 (100% 一致)。
PART 06
学术贡献
构建了 首个专门针对 A₂BB′X₆ 结构形成性的机器学习判别模型;
证明 简单原子统计特征即可实现高精度结构预测;
揭示了 B / B′ 位阳离子在双钙钛矿形成中的主导作用;
为 数据驱动的钙钛矿材料设计 提供了可解释的新范式。
PART 07
局限性与未来方向
当前模型主要针对“是否形成钙钛矿结构”, 未区分不同对称性或畸变类型;
尚未直接预测热力学稳定性或能带性质;
未来可结合 DFT 能量标签、多任务学习 ,实现结构–性能一体化预测。
PART 08
总结
该工作展示了机器学习在双钙钛矿结构筛选中的强大潜力:无需复杂计算,仅凭成分与原子统计特征即可高效、可靠地预测 A₂BB′X₆ 是否形成钙钛矿结构。该方法为大规模材料空间筛选和新型无铅钙钛矿的快速发现提供了重要工具,对材料信息学与功能材料设计具有显著启示意义。
PART 09
图文赏析
图1 :研究整体流程图:数据收集 特征工程 模型训练 结构判别。
图2 :A₂BB′X₆ 数据集中不同 X 位阴离子分布及钙钛矿/非钙钛矿比例。
图4 :不同模型的 ROC 曲线与 Gradient Boosting 模型的混淆矩阵。
图5 :基于 SHAP 的特征重要性排序与全局解释结果。
图7 :Ba₂BiVO₆ 与 Ca₂BiVO₆ 的 SHAP force plot,对比 A 位阳离子对结构形成的决定性影响。