特征归因直接识别输入特征对模型输出的重要性,而反事实解释探索输入空间中的最小且有意义的扰动,以回答输入值的哪些变化可能会影响模型的预测。...尽管已有许多关于XAI的综述文章或书籍章节 [2, 5, 11, 14, 14, 21, 26, 30, 51,58, 73, 85],但大多数仅简要描述并展示了XAI的某个特定子领域,如基于梯度的特征归因的早期工作...基于不同的方法论途径,特征归因包含以下研究分支:基于扰动的方法 [16, 17, 95]、基于替代的方法 [25, 70]、基于分解的方法 [6, 8, 59, 60] 以及基于梯度的方法 [79, 81...由于缺乏真实基准,特征归因方法可能会产生不同的解释,这导致了确定哪个解释更可信的挑战。基于梯度的解释是有意设计来满足某些公理化原则的,例如敏感性和完整性,确保产生合理且期望的解释。...1.2 我们的贡献
我们综述的贡献总结如下:
我们提出了一个新颖的分类体系,系统地将基于梯度的特征归因分为四组。随后,我们介绍了每组算法的研究动机和技术细节的要点。