我使用的是LightGBM 2.0.6 Python API。我的训练数据有大约80K个样本和400个特征,我正在训练一个大约2000次迭代的模型,该模型用于多类分类(#classes = 10)。当训练模型时,当我调用model.feature_importance()
时,我遇到了分段错误。
我尝试生成用于测试的人工数据(具有相同数量的样本、类、迭代和超参数),并且我可以成功地获得特征重要性列表。因此,我怀疑问题是否会发生取决于训练数据。
我想看看是否有人遇到了这个问题,如果是的话,它是如何克服的。谢谢。
发布于 2017-08-28 07:12:54
这是LightGBM中的一个错误;2.0.4没有这个问题。它也应该在LightGBM master中修复。所以要么降级到2.0.4,等待下一个版本,要么使用LightGBM master。
问题实际上取决于训练数据;只有在训练的集成中有“恒定”树时,即只有一片叶子的树没有任何分裂时,才会出现feature_importances分段错误。
https://stackoverflow.com/questions/45913233
复制相似问题