我需要知道如果我已经在火车数据上安装了我的机器学习模型,我将如何知道。我所使用的性能指标是Logistic损失。这些特征的稳定性是否影响我的模型的性能?如果是的话,它们之间有什么关系?
发布于 2020-10-13 05:59:09
你需要寻找不同的训练损失,交叉验证和测试损失。如果这些值较低,则意味着该模型的性能相当好。理想情况下,训练损失应大致等于交叉验证和测试损失。否则,该模型可能过于合适。
这种差异也暗示了训练数据点与交叉验证和测试数据点之间的不明显重叠。这些特征据说是不稳定的。在这种情况下,模型只能看到训练数据中的数据点,而不能看到交叉验证和测试数据中的数据点,从而过度拟合。因此,它的性能很差。您可以通过计算交叉验证和测试数据中的数据点的百分比来验证这一点,这些数据点来自培训数据集中的数据,用于处理数据集中的不同功能。
https://datascience.stackexchange.com/questions/83932
复制相似问题