首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    NC:数据泄漏会夸大基于连接的机器学习模型的预测性能

    预测建模是神经影像学中识别大脑行为关系并测试其对未见数据的普遍适用性的核心技术。然而,数据泄漏破坏了训练数据和测试数据之间的分离,从而破坏了预测模型的有效性。泄漏总是一种不正确的做法,但在机器学习中仍然普遍存在。了解其对神经影像预测模型的影响可以了解泄露如何影响现有文献。在本文中,我们在4个数据集和3个表型中研究了5种形式的泄漏(包括特征选择、协变量校正和受试者之间的依赖)对基于功能和结构连接组的机器学习模型的影响。通过特征选择和重复受试者产生的泄漏极大地提高了预测性能,而其他形式的泄漏影响很小。此外,小数据集加剧了泄漏的影响。总体而言,我们的结果说明了泄漏的可变影响,并强调了避免数据泄漏对提高预测模型的有效性和可重复性的重要性。

    01
    领券