首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在F1宏分数计算过程中忽略折叠

是指在计算F1宏分数时,忽略了折叠(或称为不平衡)的情况。F1宏分数是一种常用的评估指标,用于衡量分类模型在多个类别上的综合性能。

在计算F1宏分数时,通常会将每个类别的预测结果与真实标签进行比较,然后计算每个类别的精确率(Precision)和召回率(Recall),最后取所有类别的精确率和召回率的平均值作为F1宏分数。

然而,在某些情况下,不同类别的样本数量可能存在不平衡,即某些类别的样本数量远远大于其他类别。这种情况下,计算F1宏分数时会受到折叠问题的影响。折叠问题指的是在计算平均精确率和召回率时,样本数量较多的类别会对平均值产生更大的影响,从而导致对样本数量较少的类别的评估结果不准确。

为了解决折叠问题,可以使用F1微分数(F1 Micro Score)来代替F1宏分数。F1微分数是将所有类别的预测结果和真实标签合并后计算的精确率和召回率,然后再计算F1分数。这样可以避免折叠问题,因为每个样本都被视为同等重要。

总结起来,忽略折叠是在F1宏分数计算过程中不考虑不平衡样本数量对评估结果的影响。而使用F1微分数可以解决折叠问题,确保每个样本都被平等对待。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • Nat Methods | OpenFold:对AlphaFold2重新训练提供了关于其学习机制和泛化能力的新见解

    今天为大家介绍的是来自Mohammed AlQuraishi团队的一篇论文。AlphaFold2凭借极高的蛋白质结构预测准确性,彻底改变了结构生物学。然而,其实现方式缺乏训练新模型所需的代码和数据。这些对于解决新任务(如蛋白质-配体复合物结构预测)、研究模型的学习过程以及评估模型在未见过的折叠空间区域的泛化能力都是必要的。在此,作者介绍了OpenFold,这是一种快速、高效且可训练的AlphaFold2实现。作者从零开始训练OpenFold,达到了与AlphaFold2相同的准确性。在此基础上,作者发现OpenFold在泛化能力上表现出色,即使训练集的规模和多样性被刻意限制,包括几乎完全排除某些二级结构元素类别的情况。通过分析训练过程中产生的中间结构,作者还获得了OpenFold在折叠学习过程中层次化方式的见解。总之,作者的研究展示了OpenFold的强大和实用性,并相信其将成为蛋白质建模领域的重要资源。

    02

    Bioinformatics|利用进化概况、突变耦合和二维迁移学习改进了RNA二级结构和三级碱基配对预测

    今天给大家介绍Jaswinder Singh等人在Bioinformatics上发表的文章”Improved RNA secondary structure and tertiary base-pairing prediction using evolutionary profile, mutational coupling and two-dimensional transfer learning”。最近发现的许多非编码RNA(特别是长非编码RNA)改变了我们对RNA在生物体中作用的看法,但是由于现有的实验技术无法有效地解决高分辨率的二级和三级结构,阻碍了我们对它们的理解。另一方面,通过对大量近似数据的深度学习,然后是对高分辨率三维结构的金标准碱基配对结构的迁移学习,对RNA二级结构的计算预测进行了急需的改进。本文将这种基于单序列的学习扩展到使用进化概况和突变耦合,不仅可以大大改进规范碱基对(RNA二级结构),而且可以进一步改进与三级碱基对相关的碱基对,如pseudoknots, non-canonical 和 lone 碱基对。特别的,本文模型对1000多个同源序列RNA预测非常精确,得到大于0.8的F1-score,本文通过结合没有任何修改的人工的,但功能相同的同源序列,显著提高了碱基配对预测。总体上来说,本文的全自动方法为科学界提供一个新的强大工具,不仅可以捕获二级结构,而且可以捕获用于构建三维模型的三级碱基配对信息,它还强调了通过使用大量的自然和/或人工同源序列来精确解决碱基配对结构的未来。

    01
    领券