文章/答案/技术大牛

发布

制作平均查准率-召回率曲线，曲线图显示不正确

制作平均查准率-召回率曲线（Average Precision-Recall Curve）是评估分类模型性能的一种重要方法。如果曲线图显示不正确，可能是由于以下几个原因导致的：

基础概念

查准率（Precision）：预测为正类的样本中实际为正类的比例。 召回率（Recall）：实际为正类的样本中被正确预测为正类的比例。 平均查准率（Average Precision, AP）：在不同的召回率下计算查准率的平均值。

类型与应用场景

二分类问题：最常见的应用场景。
多分类问题：可以通过一对多的方式扩展应用。

可能的问题及原因

数据预处理错误：标签或预测值可能被错误处理。
排序错误：模型预测概率的排序不正确。
插值方法不当：计算AP时使用的插值方法可能不合适。
绘图库问题：使用的绘图库可能存在bug或配置错误。

解决方法

以下是一个Python示例代码，展示如何正确计算和绘制平均查准率-召回率曲线：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import precision_recall_curve, average_precision_score

# 假设y_true是真实标签，y_scores是模型预测的概率
y_true = np.array([0, 1, 1, 0, 1, 0, 1, 0, 1, 1])
y_scores = np.array([0.1, 0.4, 0.35, 0.8, 0.6, 0.2, 0.7, 0.9, 0.5, 0.65])

# 计算查准率和召回率
precision, recall, _ = precision_recall_curve(y_true, y_scores)

# 计算平均查准率
average_precision = average_precision_score(y_true, y_scores)

# 绘制曲线
plt.figure()
plt.step(recall, precision, color='b', alpha=0.2, where='post')
plt.fill_between(recall, precision, step='post', alpha=0.2, color='b')
plt.xlabel('Recall')
plt.ylabel('Precision')
plt.ylim([0.0, 1.05])
plt.xlim([0.0, 1.0])
plt.title('AP={0:0.2f}'.format(average_precision))
plt.show()

检查步骤

验证数据：确保y_true和y_scores的值是正确的。
检查排序：确认y_scores是按降序排列的。
使用标准库：尽量使用成熟的库函数如sklearn.metrics中的方法。
调试绘图：如果曲线仍然不正确，尝试单独打印出precision和recall的值，检查其合理性。

通过以上步骤，通常可以找到并解决曲线图显示不正确的问题。如果问题依然存在，建议进一步检查数据源和模型输出的细节。

制作平均查准率-召回率曲线，曲线图显示不正确

、、

我正在尝试制作一个基于https://stats.stackexchange.com/questions/186337/average-roc-for-repeated-10-fold-cross-validation-with-probability-estimates

浏览 17提问于2021-10-29得票数 0

回答已采纳

1回答

如何使用CNN (Keras)计算多类的一对一ROC

、、、、

我可以得到一条vs rest曲线，但我想要一对一。以下是我的代码片段。('Receiver operating characteristic (ROC)')plt.show() 这段代码生成一条vs rest曲线，但是我想要得到像这样的曲线，picture可以这样做吗？

浏览 74提问于2020-12-03得票数 0

2回答

聚合精度-召回曲线与精度-召回曲线的差异

、、

在信息检索的背景下，像这样的一些论文谈到了聚合精度-召回曲线(参见图3)。这些曲线与Precision-Recall曲线有什么不同？这篇文章的作者似乎对这两种曲线有所不同，因为他们将图4中显示的曲线描述为精确召回曲线，而不是聚合的精确召回曲线(参见4.5节)。

浏览 0提问于2017-04-24得票数 0

2回答

为什么F度量是调和平均值，而不是精确度和召回率度量的算术平均值？

、、

当我们同时考虑精度和召回率来计算F度量时，我们取这两个度量的调和平均值，而不是简单的算术平均值。取调和平均值而不是简单平均值背后的直观原因是什么？

浏览 127提问于2014-10-14得票数 107

回答已采纳

2回答

在阅读了各种解释平均精度(mAP)和回忆的资料后，我对茧中使用的“最大检测”参数感到困惑。根据我所理解的(例如、或)，人们通过计算精确性和对各种模型分数阈值的回忆来计算mAP。这给出了查全率曲线，并计算了mAP作为该曲线下面积的近似值。或者，用定义的召回范围内最大精度的平均值(0:0.1:1)来表示。然而，cocoapi似乎计算出一个给定数量的最高检测值(maxDet)的精确性和召回率，并且得分最高。并由此得到maxDets = 1, 10, 100的查全率曲

浏览 5提问于2018-10-16得票数 19

回答已采纳

1回答

sklearn.metrics.precision_recall_curve中的估计概率(Probas_pred)是多少？

、、

我认为为了计算精度和召回率，我们需要真实标签(y_true)和预测标签(y_predict)。那么为什么sklearn需要probas_pred呢？如何从y_predict获取probas_pred？

浏览 0提问于2020-04-15得票数 0

1回答

选择ROC/AUC还是精确/召回曲线？

、、、

我试图清楚地了解各种分类指标，包括知道什么时候选择ROC/AUC，而不是选择精确/召回曲线。我正在阅读Aurélien Géron的手-使用Scikit的机器学习-学习和TensorFlow的书 (第92页)，其中说明如下：由于中华民国的曲线与查准率/召回(或PR)曲线是如此相似，你可能想知道如何决定使用哪条曲线它显示了PR曲线和ROC曲线，其中反映了上述ROC对不平衡数据集的偏差:

浏览 0提问于2021-12-28得票数 4

回答已采纳

1回答

损失是坏的，但准确性增加了？

、、

我对图像有多个分类问题。有5个(不平衡)类，我使用不同的类权重。一般来说，每堂课只有几张训练图像：~56-238。由此产生的丢失/准确性图表看起来有点奇怪(编辑:第二个图表包含术语“测试丢失”，但它是“验证损失”)：📷非常感谢

浏览 0提问于2018-11-20得票数 1

回答已采纳

1回答

如何计算BCubed的精度和召回

、、、

根据本文发布的页面BCubed查准率和召回率，F1测度计算是评价聚类性能的最佳方法。请参阅据我所知，我们计算了每一项的精确性和召回量，然后取其总和的平均值？总体BCubed精度是分布中所有项目的平均精度。由于平均值是按项目计算的，因此没有必要根据集群或类别的大小进行加权。BCubed召回类似，将“集群”替换为“类别”。

浏览 1提问于2016-04-06得票数 2

3回答

为什么F度量对于分类任务来说是首选的？

、、、、

F-度量是精度和回忆的调和平均值。下面是一个不同方法的情节。📷几何$= \sqrt{精度\cdot召回}$我问这个问题的原因是，我需要决定在NLG任务中使用哪一个平均值，在哪里我测量了 BLEU 和 ROUGE (BL

浏览 0提问于2018-08-12得票数 12

1回答

为什么KNN精度低，但精度高？

、、、

如果是的话，高精度的分类器需要生成高的真正，这将导致高精度，但是than是如何以太低的真阳性率产生高精度的？

浏览 4提问于2014-02-04得票数 1

回答已采纳

1回答

在训练完成后，如何将总体的“精度”和“召回”指标添加到"tensorboard“日志文件中？

、、、、

训练完成后，我在我的网络上做了预测，我想计算我的模型的“精度”和“召回率”，然后将其发送到"tensorboard“的日志文件中，以显示曲线图。

浏览 5提问于2018-08-24得票数 1

1回答

Google Cloud Platform - Vertex AI -有没有一种方法来查看一段时间内的训练性能图表？

、

我想知道在整个培训过程中，培训效果是如何变化的。有没有办法通过Vertex AI automl服务访问它？

浏览 13提问于2021-11-30得票数 0

1回答

不平衡数据集对F1评分的影响

、、

我在这个网站上读到过，如果数据集不平衡，如果你想在回忆和进进之间寻求平衡的话，建议使用F1评分。请您解释一下F1如何在不平衡的数据集方面有用吗？

浏览 0提问于2021-12-14得票数 5

2回答

绘制阈值(precision_recall曲线) matplotlib/sklearn.metrics

、、、

我正在尝试绘制我的查准率/召回率曲线的阈值。我只是使用了MNSIT的数据，示例来自于“使用scikit学习机器学习-学习，keras和TensorFlow”这本书。尝试训练模型来检测5的图像。我已经为训练集建立了混淆矩阵，并计算了精确度和召回值，以及阈值。我已经绘制了pre/rec曲线，书中的示例说明要添加轴标签、ledged、网格和高亮显示阈值，但在书中我在下面放置了一个星号的代码被删掉了。除了如何将阈值显示在图中之外，我能够计算

浏览 53提问于2021-01-31得票数 3

回答已采纳

1回答

我们可以使用F-measure，精度，召回率，以及排名检索结果吗？

、、、

我正在使用Indri和TrecEval，我想知道我们是否可以使用F-measure，精度，召回率，以及排名检索结果。如果是，F度量是什么.将意味着什么？

浏览 1提问于2018-03-18得票数 0

1回答

用于目标检测的顶点-AI AutoML平均精度度量

、、

评价结果如下同时，我还附上了精确召回曲线。在这里，我对指标有一些疑问。在给定的置信度和IoU阈值下报告查全率和召回率，对吗？

浏览 6提问于2022-10-12得票数 0

3回答

理解文本数据的分类器性能

、、、、

我正在处理一个多标签文本分类问题(总目标标签90)。数据分布具有长尾和类不平衡的特点，记录在1900 K左右。目前，我正在做一个小样本，样本大约有100000份，目标分布相似，我使用的是高龄津贴策略(一项针对所有人)。我在数据上尝试过许多算法。我使用HashingVectorizer(特征数2**20，字符分析器)生成特征，使用TSVD降低维数(n_components=200)。 LinearSVC

浏览 0提问于2020-04-17得票数 7

1回答

用平均精度作为不平衡问题的度量(学习曲线实例)

、、、

我有一个不平衡的问题(2%的目标类)，因此需要一个适当的度量-所以我选择了average_precision。cv = StratifiedKFold(n_splits=3, shuffle=True, random_state=42) estimator, X, y, cv=cv, n_jobs=2, train_sizes=train_sizes, scoring= 'average_precision') train_scores_mean =

浏览 0提问于2020-12-15得票数 -1

2回答

从边距图中删除分类x轴名称

、

我想输出一个从边际包返回的平均边际效果的曲线图。变量位于x轴上，但它们的顺序不正确，并且不显示所有变量名称。我想以正确的顺序显示所有变量名，并旋转90度。

浏览 0提问于2019-11-27得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

制作平均查准率-召回率曲线，曲线图显示不正确

基础概念

相关优势

类型与应用场景

可能的问题及原因

解决方法

检查步骤

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐