开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ROC曲线完美，但预测精度不高

ROC曲线（Receiver Operating Characteristic curve）是一种用于评估分类模型性能的工具，它展示了在不同分类阈值下，真阳性率（True Positive Rate）与假阳性率（False Positive Rate）之间的关系。ROC曲线的完美表示模型在所有分类阈值下都能实现100%的真阳性率和0%的假阳性率，即曲线沿着左上角的边界移动。

然而，即使ROC曲线完美，预测精度仍可能不高。预测精度是指模型在预测中的准确性，通常通过计算准确率、召回率、F1分数等指标来衡量。如果预测精度不高，可能是由于以下原因：

数据质量：模型的预测精度受到训练数据的质量影响。如果训练数据存在噪声、缺失值或不平衡问题，模型的预测精度可能会降低。解决方法包括数据清洗、特征选择和数据平衡技术等。
特征选择：选择合适的特征对于提高模型的预测精度至关重要。特征选择可以通过统计方法、特征重要性评估或领域知识来完成。选择与目标变量相关性强的特征可以提高模型的预测能力。
模型选择：不同的模型适用于不同的问题和数据集。选择合适的模型可以提高预测精度。常见的分类模型包括逻辑回归、支持向量机、决策树、随机森林等。腾讯云提供了多种机器学习相关产品，如腾讯云机器学习平台（https://cloud.tencent.com/product/tcmlp）和腾讯云自然语言处理（https://cloud.tencent.com/product/nlp）等。
参数调优：模型的参数设置对于模型的预测精度有重要影响。通过调整模型的参数，可以优化模型的性能。腾讯云提供了自动调参工具，如腾讯云机器学习平台的超参优化功能，可以帮助用户自动搜索最佳参数组合。
数据量和样本分布：模型的预测精度通常受到数据量和样本分布的影响。如果数据量较小或样本分布不均衡，模型可能无法充分学习到数据的特征。解决方法包括增加数据量、数据增强和样本平衡技术等。

总结起来，要提高预测精度，需要关注数据质量、特征选择、模型选择、参数调优以及数据量和样本分布等因素。腾讯云提供了多种相关产品和服务，可以帮助用户在云计算环境中进行数据处理、模型训练和预测等任务。

相关搜索:ROC曲线和精度召回曲线 Python指标ROC曲线:直方图的负预测价值？在R中绘制ROC曲线时预测错误？良好的训练精度和验证精度，但预测精度较差用于完美标签的ROC曲线由包ROCR颠倒地产生部署CNN:高训练和测试精度但低预测精度 Keras模型精度较高，但预测能力较差每次精度都很高，但结果预测是错误的如何评估分类器的精度，并在GridSearchCV中留下一条roc曲线？Tensorflow官方MNIST模型训练精度高但预测性能低随机森林的ROC曲线在R中使用pROC拟合对象，以正“投票”或负“投票”作为预测器

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

贾尚文_roc指标详解及实战用法

其中，TP(真正，True Positive)表示真正结果为正例，预测结果也是正例；FP(假正，False Positive)表示真实结果为负例，预测结果却是正例；TN（真负，True Negative）表示真实结果为正例，预测结果却是负例；FN（假负，False Negative）表示真实结果为负例，预测结果也是负例。显然，TP+FP+FN+TN=样本总数。

04

入门 | 机器学习模型的衡量不止准确率：还有精度和召回率

选自Medium 作者：William Koehrsen 机器之心编译参与：Nurhachu Null、刘晓坤我们倾向于使用准确率，是因为熟悉它的定义，而不是因为它是评估模型的最佳工具！精度（查准率）和召回率（查全率）等指标对衡量机器学习的模型性能是非常基本的，特别是在不平衡分布数据集的案例中，在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。 GitHub 地址：https://github.com/WillKoehrsen/Data-Analysis/blob/master/recall_pre

05

『干货』机器学习算法常用性能指标

机器学习算法常用性能指标总结考虑一个二分问题，即将实例分成正类（positive）或负类（negative）。对一个二分问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实例是负类被预测成正类，称之为假正类（False positive）。相应地，如果实例是负类被预测成负类，称之为真负类（True negative）,正类被预测成负类则为假负类（false negative）。　　- TP：正确肯定的数目；　　- FN：漏报，没有正确找到的

04

【干货】不止准确率：为分类任务选择正确的机器学习度量指标（附代码实现）

【导读】本文是数据科学研究者William Koehrsen撰写的技术博文，介绍了在分类模型中需要用到的度量标准。我们知道，准确率是我们在分类任务中最常用到的度量指标，但是单纯的准确率并不能说明模型的

07

【机器学习】算法性能评估常用指标总结

考虑一个二分问题，即将实例分成正类（positive）或负类（negative）。对一个二分问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实例是负类被预测成正类，称之为假正类（False positive）。相应地，如果实例是负类被预测成负类，称之为真负类（True negative）,正类被预测成负类则为假负类（false negative）。

01

机器学习算法常用指标总结

机器学习性能评价标准是模型优化的前提，在设计机器学习算法过程中，不同的问题需要用到不同的评价标准，本文对机器学习算法常用指标进行了总结。

03

机器学习算法常用指标总结

来自：Poll的笔记链接：http://www.cnblogs.com/maybe2030/p/5375175.html（点击尾部阅读原文前往）阅读目录 1、TPR、FPR&TNR 2、精确率Precision、召回率Recall和F1值 3、综合评价指标F-measure 4、ROC曲线和AUC 考虑一个二分问题，即将实例分成正类（positive）或负类（negative）。对一个二分问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实

06

机器学习算法常用指标总结

考虑一个二分问题，即将实例分成正类（positive）或负类（negative）。对一个二分问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实例是负类被预测成正类，称之为假正类（False positive）。相应地，如果实例是负类被预测成负类，称之为真负类（True negative）,正类被预测成负类则为假负类（false negative）。

02

精确率、召回率、TPR、ROC...... | 机器学习算法常用指标总结

阅读目录 1. TPR、FPR&TNR 2. 精确率Precision、召回率Recall和F1值 3. 综合评价指标F-measure 4. ROC曲线和AUC 5. 参考内容考虑一个二分问题，即将实例分成正类（positive）或负类（negative）。对一个二分问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实例是负类被预测成正类，称之为假正类（False positive）。相应地，如果实例是负类被预测成负类，称之为真负类（True

ROC曲线与AUC

对于0,1两类分类问题,一些分类器得到的结果往往不是0,1这样的标签,如神经网络,得到诸如0.5,0,8这样的分类结果。这时,我们人为取一个阈值,比如0.4,那么小于0.4的为0类,大于等于0.4的为1类,可以得到一个分类结果。同样,这个阈值我们可以取0.1,0.2等等。取不同的阈值,得到的最后的分类情况也就不同。

02

精度是远远不够的：如何最好地评估一个分类器？

分类模型（分类器）是一种有监督的机器学习模型，其中目标变量是离散的（即类别）。评估一个机器学习模型和建立模型一样重要。我们建立模型的目的是对全新的未见过的数据进行处理，因此，要建立一个鲁棒的模型，就需要对模型进行全面而又深入的评估。当涉及到分类模型时，评估过程变得有些棘手。

03

大数据技术之_19_Spark学习_08_Spark 机器学习_01_机器学习概述 + 机器学习的相关概念 + 算法常用指标

一组数据的集合被称作数据集，用于模型训练的数据集叫训练集，用于测试的数据集叫测试集。一个数据集包含多条数据，一条数据包含多个属性。

02

R语言中绘制ROC曲线和PR曲线

这里，TP表示真阳性的数量（模型正确预测正类），FP表示误报的数量（模型错误地预测正类），FN表示假阴性的数量（模型错误地预测阴性类），TN表示真阴性的数量（模型正确预测阴性类）。

01

模型性能分析：ROC 分析和 AUC

ROC 分析和曲线下面积 (AUC) 是数据科学中广泛使用的工具，借鉴了信号处理，用于评估不同参数化下模型的质量，或比较两个或多个模型的性能。

02

机器学习中评估分类模型性能的10个重要指标

在这篇文章中，我们将学习10个最重要的模型性能度量，这些度量可用于评估分类模型的模型性能。

01

模型性能分析：ROC 与 AUC

ROC 分析和曲线下面积 (AUC) 是数据科学中广泛使用的工具，借鉴了信号处理，用于评估不同参数化下模型的质量，或比较两个或多个模型的性能。

02

又是模型评估？到底怎么评估？『附 AUC 评估的三计算方法』

前面一节提到了模型评估指标中 ROC 的详细概念和四个常见的问题，以后在遇到 ROC 想必再也不会发懵了：聊聊模型评估的事儿，附 roc 常见的四个灵魂发问

01

ROC曲线及AUC值[通俗易懂]

参考文献：【ROC曲线与AUC值】，【ROC，AUC最透彻的讲解（实例分析+matlab代码）】，【AUC计算方法与Python实现】，【AUC曲线计算方法及代码实现】

04

一文让你了解AI产品的测试评价人工智能算法模型的几个重要指标

如何测试人工智能产品越来越受到广大测试工程师的关注，由于人工智能的测试预言（Test Oracle）不是像普通软件产品那么明确，到目前为止，基于大数据的第四代人工智能产品的测试，主要集中在“对大数据测试”“白盒测试”“基于样本分析算法的优劣”以及“对最终产品的验收测试”。“对大数据测试”主要针对数据阶段验证、对数据计算验证和对输出阶段验证；“白盒测试”主要考虑神经元覆盖（Neuron Coverage）、阈值覆盖率（Threshold Coverage）、符号变更率（Sign Change Coverage）、值变更覆盖率（Value Change Coverage）、符号-符号覆盖率（Sign-SignCoverage）和层覆盖（LayerCoverage）这六个指标；“对最终产品的验收测试”可以采用对传统软件验收测试的方法，基于业务来进行测试，比如对于人脸识别系统，是否可以在各个人脸角度变化，光线等条件下正确识别人脸。本文重点讨论的是“基于样本分析算法的优劣”。

02

如何评估机器学习模型的性能

您可以整天训练有监督的机器学习模型，但是除非您评估其性能，否则您永远无法知道模型是否有用。这个详细的讨论回顾了您必须考虑的各种性能指标，并对它们的含义和工作方式提供了直观的解释。

02

使用阈值调优改进分类模型性能

阈值调优是数据科学中一个重要且必要的步骤。它与应用程序领域密切相关，并且需要一些领域内的知识作为参考。在本文中将演示如何通过阈值调优来提高模型的性能。

02

深度学习实战-MNIST数据集的二分类

MNIST数据集是一组由美国高中生和人口调查局员工手写的70,000个数字的图片，每张图片上面有代表的数字标记。

03

使用阈值调优改进分类模型性能

来源：Deephub Imba 本文约2500字，建议阅读7分钟本文将演示如何通过阈值调优来提高模型的性能。阈值调优是数据科学中一个重要且必要的步骤。它与应用程序领域密切相关，并且需要一些领域内的知识作为参考。在本文中将演示如何通过阈值调优来提高模型的性能。用于分类的常用指标一般情况下我们都会使用准确率accuracy来评价分类的性能，但是有很多情况下accuracy 不足以报告分类模型的性能，所以就出现了很多其他的指标：精确度Precision、召回率Recall、F1 分数F1 score和特

02

ROC曲线的理解

考虑一个二分问题，即将实例分成正类（positive）或负类（negative）。对一个二分问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实例是负类被预测成正类，称之为假正类（False positive）。相应地，如果实例是负类被预测成负类，称之为真负类（True negative）,正类被预测成负类则为假负类（false negative）。

01

使用Scikit-learn实现分类（MNIST）

这是我学习hands on ml with sklearn and tf 这本书做的笔记，这是第三章

00

机器学习算法中的F值(F-Measure)、准确率(Precision)、召回率(Recall)

业内目前常常采用的评价指标有准确率(Precision)、召回率(Recall)、F值(F-Measure)等，下图是不同机器学习算法的评价指标。下文讲对其中某些指标做简要介绍。

02

分类的评价指标

知道模型的准确性是必要的，但仅仅了解模型的性能水平还不够。因此，还有其他评估指标可帮助我们更好地了解模型的性能。其中一些指标是精度，召回率，ROC曲线和F1得分。

01

【必备】目标检测中的评价指标有哪些？

上期我们一起学习了全卷积神经网络FCN，今天我们看下目标检测中的评价指标都有哪些？

08

【统计】 ROC曲线(1) - 模型评估首选方案

ROC曲线，也称“受试者工作特征曲线”，主要是用于X对Y的预测准确率情况。最初ROC曲线是运用在军事上，现在更多应用在医学领域，判断某种因素对于某种疾病的诊断是否有诊断价值。

02

趣析逻辑回归模型评价指标

Python 实现的逻辑回归后，不像 SAS 那样会自动给出模型精确度的评价，需要人为操作计算 Python 专属的 AUC (Area Under Curve)，ROC 曲线与 X 轴围成的面积大小反映了模型的精度。本文将着重 AUC 值和 ROC 曲线背后的原理和 Python 代码实现。

01

什么是ROC曲线？为什么要使用ROC?以及 AUC的计算

真正（True Positive , TP）被模型预测为正的正样本；假负（False Negative , FN）被模型预测为负的正样本；假正（False Positive , FP）被模型预测为正的负样本；真负（True Negative , TN）被模型预测为负的负样本。

03

ROC曲线的含义以及画法

ROC的全名叫做Receiver Operating Characteristic（受试者工作特征曲线），又称为感受性曲线（sensitivity curve）。得此名的原因在于曲线上各点反映着相同的感受性，它们都是对同一信号刺激的反应，只不过是在几种不同的判定标准下所得的结果而已。其主要分析工具是一个画在二维平面上的曲线——ROC 曲线。ROC曲线以真正例率TPR为纵轴，以假正例率FPR为横轴，在不同的阈值下获得坐标点，并连接各个坐标点，得到ROC曲线。对于一个分类任务的测试集，其本身有正负两类标签，我们对于这个测试集有一个预测标签，也是正负值。分类器开始对样本进行分类时，首先会计算该样本属于正确类别的概率，进而对样本的类别进行预测。比如说给出一组图片，让分类器判断该图片是否为汉堡，分类器在开始分类前会首先计算该图片为汉堡的概率，进而对该图片的类别进行预测，是汉堡或者不是汉堡。我们用概率来表示横坐标，真实类别表示纵坐标，分类器在测试集上的效果就可以用散点图来表示，如图所示

01

机器学习性能评价指标汇总

AUC 是 ROC (Receiver Operating Characteristic) 曲线以下的面积, 介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏，值越大越好。

02

在不平衡数据上使用AUPRC替代ROC-AUC

来源：DeepHub IMBA本文约2000字，建议阅读7分钟尽管 ROC-AUC 包含了许多有用的评估信息，但它并不是一个万能的衡量标准。 ROC曲线和曲线下面积AUC被广泛用于评估二元分类器的性能。但是有时，基于精确召回曲线下面积 (AUPRC) 的测量来评估不平衡数据的分类却更为合适。本文将详细比较这两种测量方法，并说明在AUPRC数据不平衡的情况下衡量性能时的优势。预备知识——计算曲线我假设您熟悉准确率和召回率以及混淆矩阵的元素（TP、FN、FP、TN）这些基本知识。如果你不熟悉可以搜索我们以

01

《Scikit-Learn与TensorFlow机器学习实用指南》第3章分类

在第一章我们提到过最常用的监督学习任务是回归（用于预测某个值）和分类（预测某个类别）。在第二章我们探索了一个回归任务：预测房价。我们使用了多种算法，诸如线性回归，决策树，和随机森林（这个将会在后面的章节更详细地讨论）。现在我们将我们的注意力转到分类任务上。

01

在不平衡数据上使用AUPRC替代ROC-AUC

ROC曲线和曲线下面积AUC被广泛用于评估二元分类器的性能。但是有时，基于精确召回曲线下面积 (AUPRC) 的测量来评估不平衡数据的分类却更为合适。

02

机器学习模型评估的方法总结（回归、分类模型的评估）

这也是线性回归中最常用的损失函数，线性回归过程中尽量让该损失函数最小。那么模型之间的对比也可以用它来比较。 MSE可以评价数据的变化程度，MSE的值越小，说明预测模型描述实验数据具有更好的精确度。

02

机器学习：准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线

增注：虽然当时看这篇文章的时候感觉很不错，但是还是写在前面，想要了解关于机器学习度量的几个尺度，建议大家直接看周志华老师的西瓜书的第2章：模型评估与选择，写的是真的很好！！

02

评价指标 | ROC曲线和AUC面积理解

很多学习器是为测试样本产生一个实值或概率预测，然后将这个预测值与一个分类阈值进行比较，若大于阈值则分为正类，否则为反类。例如，神经网络在一般情形下是对每个测试样本预测出一个[0.0，1.0]之间的实值，然后将这个值与阈值0.5进行比较，大于0.5则判为正例，否则为反例。这个阈值设置的好坏，直接决定了学习器的泛化能力。

02

《Scikit-Learn与TensorFlow机器学习实用指南》第3章分类

第3章分类来源：ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》翻译项目译者：@时间魔术师校对：@Lisanaaa @飞龙在第一章我们提到过最常用的监督学习任务是回归（用于预测某个值）和分类（预测某个类别）。在第二章我们探索了一个回归任务：预测房价。我们使用了多种算法，诸如线性回归，决策树，和随机森林（这个将会在后面的章节更详细地讨论）。现在我们将我们的注意力转到分类任务上。 MNIST 在本章当中，我们将会使用 MNIST 这个数据集，它有着 70000

07

机器学习评估指标的十个常见面试问题

来源：DeepHub IMBA本文约2700字，建议阅读5分钟本文整理了10个常见的问题。评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模型以及如何优化给定任务的性能做出正确的决定，所以评估指标在机器学习模型的开发和部署中发挥着至关重要的作用。所以评估指标是面试时经常会被问到的基础问题，本文整理了10个常见的问题。 1、你能在机器学习的背景下解释精度和召

02

西瓜书-性能度量

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

01

机器学习分类算法

可是，你能够如数家珍地说出所有常用的分类算法，以及他们的特征、优缺点吗？比如说，你可以快速地回答下面的问题么:

02

来!一起捋一捋机器学习分类算法

可是，你能够如数家珍地说出所有常用的分类算法，以及他们的特征、优缺点吗？比如说，你可以快速地回答下面的问题么:

02

来!一起捋一捋机器学习分类算法

可是，你能够如数家珍地说出所有常用的分类算法，以及他们的特征、优缺点吗？比如说，你可以快速地回答下面的问题么:

03

来!一起捋一捋机器学习分类算法

可是，你能够如数家珍地说出所有常用的分类算法，以及他们的特征、优缺点吗？比如说，你可以快速地回答下面的问题么:

03

收藏 | 来!一起捋一捋机器学习分类算法

可是，你能够如数家珍地说出所有常用的分类算法，以及他们的特征、优缺点吗？比如说，你可以快速地回答下面的问题么:

02

一文读懂机器学习分类算法（附图文详解）

可是，你能够如数家珍地说出所有常用的分类算法，以及他们的特征、优缺点吗？比如说，你可以快速地回答下面的问题么:

02

机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率

同见博客：http://zhwhong.ml/2017/04/14/ROC-AUC-Precision-Recall-analysis/(对Latex公式支持更好) ---- 在分类任务中，人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上，这样的度量错误掩盖了样例如何被分错的事实。在机器学习中，有一个普遍适用的称为混淆矩阵(confusion matrix)的工具，它可以帮助人们更好地了解分类中的错误。比如有这样一个在房子周围可能发现的动物类型的预测，这

06

R语言︱分类器的性能表现评价（混淆矩阵，准确率，召回率，F1,mAP、ROC曲线）

笔者寄语：分类器算法最后都会有一个预测精度，而预测精度都会写一个混淆矩阵，所有的训练数据都会落入这个矩阵中，而对角线上的数字代表了预测正确的数目，即True Positive+True Nagetive。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭