首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Logistic回归中的混淆矩阵

混淆矩阵(Confusion Matrix)是用于评估分类模型性能的一种矩阵表示方法,常用于二分类问题。在Logistic回归中,混淆矩阵用于衡量模型的预测结果与真实标签之间的差异。

混淆矩阵通常由四个指标组成:

  1. 真正例(True Positive,TP):模型将正例正确地预测为正例的数量。
  2. 假正例(False Positive,FP):模型将负例错误地预测为正例的数量。
  3. 假反例(False Negative,FN):模型将正例错误地预测为负例的数量。
  4. 真反例(True Negative,TN):模型将负例正确地预测为负例的数量。

混淆矩阵的示例:

预测为正例

预测为负例

真实正例

TP

FN

真实负例

FP

TN

混淆矩阵可以帮助我们计算出一系列与分类模型性能相关的指标,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)和 F1 值(F1-Score)等。

  • 准确率:模型正确预测的样本数占总样本数的比例,计算公式为 (TP + TN) / (TP + FP + TN + FN)。
  • 精确率:模型预测为正例的样本中,真正例的比例,计算公式为 TP / (TP + FP)。
  • 召回率:真实正例中,模型预测为正例的比例,计算公式为 TP / (TP + FN)。
  • F1 值:综合考虑精确率和召回率的指标,计算公式为 2 (精确率 召回率) / (精确率 + 召回率)。

混淆矩阵在评估分类模型性能时非常有用,可以帮助我们了解模型的预测能力以及对不同类别的分类情况。在实际应用中,可以根据混淆矩阵的结果进行模型调优或者制定相应的策略。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

分类模型性能评估——以SAS Logistic回归为例: 混淆矩阵

本文从混淆矩阵(Confusion Matrix,或分类矩阵,Classification Matrix)开始,它最简单,而且是大多数指标的基础。...在SASLogistic归中,默认按二分类取值升序排列取第一个为positive,所以默认就是求bad概率。(若需要求good概率,需要特别指定)。...good 0.06789 good good 0.61195 bad good 0.15306 good Confusion Matrix, 混淆矩阵...我们需要知道,这个模型到底预测对了多少,预测错了多少,混淆矩阵就把所有这些信息,都归到一个表里: 预测 1 0 实 1 d, True Positive c, False Negative c+...一些准备 说,混淆矩阵(Confusion Matrix)是我们永远值得信赖朋友: 预测 1 0 实 1 d, True Positive c, False Negative c+d,

2.4K50

多分类任务混淆矩阵

来源: DeepHub IMBA本文约1000字,建议阅读5分钟本文讨论了如何在多分类中使用混淆矩阵评估模型性能。 什么是混淆矩阵? 它显示了实际值和预测值之间差异。...对于多分类来说,它是一个 N * N 矩阵,其中 n 是编号。输出列中类别,也称为目标属性。一二分类任务中包含了 2 个类也就是一个 2*2 矩阵,一般情况下介绍混淆矩阵都会以二分类为例。...那么将得到一个 3*3 矩阵依此类推。通过上面描述我们知道,混淆矩阵类将具有相同数量行和列。...我们将使用一个 3 x 3 矩阵,我们将使用我将向您展示技巧计算 TP、TN、FP、FN 值。这个技巧也可以应用于 4*4、5*5…N*N 矩阵。...考虑这个混淆矩阵在下图 1 中数据集输出列中具有 A、B、C 类。

74640
  • 分类模型评估指标 | 混淆矩阵(2)

    评估指标 01 总体分类精度 指针对每一个随机样本,所分类结果与检验数据类型相一致概率,也就是被正确分类像元总和除以总像元数。放到混淆矩阵中就是对角线上像元数总和除以总像元数目。...放到混淆矩阵中,就是分类器将整幅影像正确分类为A像元数(对角线上A类值)与真实情况下A像元数(真实情况A像元数总和)之比。...放到混淆矩阵中,是分类器将整幅影像正确分类为A像元数和(对角线上A类值)与分类器分出所有A类像元数(预测值为A像元数总和)之比。...04 错分误差 指对于分类结果中某种类型,与参考图像类型不一致概率。放到混淆矩阵中,就是被分类器分为A类像元中,分类出错像元数所占比率。...我们也就不难发现,错分误差+用户精度=1 05 漏分误差 指对于参考图像上某种类型,被分类器分为其他类别的概率。放到混淆矩阵中就是真实情况为A类像元数中有多少像元数被分类器分为了别的类别。

    2.7K30

    分类模型评估指标 | 混淆矩阵(1)

    而不是像小编大一时,面对这些专业性极强东西两眼一抹黑,学习很吃力;此外,基础是延伸和扩展前提,基础东西如果掌握不牢靠,那么在前沿事物钻研过程中也不会取得更大建树。...分类模型评估指标有很多,今天小编给大家准备混淆矩阵。 简介 首先我们来解释一下什么是分类模型评估指标。...其有两种表现形式:定量指标和图表指标;定量指标即以具体数值来表示分类质量;图表指标即以图表形式来表示分类质量,以达到增强可视化评估效果。 我们今天介绍混淆矩阵就是一个图表形式指标。...由以上内容可以获得结论:对于一款分类模型,TP值与TN值数量越多,FP值与FN值数量越少,模型分类精度就越高。 02 样本二级指标 混淆矩阵统计是样本在各个一级指标的数量。...特异度:TN/(TN+FP)=53/(53+20)≈73% 3 ---三级指标 F1 Score=2PR/(P+R)=(2*0.5*0.74)/(0.5+0.74) ≈0.6 以上就是在机器学习领域中混淆矩阵及它所引申出几个评估指标

    78050

    R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化

    本文使用了 R 语言中逻辑回归(logistic)模型,利用国泰安数据库中103个上市公司数据进行信用风险建模,其中包括51个正常公司和52个ST公司。...此外,我们还对模型预测能力进行了评价,绘制了混淆矩阵和ROC曲线,得到了较高AUC值,表明模型具有较好预测效果和识别能力。...可视化混淆矩阵可视化ROC曲线performanedict, real ),  "auc" )@y.values[[1]]从AUC值来看,达到了0.8,因此可以认为模型具有较好预测效果,同时可以看到...重新建立模型同样进行了混淆矩阵和ROC曲线评价,结果显示新模型依然具有较好预测效果和识别能力。残差分析可以对回归模型假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。...异常点检测找到异常点后进行剔除,然后进行建模outlier=c(34,45,94 )混淆矩阵可视化roc曲线performancedict, real ),  "auc" )@y.values[[1]]

    22400

    StatQuest专辑汇总贴

    本系列主要是同StatQuest全视频章节相同,分为:统计基础部分、线性回归、logistic回归、机器学习和高通量测序5个部分,其中还穿插了一些基于R语言实现算法小章节。 1. 统计基础 ?...推送目录概览: 最小二乘法与线性回归 线性回归中R方与R方显著性 线性回归R实现与结果解读 线性回归妙处:t检验与方差分析 设计矩阵(design matrices) 设计矩阵 in R 3.logistic...推送目录概览: 01 Logistic回归概览 02 Logistic归中系数解读 03 最大似然估计法拟合logistic回归曲线 04 Logistic回归:R2与P-value计算 05...饱和模型与偏差计算R方与p值 06 R语言实现logistic回归 4.机器学习模型 ?...以下为本部分内容概览: 01 机器学习简介 02 交叉验证法(cross validation) 03 混淆矩阵(confusion matrix) 04 ROC和AUC 05 pROC包绘制ROC

    95230

    利用python中matplotlib打印混淆矩阵实例

    前面说过混淆矩阵是我们在处理分类问题时,很重要指标,那么如何更好混淆矩阵给打印出来呢,直接做表或者是前端可视化,小编曾经就尝试过用前端(D5)做出来,然后截图,显得不那么好看。。...,放一下你混淆矩阵就可以,当然可视化混淆矩阵这一步也可以直接在模型运行中完成。...补充知识:混淆矩阵(Confusion matrix)原理及使用(scikit-learn 和 tensorflow) 原理 在机器学习中, 混淆矩阵是一个误差矩阵, 常用来可视化地评估监督学习算法性能...通过混淆矩阵, 可以很容易看出系统是否会弄混两个类, 这也是混淆矩阵名字由来....打印混淆矩阵实例就是小编分享给大家全部内容了,希望能给大家一个参考。

    2.8K30

    混淆矩阵及confusion_matrix函数使用

    1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果情形分析表,以矩阵形式将数据集中记录按照真实类别与分类模型作出分类判断两个标准进行汇总。...这个名字来源于它可以非常容易表明多个类别是否有混淆(也就是一个class被预测成另一个class) 下图是混淆矩阵一个例子 ?...其中灰色部分是真实分类和预测分类结果相一致,绿色部分是真实分类和预测分类不一致,即分类错误。...2.confusion_matrix函数使用 官方文档中给出用法是 sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None, sample_weight...=None) y_true: 是样本真实分类结果,y_pred: 是样本预测分类结果 labels:是所给出类别,通过这个可对类别进行选择 sample_weight : 样本权重 实现例子:

    2.2K20

    CNN中混淆矩阵 | PyTorch系列(二十三)

    然后,我们会看到如何使用这个预测张量,以及每个样本标签,来创建一个混淆矩阵。这个混淆矩阵将允许我们查看我们网络中哪些类别相互混淆。...混淆矩阵要求 要为整个数据集创建一个混淆矩阵,我们需要一个与训练集长度相同一维预测张量。...> len(train_set.targets) 60000 一个混淆矩阵将告诉我们模型在哪里被混淆了。更具体地说,混淆矩阵将显示模型正确预测类别和模型不正确预测类别。...建立混淆矩阵 我们构建混淆矩阵任务是将预测值数量与真实值(目标)进行比较。 这将创建一个充当热图矩阵,告诉我们预测值相对于真实值下降位置。...解释混淆矩阵 混淆矩阵具有三个轴: 预测标签(类) 真实标签 热图值(彩色) 预测标签和真实标签向我们显示了我们正在处理预测类。

    5.3K20

    python—结巴分词原理理解,Hmm中转移概率矩阵混淆矩阵

    结巴分词过程: jieba分词python 代码 结巴分词准备工作 开发者首先根据大量的人民日报训练了得到了字典库、和Hmm中转移概率矩阵混淆矩阵。 1....但是现在就不会了,只要把“中国人民”和“中国人民银行”之间节点搜索一遍就行了,大大节省了时间。有句话叫以空间换时间,最适合用来表达这个意思。 2....给定待分词句子, 使用正则获取连续 中文字符和英文字符, 切分成 短语列表, 对每个短语使用DAG(查字典)和动态规划, 得到最大概率路径, 对DAG中那些没有在字典中查到字, 组合成一个新片段短语..., 使用HMM模型进行分词, 也就是作者说识别新词, 即识别字典外新词....这里采用动态规划最优化搜索。

    1.6K50

    python—结巴分词原理理解,Hmm中转移概率矩阵混淆矩阵

    结巴分词过程: jieba分词python 代码 结巴分词准备工作 开发者首先根据大量的人民日报训练了得到了字典库、和Hmm中转移概率矩阵混淆矩阵。 1....但是现在就不会了,只要把“中国人民”和“中国人民银行”之间节点搜索一遍就行了,大大节省了时间。有句话叫以空间换时间,最适合用来表达这个意思。 2....给定待分词句子, 使用正则获取连续 中文字符和英文字符, 切分成 短语列表, 对每个短语使用DAG(查字典)和动态规划, 得到最大概率路径, 对DAG中那些没有在字典中查到字, 组合成一个新片段短语..., 使用HMM模型进行分词, 也就是作者说识别新词, 即识别字典外新词....这里采用动态规划最优化搜索。

    1.4K20

    100天搞定机器学习|Day4-6 逻辑回归

    当我们输入特征,得到hθ(x)其实是这个样本属于1这个分类概率值。也就是说,逻辑回归是用来得到样本属于某个分类概率。 ? ? 2.评价 回想起之前线性回归中所用到损失函数: ?  ...如果在逻辑回归中也运用这种损失函数,得到函数J是一个非凸函数,存在多个局部最小值,很难进行求解,因此需要换一个cost函数。重新定义个cost函数如下: ?...因此我们特征矩阵将是这两列。我们尝试寻找用户年龄与预估薪资之间某种相关性,以及他是否购买SUV决定。 ?...现在我们将评估逻辑回归模型是否正确学习和理解。因此这个混淆矩阵将包含我们模型正确和错误预测。...生成混淆矩阵 from sklearn.metrics import confusion_matrix cm = confusion_matrix(y_test, y_pred) 可视化 from matplotlib.colors

    47560

    机器学习算法之逻辑回归

    —— Arianna Huffington" 逻辑回归(Logistic Regression)是机器学习中一种分类模型。虽然名字中带有「回归」,但它却不是回归算法,而是一种分类算法。...通过以上示例,可以发现其特点,那就是同属于两个类别之间判断。逻辑回归可谓是解决二分类问题利器。 2.原理 要想熟悉逻辑回归,必须掌握以下两点: 1) 逻辑回归中,其输入值是什么?...2) 如何判断逻辑回归输出? 2.1 输入 ? 逻辑回归输入其实就是一个线性回归结果。...当预测结果不准确时,在线性回归中使用了均方误差衡量损失,那么对于逻辑回归,该如何去衡量此损失呢? 3.损失及优化 3.1 损失 逻辑回归损失,称之为对数似然损失,公式如下: 1) 分开类别: ?...4.分类评估方法 4.1 混淆矩阵 在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同组合,构成混淆矩阵(适用于多分类) ?

    41910

    机器学习入门 10-8 多分类问题中混淆矩阵

    本小节主要介绍如何求解多分类问题中指标,着重介绍多分类问题中混淆矩阵,将混淆矩阵进行处理转换为error_matrix矩阵,并通过可视化方式直观观察分类算法错误分类地方。...本小节来简单看一下如何利用前几个小节学习指标来处理多分类问题,在前几个小节二分类问题中介绍了一个非常重要小工具混淆矩阵,由混淆矩阵推导出了很多重要指标,因此最后着重介绍多分类问题中混淆矩阵。...b 多分类问题中混淆矩阵 这一小节重点是介绍多分类问题中混淆矩阵,不同于sklearn中precision_score、recall_score和f1_score,sklearn中混淆矩阵天然支持多分类问题...这里将混淆矩阵映射成灰度图像,因此传入plt.cm.gray; 调用plt.show()绘制混淆矩阵映射灰度图像; 通过matplotlib将混淆矩阵映射成了灰度图像,在灰度图像上越亮地方代表数值越大...矩阵值等于混淆矩阵每一个元素值除以混淆矩阵每一个行和,即cfm / row_sums; 我们并不关注那些完全预测正确结果,所以使用fill_diagonal函数将error_matrix中对角线位置值设置为

    5.3K40

    机器学习与深度学习习题集(上)

    7.计算下面多元函数雅克比矩阵: ? 8.计算下面多元函数Hessian矩阵: ? 9.计算下面函数所有极值点,并指明是极大值还是极小值: ? 10.推导多元函数梯度下降法迭代公式。...18.证明如果采用均方误差函数,线性回归优化问题是凸优化问题。 19.推导线性回归梯度下降迭代公式。 20.解释混淆矩阵概念。 21.解释岭回归原理。 22.解释LASSO回归原理。...第11章 线性模型 1.logistic归中是否一定要使用logistic函数得到概率值?能使用其他函数吗? 2.名称解释:对数似然比。 3.logistic是线性模型还是非线性模型?...4.logistic回归是生成模型还是判别模型? 5.如果样本标签值为0或1,推导logistic回归对数似然函数: ? 6.logistic归中为什么使用交叉熵而不使用欧氏距离作为损失函数?...7.证明logistic回归优化问题是凸优化问题: ? 8.推导logistic回归梯度下降迭代公式。 9.如果类别别标签为+1和-1,推导logistic回归对数似然函数: ?

    2.6K22

    SoftMax回归详解

    首先回归一下之前logistics回归,在logistics回归中,训练数据集由 m 个已标记样本构成,即:{(x[^1], y[^1]),(x[^2], y[^2]),......在 softmax回归中,我们解决是多分类问题,类标 y 可以取 k 个不同值(而不是 2 个)。因此,对于训练集{(x[^1], y[^1]),(x[^2], y[^2]),......在Softmax 回归中将 x 分类为类别 j 概率为: ? 对于 J(θ) 最小化问题,目前还没有闭式解法。因此,我们使用迭代优化算法(例如梯度下降法,或 L-BFGS)。...此时 Hessian矩阵变为可逆矩阵,并且因为是凸函数,梯度下降法和 LBFGS等算法可以保证收敛到全局最优解。为了使用优化算法,我们需要求得这个新函数 J(θ) 导数,如下: ?...6. softmax回归与logistics回归关系 当类别数 k=2 时,softmax 回归退化为 logistic 回归。这表明 softmax 回归是 logistic回归一般形式。

    1.6K80

    机器学习入门 10-1 准确度陷阱和混淆矩阵

    先来看看对于一个作用在一组数据上分类算法如何得到混淆矩阵,进一步就会看到通过这个混淆矩阵能够得到各种比分类准确度还要好分类指标。 这一小节先来看一看对于二分类问题相应混淆矩阵是如何创建。...对于二分类问题来说,混淆矩阵实际上是一个(2, 2)矩阵,也就是说混淆矩阵中一共有4个元素。 ?...▲二分类问题混淆矩阵 上图中最上面一行和最左边一列对应就是这个混淆矩阵相应行和列名称,真正数值分布在(2, 2)矩阵中: 矩阵每一行代表对于预测问题来说相应真实值是多少,这里将真实值写成...▲算法预测1万个人混淆矩阵 对于(2, 2)混淆矩阵: 对于(0, 0)位置表示是对于这1万个人中有9978个人他们本身并没有患癌症,同时我们算法正确预测出他们也并没有患癌症,这就是True...这一小节介绍了混淆矩阵这个工具,在下一小节来看看通过混淆矩阵,我们可以创建出怎样评价指标,而这些评价指标为什么会比直接看整个算法分类准确度要更加好。

    1.1K20

    吴恩达机器学习笔记

    如下,首先要对数据进行矩阵构造,构造后X维度为m*(n+1),theta为(n+1)*1,y为m*1 ?...1,反之为0,实际上效果并不好,因为分类并不一定是一个线性函数,因此本节主要讲内容为logistic regression,之所以称之为logistic是因为hypothesis函数使用了logistic...代价函数 线性回归中代价函数已经不再适用于逻辑回归中,因为sigmoid函数将造成输出振荡,具有多个局部最小值,即“非凸”。逻辑回归中选用代价函数如下: ? 可将代价函数合并为 ? ? ?...该代价函数保证了逻辑回归中J(θ)凸性质。 则J(θ)为 ? 向量化表示为 ? 通用梯度下降方法为 ? 应用到逻辑回归中如下 ?...矩阵L维度为(n+1)*(n+1),当m(样本数)<n(特征数)时,矩阵XTX是不可逆,但加上λL后, ? 可逆 logistic 回归正则化 逻辑回归代价函数为: ? 加上正则项 ?

    51610

    机器学习:Logstic回归

    二、假设函数 在线性回归中,我们假设函数为 h_{\theta}(x) = \theta^Tx ,为了使得假设函数取值介于 [0,1] 之间,我们设假设函数为 h_{\theta}(x) =...现在来解释一下,Logistic归中,假设函数含义: h_{\theta}(x) = P(y=1|x;\theta) ,即在模型参数 \theta 下, x 成立条件下, y 取值为x...类似于线性回归中,可以在特征中添加额外高次多项式项达到拟合非线性数据目的,在Logistic归中,也有这样操作: 四、代价函数 如果使用线性回归中代价函数,由于假设函数改变,会使得代价函数变成一个非凸函数...对于Logistic 回归 ,也会出现过拟合现象: 解决方法: 减少属性数量。 手动选择需要保留属性 模型选择算法 正则化。...8.3.2 正规方程法 同时,当 \lambda > 0 时,保证矩阵可逆,一定程度上也解决了矩阵不可逆情况。

    71520

    【算法】逐步在Python中构建Logistic回归

    logistic回归是一种机器学习分类算法,用于预测分类因变量概率。 在逻辑回归中,因变量是一个二进制变量,包含编码为1(是,成功等)或0(不,失败等)数据。...换句话说,逻辑回归模型基于X函数预测P(Y = 1)。 Logistic回归假设 二元逻辑回归要求因变量为二元。 对于二元回归,因变量因子级别1应代表所需结果。 只应包含有意义变量。...Logistic回归需要非常大样本量。 记住上述假设,让我们看一下我们数据集。 数据探索 该数据集来自UCI机器学习库,它与葡萄牙银行机构直接营销活动(电话)有关。...) 预测测试集结果并创建混淆矩阵 confusion_matrix()函数将计算混淆矩阵并将结果以数组返回。...如您所见,PCA降低了Logistic回归模型准确性。 这是因为我们使用PCA来减少维度,因此我们从数据中删除了信息。 我们将在以后帖子中介绍PCA。

    2.9K30
    领券