首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用Sklearn的ConfusionMatrixDisplay对绘制混淆矩阵的颜色图进行归一化

混淆矩阵是用于评估分类模型性能的重要工具,它展示了模型在不同类别上的预测结果与真实标签之间的对应关系。Sklearn是一个流行的机器学习库,其中的ConfusionMatrixDisplay类可以用于绘制混淆矩阵的颜色图,并且支持对图像进行归一化处理。

归一化是将数据映射到特定范围内的过程,常用的归一化方法有最大最小值归一化和Z-score归一化。在绘制混淆矩阵的颜色图时,归一化可以使不同类别之间的差异更加明显,便于观察和比较。

使用Sklearn的ConfusionMatrixDisplay对绘制混淆矩阵的颜色图进行归一化的步骤如下:

  1. 导入所需的库和模块:
代码语言:txt
复制
from sklearn.metrics import confusion_matrix
from sklearn.metrics import ConfusionMatrixDisplay
  1. 计算混淆矩阵:
代码语言:txt
复制
y_true = # 真实标签
y_pred = # 预测结果
cm = confusion_matrix(y_true, y_pred)
  1. 创建ConfusionMatrixDisplay对象并进行归一化处理:
代码语言:txt
复制
display = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=labels)
display = display.normalize()  # 归一化处理
  1. 绘制混淆矩阵的颜色图:
代码语言:txt
复制
display.plot(cmap='Blues')  # 指定颜色图的颜色映射
plt.show()  # 显示图像

在上述代码中,y_true表示真实标签,y_pred表示预测结果,labels是类别标签的列表。confusion_matrix函数用于计算混淆矩阵,ConfusionMatrixDisplay类用于创建混淆矩阵的可视化对象。normalize方法用于对混淆矩阵进行归一化处理,plot方法用于绘制混淆矩阵的颜色图。

使用Sklearn的ConfusionMatrixDisplay对绘制混淆矩阵的颜色图进行归一化可以帮助我们更直观地了解分类模型的性能,特别是在多类别分类问题中。对于Sklearn的ConfusionMatrixDisplay的更多信息和使用示例,可以参考腾讯云机器学习平台的相关产品Sklearn的ConfusionMatrixDisplay

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

强大的 Scikit-learn 可视化让模型说话

概率校准 要比较分类模型,使用 calibration.CalibrationDisplay 进行概率校准,概率校准曲线可以显示模型预测的可信度。...显示混淆矩阵 在评估分类模型和处理不平衡数据时,需要查看精确度和召回率。使用 metrics.ConfusionMatrixDisplay绘制混淆矩阵(TP、FP、TN 和 FN)。...(rf_clf, X, y) plt.show() 使用 ConfusionMatrixDisplay 绘制的图表 Roc 和 Det 曲线 因为经常并列评估Roc 和 Det 曲线,因此把metrics.RocCurveDisplay...如果需要调整特定参数以测试其对模型的影响,建议使用 model_selection.ValidationCurveDisplay 来直观地观察模型在参数变化时的表现。...由于篇幅有限,未对每个 API 进行详细介绍。如果有兴趣,可以查看 [官方文档:https://scikit-learn.org/stable/visualizations.html?

22610

Part4-2.对建筑年代的预测结果进行分析:绘制混淆矩阵、计算分类报告,绘制空间分布

本文为《通过深度学习了解建筑年代和风格》论文复现的第六篇——对建筑年代深度学习模型的进行评价,我们首先会通过对测试数据集的预测来展示模型的预测能力,其中,我们会介绍对模型进行评估的几种方法,包括混淆矩阵...四、混淆矩阵、召回率、精确度、F1分数 4.1 概念解释 4.2 读取预测结果 4.3 使用sklearn创建混淆矩阵 4.4 使用seaborn进行可视化 4.5 通过混淆矩阵分析模型预测结果 4.6...使用sklearn生成各种分类指标 4.7 使用分类报告分析模型预测结果 4.8 可以进一步优化的地方 五、类激活映射 5.1 使用"frgfm/torch-cam" 库对单个图像进行测试 3)我们将...当我们需要同时考虑召回率和精确度时,F1分数提供了一个综合的评估指标。 4.2 读取预测结果 我们将使用sklearn[4]提供的工具来计算混淆矩阵、召回率、精确度和F1分数。...我们可以参考上图进行制作,流程大概是:对所有的建筑进行预测——对真实年代和预测的年代的类别进行差值计算——将上一步的结果和建筑足迹的空间数据进行连接——提取出市中心的范围,设置符号系统然后出图。

63920
  • 机器学习扩展包MLXtend绘制多种图形

    预处理:包括数据清洗、标准化、归一化等,确保数据质量,提高模型性能等特征选择基于特征重要性的方法:这种方法通过评估各个特征对模型预测能力的贡献度来选择特征。...函数用于绘制混淆矩阵的可视化图形。...cmap:用于绘制混淆矩阵的颜色映射,默认为None。colorbar:是否显示颜色条,默认为False。show_absolute:是否显示绝对值,默认为True。...show_normed:是否显示归一化后的值,默认为False。class_names:类别标签列表,用于在混淆矩阵的轴上显示类别名称,默认为None。...()11.6 归一化颜色突出对角线的混淆矩阵In 33:class_dict = {0: 'airplane',1: 'automobile',2: 'bird',3: 'cat',4: 'deer',

    26510

    机器学习-07-分类回归和聚类算法评估函数及案例

    第一个典型的用例是,将一个库中已经存在的metrics函数进行包装,使用定制参数,比如对fbeta_score函数中的beta参数进行设置: from sklearn.metrics import fbeta_score...在机器学习领域,混淆矩阵(ConfusionMatrix),又称为可能性矩阵或错误矩阵。...混淆矩阵的每一列代表了预测类别,每一行代表了数据的真实类别。分类问题的评价指标大多基于混淆矩阵计算得到的。...NDCG(归一化折损累计增益),表示推荐系统对所有用户推荐结果DCG的一个平均值,由于每个用户的排序列表不一样,所以先对每个用户的DCG进行归一化,再求平均。...): 兰德系数(Rand index) 兰德系数是使用真实label对聚类效果进行评估,评估过程和混淆矩阵的计算类似: 互信息(Mutual Information) sklearn实现聚类 print

    18310

    超强,必会的机器学习评估指标

    model_precision = precision_score(y_test, y_pred) print("Precision:", model_precision)1.3 混淆矩阵混淆矩阵是一个表格...在 Python 中绘制混淆矩阵的一种简单方法是:from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay# 计算混淆矩阵...conf_matrix = confusion_matrix(y_test, y_pred)# 展示混淆矩阵disp = ConfusionMatrixDisplay(confusion_matrix=...我们可以使用以下代码计算 AUC 分数并绘制 ROC 曲线:# 从sklearn.metrics模块导入roc_auc_score和roc_curve函数用于计算AUC分数和绘制ROC曲线,同时导入matplotlib.pyplot...plt.title('接收器操作特征') # 添加图例,位于图的右下角,展示模型及其AUC分数plt.legend(loc="lower right") # 显示绘制的图像plt.show()1.7 对数损失

    17500

    6大监督学习方法:实现毒蘑菇分类

    要了解蘑菇是否可食用,必须采集具有不同特征属性的蘑菇是否有毒进行分析。 对蘑菇的22种特征属性进行分析,从而得到蘑菇可使用性模型,更好的预测出蘑菇是否可食用。...Rate") 下面是对逻辑回归模型进行校正。...查看具体的混淆矩阵和预测情况: ROC曲线 from sklearn.metrics import roc_curve, auc false_positive_rate, true_positive_rate...ROC 这是一篇很好的文章来解释混淆矩阵和ROC:https://www.cnblogs.com/wuliytTaotao/p/9285227.html 1、什么是混淆矩阵?...、数据集划分 评价指标:混淆矩阵、ROC曲线作为重点,后续有文章专门讲解 预告:后面Peter自己会专门写一篇来对这份数据进行建模分析,纯原创的思路,期待下~

    2.2K30

    一图胜千言!机器学习模型可视化!!

    如前所述,对角线中的元素表示真实的类,对角线外的元素表示模型混淆类的情况,因此得名“混淆矩阵”。 以下是该图的三个关键要点: 对角线:理想情况下,矩阵的主对角线应填充最高数字。...在许多现实世界的场景中,情况并非如此。然后,生成第二个混淆矩阵,显示正确分类的可能性(而不是样本的绝对数量)可能会有所帮助。 颜色渐变和百分比注释等视觉增强功能使混淆矩阵更加直观且易于解释。...样式类似于热图的混淆矩阵会引起对错误率高的类的注意,从而指导进一步的模型开发。...混淆矩阵还可以帮助非技术利益相关者掌握模型的优势和劣势,促进讨论在使用模型预测进行关键决策时是否需要额外的数据或预防措施。 可视化聚类分析 聚类分析根据特定特征对相似的数据点进行分组。...例如,如果您正在寻求提高模型的性能,请确保首先从简单的方法开始,例如使用简单的折线图绘制模型的精度和损失。 假设您的模型过拟合。然后,您可以使用特征重要性技术根据特征对模型性能的贡献对特征进行排名。

    74910

    机器学习入门 10-8 多分类问题中的混淆矩阵

    使用train_test_split将数据集划分为训练集和测试集。 接下来使用逻辑回归算法对多分类手写数字识别数据集进行训练。...在fit训练逻辑回归算法之后,调用score函数计算训练好的模型在测试样本上的accuracy分类准确度为93%。 使用predict函数对所有测试样本进行预测,预测每个测试样本的所属类别。...b 多分类问题中的混淆矩阵 这一小节的重点是介绍多分类问题中的混淆矩阵,不同于sklearn中的precision_score、recall_score和f1_score,sklearn中的混淆矩阵天然支持多分类问题...: 第一个参数传入需要绘制的矩阵cfm; 第二个参数是cmap,cmap全称为color map,也就是颜色映射,将矩阵中的每一个元素与对应的颜色映射起来。...比如根据error_matrix矩阵绘制的灰度图可以看到算法将很多真实为数字1的样本预测成了数字9,将很多真实为数字8的样本预测成了数字1。

    5.4K40

    Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(二)

    混淆矩阵 混淆矩阵的一般思想是计算类 A 的实例被分类为类 B 的次数,对于所有 A/B 对。例如,要知道分类器将 8 的图像误判为 0 的次数,您将查看混淆矩阵的第 8 行,第 0 列。...要绘制这样的图表,请使用ConfusionMatrixDisplay.from_predictions()函数,如下所示: from sklearn.metrics import ConfusionMatrixDisplay...这可能是因为模型在 5 上犯了更多错误,或者因为数据集中的 5 比其他数字少。这就是通过将每个值除以相应(真实)类别中图像的总数(即除以行的总和)来对混淆矩阵进行归一化的重要性。...混淆矩阵(左)和相同的通过行归一化的 CM(右) 图 3-10。仅显示错误的混淆矩阵,通过行归一化(左)和通过列归一化(右) 现在你可以更清楚地看到分类器所犯的错误类型。...也可以通过列而不是通过行对混淆矩阵进行归一化:如果设置normalize="pred",你会得到图 3-10 中右边的图表。例如,你可以看到 56%的错误分类的 7 实际上是 9。

    32500

    推荐收藏 | 一个画出高大上的机器学习图的神器scikit-plot

    02 使用说明 简单举几个例子 比如画出分类评级指标的ROC曲线的完整代码: from sklearn.datasets import load_digits from sklearn.model_selection...图:P-R曲线 混淆矩阵是分类的重要评价标准,下面代码是用随机森林对鸢尾花数据集进行分类,分类结果画一个归一化的混淆矩阵。...图:归一化混淆矩阵 其他图如学习曲线、特征重要性、聚类的肘点等等,都可以用几行代码搞定。 ? 图:学习曲线、特征重要性 ?...图:K-means肘点图 03 总结 本文对Scikit-plot做下简单介绍,这是一个机器学习的画图神器,几行代码就能画出高大上的机器学习图,作者当年的博士论文也是靠这个画图的。...仓库地址: https://github.com/reiinakano/scikit-plot 里面有使用说明和样例。?

    1.3K30

    推荐:一个画出高大上的机器学习图的神器(论文必备)

    本人在写论文的时候,很多图片是用matplotlib和seaborn画的,但是,我还有一个神器,Scikit-plot,通过这个神器,画出了更加高大上的机器学习图,本文对Scikit-plot做下简单介绍...使用说明 简单举几个例子 比如画出分类评级指标的ROC曲线的完整代码: from sklearn.datasets import load_digits from sklearn.model_selection...图:P-R曲线 混淆矩阵是分类的重要评价标准,下面代码是用随机森林对鸢尾花数据集进行分类,分类结果画一个归一化的混淆矩阵。...图:归一化混淆矩阵 其他图如学习曲线、特征重要性、聚类的肘点等等,都可以用几行代码搞定。 ? 图:学习曲线、特征重要性 ?...图:K-means肘点图 总结 本文对Scikit-plot做下简单介绍,这是一个机器学习的画图神器,几行代码就能画出高大上的机器学习图,作者当年的博士论文也是靠这个画图的。

    2.1K20

    推荐:一个画出高大上的机器学习图的神器(论文必备)

    本人在写论文的时候,很多图片是用matplotlib和seaborn画的,但是,我还有一个神器,Scikit-plot,通过这个神器,画出了更加高大上的机器学习图,本文对Scikit-plot做下简单介绍...使用说明 简单举几个例子 比如画出分类评级指标的ROC曲线的完整代码: from sklearn.datasets import load_digits from sklearn.model_selection...图:P-R曲线 混淆矩阵是分类的重要评价标准,下面代码是用随机森林对鸢尾花数据集进行分类,分类结果画一个归一化的混淆矩阵。...图:归一化混淆矩阵 其他图如学习曲线、特征重要性、聚类的肘点等等,都可以用几行代码搞定。 ? 图:学习曲线、特征重要性 ?...图:K-means肘点图 总结 本文对Scikit-plot做下简单介绍,这是一个机器学习的画图神器,几行代码就能画出高大上的机器学习图,作者当年的博士论文也是靠这个画图的。

    75030

    不要太强!全面总结 KNN !!

    模型训练: 使用 fit() 方法训练模型。这里没有显式的训练过程,KNN 只是存储训练数据。 模型预测与可视化: 使用 predict() 方法对测试集进行预测。...cm = confusion_matrix(y_test, y_pred) # 绘制混淆矩阵 plt.figure(figsize=(10, 10)) sns.heatmap(cm, annot=True...绘制图像: 在这段代码中,confusion_matrix 用于计算混淆矩阵,而 seaborn.heatmap 用于绘制矩阵图。...每个格子的数值表示实际类别和预测类别的匹配数量,颜色的深浅表示数量的大小。 总结一下 使用 KNN 进行文本分类可以获得不错的效果,特别是当文档集较小且文档之间的区分度较高时。...最后绘制混淆矩阵,显示实际类别与预测类别之间的关系。混淆矩阵可以帮助我们理解分类模型在各个类别上的表现,包括哪些类别容易被混淆。

    61210

    特殊图像的色彩特征工程:非自然图像的颜色编码

    这为我们提供了一个独特的特征工程机会。我们可以不使用原始的RGB颜色值,而是研究数据集对特定颜色空间的适应度是否有助于并改进我们最终结果指标。...灰度图像不仅仅是对 RGB 进行简单的平均,而是对其进行轻微不平衡的加权。本文使用使用 scikit-image 的 rgb2gray 来执行这个转换。...特征的相关性 在继续我们的下一部分研究之前(即测试这些颜色操作是否能帮助卷积神经网络对10个目标类进行分类),让我们快速地看看这些新的颜色值是如何相互关联的。...下面就可以测试颜色处理是否对图像分类有帮助。 测试图像分类 看看我们的颜色处理是否能帮助卷积神经网络对8个目标类进行分类。...左侧的混淆矩阵显示了正确/错误识别的样本数量,而右侧则显示了每个目标类别的比例值。 灰度数据集的分类性能 对灰度转换的图像做同样的事情。训练期间的模型性能如何?

    73230

    模型性能分析:ROC 分析和 AUC

    当您评估模型的质量时,通常会使用精度和召回率等指标,也分别称为数据挖掘领域的置信度和灵敏度。这些指标将预测值与通常来自保留集的实际观察值进行比较,使用混淆矩阵进行可视化。...使用混淆矩阵,您可以将 Precision 构建为所有真实阳性与所有预测阳性的比率。图片召回率,也称为真阳性率,表示真阳性与观察到的和预测的所有阳性的比率。...图片使用混淆矩阵中的不同观察集来描述 Precision 和 Recall,您可以开始了解这些指标如何提供模型性能的视图。...这是一个非常有用的统计数据,因为它可以让我们了解模型对真实观察结果和错误观察结果的排名有多好。...要绘制 ROC 曲线并计算曲线下面积 (AUC),您决定使用 SckitLearn 的 RocCurveDisplay 方法并将多层感知器与随机森林模型进行比较,以尝试解决相同的分类任务。

    76020

    模型性能分析:ROC 与 AUC

    当您评估模型的质量时,通常会使用精度和召回率等指标,也分别称为数据挖掘领域的置信度和灵敏度。 这些指标将预测值与通常来自保留集的实际观察值进行比较,使用混淆矩阵进行可视化。...使用混淆矩阵,您可以将 Precision 构建为所有真实阳性与所有预测阳性的比率。 Precision 召回率,也称为真阳性率,表示真阳性与观察到的和预测的所有阳性的比率。...Recall 使用混淆矩阵中的不同观察集来描述 Precision 和 Recall,您可以开始了解这些指标如何提供模型性能的视图。...这是一个非常有用的统计数据,因为它可以让我们了解模型对真实观察结果和错误观察结果的排名有多好。...要绘制 ROC 曲线并计算曲线下面积 (AUC),您决定使用 SckitLearn 的 RocCurveDisplay 方法并将多层感知器与随机森林模型进行比较,以尝试解决相同的分类任务。

    78020

    爱数课实验 | 第七期-基于随机森林的金融危机分析

    (),用于输出模型的预测报告、混淆矩阵和分类正确率。...# 输出混淆矩阵 # 绘制混淆矩阵热力图 fig,ax = plt.subplots(figsize=(8,6)) sns....',fontproperties = font) plt.show() # 输出混淆矩阵热力图 从模型预测报告中可以看出,对发生银行危机(少数类)的召回率达到了89%,通过混淆矩阵及混淆矩阵热力图可以看出分类正确的占比较高...考虑到训练集里面样本数量较少,样本类别不平衡,我们对少数类使用SMOTE进行过采样操作,扩充少数类样本,对模型进行优化。...3.5 使用SMOTE进行过采样优化模型 SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中。

    70910

    基于LSTM-CNN的人体活动识别

    我将要使用的模型是一个深神经网络,该网络是LSTM和CNN的组合形成的,并且具有提取活动特征和仅使用模型参数进行分类的能力。 这里我们使用WISDM数据集,总计1.098.209样本。...import LabelEncoderfrom sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay...Sklearn,Tensorflow,Keras,Scipy和Numpy来构建模型和进行数据预处理。...使用PANDAS 进行数据加载,使用matplotlib进行数据可视化。 数据集加载和可视化 WISDM是由个人腰间携带的移动设备上的加速计记录下来。该数据收集是由个人监督的可以确保数据的质量。...score = model.evaluate(x_test, y_test)print("Accuracy:", score[1])print("Loss:", score[0]) 下面绘制混淆矩阵更好地理解对测试数据集的预测

    1.4K20

    基于LSTM-CNN的人体活动识别

    我将要使用的模型是一个深神经网络,该网络是LSTM和CNN的组合形成的,并且具有提取活动特征和仅使用模型参数进行分类的能力。 这里我们使用WISDM数据集,总计1.098.209样本。...import LabelEncoder from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay...Sklearn,Tensorflow,Keras,Scipy和Numpy来构建模型和进行数据预处理。...使用PANDAS 进行数据加载,使用matplotlib进行数据可视化。 数据集加载和可视化 WISDM是由个人腰间携带的移动设备上的加速计记录下来。该数据收集是由个人监督的可以确保数据的质量。...score = model.evaluate(x_test, y_test) print("Accuracy:", score[1]) print("Loss:", score[0]) 下面绘制混淆矩阵更好地理解对测试数据集的预测

    1.9K20

    机器学习基础:类别不平衡问题处理方法汇总及实际案例解析

    集成技术:欠采样中的算法集成技术是利用集成学习机制,将反例划分为若干个集合供不同学习器使用,这样对每个学习器来看都进行了欠采样,但在全局来看却不会丢失重要信息,一般适用于数据集足够大的情况。...五、实际案例 案例:信用卡欺诈 案列介绍:数据集由欧洲持卡人于2013年9月使用信用卡进行交易的数据。此数据集显示两天内发生的交易,其中284,807笔交易中有492笔被盗刷。...'Mean recall score'].idxmax()]['C_Parameter'] print ('best_c is :',best_c) return best_c #绘制混淆矩阵图...xgb.fit(X_train,y_train) # 基于拟合的模型对测试数据集进行预测 y_pred = xgb.predict(X_test) # 返回模型的预测效果 print('模型的准确率为...print('ROC curve (area = %0.2f)' % roc_auc) y_pred_proba = xgb.predict_proba(X_test) #之后阈值移动要用到 #绘制混淆矩阵图

    8.5K31
    领券