前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >熵值法的原理+实现

熵值法的原理+实现

原创
作者头像
落雨
修改2022-07-26 23:14:18
3.1K0
修改2022-07-26 23:14:18
举报
文章被收录于专栏:落雨的专栏

1.定义

熵:在物理学上是度量热力系统学系统中的无序程度,在信息论中是度量系统的不确定性。

下面我们用两个例子来解释熵这个概念

左边克劳修斯的罐子里有9颗绿色的豆子,右边波尔兹曼的罐子里有5颗红色豆子和4颗绿色豆子。左边瓶子里的豆子很完整,都是绿色的豆子,所以它的熵比较小,信息熵越小,数据成纯度越高,也就是说左边罐子里只有同一种颜色,它豆子的纯度比较高。右边的瓶子豆子很凌乱,所以熵的伤比较大,也就是说右边的罐子里有红色和绿色两种不一样的豆子,它包含的豆子种类多,信息量大。

同样我们对比小唠说的“啦啦啦啦啦”和小叨说的“我是卖报的小行家这”两句话。“啦啦啦啦啦”这几个字它的纯度高,带有的信息量少,所以他的熵值小。“我是卖报的小行家”这几个字,他的纯度低,信息量大,所以你的熵值大。我们可以通过香浓提供的公式来算出它所对应的熵值。

从上面两个案例,我们可以总结出以下两个性质:

信息熵越大,信息量越多,纯度越低。(不确定性高,离散程度高)

信息熵越小,信息量越小,纯度越高。

2.适用范围

可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。

通常我们构建一个评价指标需要分为一级指标,二级指标,三级指标等等。例如上表我们评价一级指标时采用了AHP层次分析法,二级指标的权重确定使用了熵值法。因为我们在请专家根据自己的经验对指标进行评价时,我们能请到的专家数量有有限,所以只让专家对一级指标进行主观评定。二级指标,三级指标则通过数据计算的方式确定权重。最终的权重系数为一级指标乘以二级指标乘以三级指标计算得出。同时采用以上的方法AHP和商商权法的组合,是一种主观加客观的方式,在一定程度上避免了层次分析法主观性较强的缺点,使得评价结果更加准准确。

可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。

3.实现

学号

C语言程序设计

数据库原理

体育

平均分

1

85.00

80.00

93.00

86

2

60.00

80.00

88.00

76

3

50.00

80.00

88.00

72.66667

4

40.00

80.00

90.00

70

5

90.00

80.00

88.00

86

这是几位同学期末的一个成绩单,首先我们来看一下上面的成绩。我们想通过一种方法来确定学号1~5号中谁是最优秀的,我们先计算出了平均分,发现一号和五号的平均分都是86分。我们来看各科的成绩其中数据库原理大家都是80分,c语言程序设计这一门课成绩差异非常大,最低分有40分,最高分有90分。体育一门课成绩成绩差距也不是很大,都是八九十。

这时我们就要提出一种评价指标,来评价这几位同学的成绩。以上的成绩我们考虑给C语言程序设计加一些权重。根据熵值法的原理来看。数据库原理,这一门课的离散程度为0,他在权重一定是零。体育和c语言程序设计比较来说c语言程序设计的离散程度较大从素质上来看有40的也有90的,差距比较大。体育这一门课最低有88最高也只有93,差距比较小。计算结果的权重一定是c语言程序设计的权重比体育的权重大。因为现实中的思维来想,可能是c语言程序设计考试比较难,所以他的分数差距就比较大,而体育和数据库原理很简单,它的分数差距就比较小。这样子来说,数据库原理和体育这两门课,它的可比性就比较小,因为大家的分数都差不多,C语言程序设计这一门课就有可比性。

下面使用SPSSAU计算以上指标的熵权

得出以下计算结果:

以上的分析结果来看C语言程序设计权重系数为99.84,数据库原理的权重为0,体育的权重为0.52。然后我们可以给每一个科目不同的权重系数和各科的成绩相乘以后,得出每一位学生的综合成绩,评价这几位学生。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.定义
  • 2.适用范围
  • 3.实现
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档