最大熵算法公式_最大熵算法原理_最大熵算法程序 - 腾讯云开发者社区

、、

本文提出了一种用于文本分类中特征选择的条件熵定义算法。我遵循CharuC.Aggarwal (5.2.2)在机器学习文本中的公式。作者提到，条件熵值介于(0，log(类数))之间，而我的情况是(0，0.6931472)。作者还提到，最大值的特征可以删除，但是他没有给出定义‘最大’的标准的进一步信息(是熵的最大值还是最大熵值的集合？) 你有没有把条件熵应用于特征选择？这里总结了我的条件熵</e

浏览 0提问于2020-09-17得票数 2

回答已采纳

1回答

tf.nn.softmax_cross_entropy_with_logits如何计算tensorflow中的最大交叉熵？

tf.nn.softmax_cross_entropy_with_logits，文档显示它计算了逻辑和标签之间的最大交叉熵，这意味着什么？它不是应用了交叉熵损失函数公式吗？为什么文档说它计算软最大交叉熵？

浏览 5提问于2017-05-22得票数 2

1回答

什么是排列熵？

、

我想知道什么是置换熵(PE)。然后，我了解了这论文，它描述了体育。现在，假设我们有一个由熵源产生的伪随机排列，我们使用了一个统一的洗牌算法(比如Fisher-Yates洗牌算法)。另外，假设我们使用256位熵来洗牌\{0,1\}^8\rightarrow\{0,1\}^8.那么，输出排列可以具有最大256位熵的事实是真的吗？对于熵的每一个值，我们将得到一个唯一的对应排列。

浏览 0提问于2020-11-10得票数 0

1回答

加密图像置乱后的熵

、、

我有一个叫做arnold 2-D map的算法，它只排列图像的像素，而不改变像素的值。但是，当我计算主图像和加密版本的熵值时，这些值变得不同。我不能理解这一点，因为由于熵的公式只涉及图像中像素值的概率，并且在应用猫映射后保持不变，所以为什么熵应该改变。有人能帮上忙吗

浏览 1提问于2017-03-25得票数 0

1回答

如何在斯坦福分类器中使用朴素贝叶斯分类器、支持向量机和最大增强

、、、、

目前，我正在使用朴素贝叶斯算法、支持向量机和最大熵算法制作一个引文句子分类器，目前我的数据是110个非引文句子和10个引文句子。我使用代码从斯坦福分类器示例中进行分类，结果很好。但是分类器是准牛顿的。如何使用朴素贝叶斯分类器、支持向量机和最大熵？我已经尝试编辑prop文件并添加"useNB=true"，但结果发现所有数据都是非引用句类。我已经在上读过javadoc了，我不知道应该把朴素贝叶斯算法的setClass放在哪里

浏览 0提问于2015-10-26得票数 1

2回答

用卡方判别压缩数据和随机数据

、

我首先通过计算这类数据的熵来尝试，在这两种情况下，熵值都非常高(几乎是最大值)，因此这种方法似乎不起区别作用。我读过关于卡方算法的文章，但我从未使用过它(实际上，我在解释结果时仍然存在一些问题)。有谁知道这个算法能带来更好的结果吗？

浏览 0提问于2012-08-15得票数 6

1回答

斯坦福分类器ColumnDataClassifier

、

我正在使用斯坦福分类器提供的最大熵算法来执行定制的命名实体识别。输出文件提供5列 P(clAnswer)和P(goldAnswer)的区别是什么？

浏览 3提问于2017-11-14得票数 0

回答已采纳

1回答

keras模型训练的最高损失量是多少？

、、、

我正在使用Keras训练我的模型，并尝试读取评估统计数据。我知道损失函数是用来做什么的，但是最高值可能是多少呢？越接近零越好，但我不知道0.2是不是更好。我可以看到，在更多的迭代之后，损失正在下降，准确率也在提高。我训练模型的代码如下： def trainModel(bow,unitlabels,units): print("X_train: ", x_train) print("Y_train: ", y_train

浏览 27提问于2019-05-09得票数 1

回答已采纳

1回答

决策树分割策略

、、、、

我有一个包含4个分类特征(胆固醇、收缩压、舒张压和吸烟率)的数据集。我使用决策树分类器来找出中风的概率。由于它是二叉树，因此有三种可能的方法来拆分第一个特征，即将类别{0和1分组到一个叶子，将2分组到另一个叶子}，或者{0和2，1}，或者{0，1和2}。我所知道的(请在这里纠正我)是所选择的分割是具有最小信息增益的分割(基尼杂质)。{0 + 1 , 2} --> 0.17 {1 + 2 , 0} --> 0.

浏览 3提问于2019-12-24得票数 0

3回答

滑雪板的Logistic回归函数

、、、、

我的问题是:最大可能性估计是什么？这是如何计算的？什么是误差度量？使用的优化算法是什么？

浏览 6提问于2014-07-24得票数 5

回答已采纳

2回答

哈希编码的字符串之间有熵区别吗？

、

当然，如果我将(例如) SHA-2应用于base64编码的字符串，它将给我一个与原始数据不同的结果，但是从熵的角度来看，这有什么区别吗？

浏览 0提问于2015-11-07得票数 7

2回答

位与异或结合时的比特熵公式

、、、

假设位A和B都有每比特的.5熵位。A和B的排他性或，即A⊕B的单比特熵会有多少个比特？我猜这个公式类似于每比特熵的\mathord{\mathrm{E}}(A⊕B)=1-(1 - \mathord{\mathrm{E}}(A))(1-\mathord{\mathrm{E}}(B))=.75另外，我是否正确地解释过，你只能通过低熵度的异或比特来接近每比特的1位熵，但实际上却无法达到它呢？

浏览 0提问于2020-10-06得票数 3

回答已采纳

1回答

对于不同的优化度量，决策树的构建有何不同？

、、、

我理解如何使用诸如熵、基尼指数和方差减少等准则构造决策树(在ID3算法中)。但是这些标准的公式并不关心诸如准确性、召回、AUC、kappa、f1分数等优化指标。对于不同的分类/回归算法，这些变化是否有一个模式？

浏览 0提问于2020-03-13得票数 1

3回答

使用tensorflow进行情感分析

、

我看过下面的教程我曾经使用过朴素贝叶斯分类器，最大熵算法和Scikit学习分类器，我想知道tensorflow是否提供了更好的算法。这是正确的起点吗?或者还有其他选择吗？

浏览 0提问于2015-12-10得票数 18

2回答

当分割被完全分类时，在ID3算法中计算属性的熵

、、

我最近读到了ID3算法，它说选择最好的属性进行分割应该导致最大的信息增益，这可以在熵的帮助下计算。熵(X)= 0.8*_E(5，3) + 0.2*_E(2，0) 然而，第二个分裂P(1)是完全分类的，这导致了一个数学错误，因为log2(0)是负无穷大。在这种情况下，如何计算熵？

浏览 0提问于2016-09-30得票数 3

1回答

如何用Pytorch计算语言模型的困惑

、、

我是微调GPT-2模型的语言生成任务使用拥抱面对变形金刚库-毕火炬，我需要计算一个评估分数(困惑)的微调模型。但我不知道如何利用损失来做到这一点。我想知道如何计算模型的困惑与sum_loss或平均损失或任何其他建议也是欢迎的。任何帮助都是徒劳无功。outputs = model(article_tens, labels=article_tens) loss.backward() sum_loss = sum_lo

浏览 0提问于2020-05-24得票数 3

回答已采纳

1回答

是什么创建了‘`maxent_treebank_pos_tagger/english.泡菜’？

、、、

nltk包的内置语音标记似乎没有针对我的用例()进行优化。显示它使用了一个名为maxent_treebank_pos_tagger的保存的、经过预先训练的分类器。除了大量的googling之外，到目前为止，我试图直接查看.pickle对象，以找到它内部的任何线索，从下面开始x = load("nltk_data

浏览 0提问于2015-07-13得票数 10

1回答

如何在建立决策树时找到分割点的熵？

、、、

训练样本的熵为−4/9 log2(4/9)−5/9−(5/9)= 0.9911。所以我按升序对a3值进行排序，找出它们的分裂点。但是如何计算它们的熵呢？上述图像中的信息增益列仅为0.9911 -熵.熵的公式是：但我不明白如何用这个公式来求分裂点的熵。

浏览 2提问于2017-03-24得票数 0

回答已采纳

1回答

关于ID3机器学习算法中统计熵概念的几个疑问

、、、、

我正在研究统计熵概念，这是ID3机器学习算法所使用的。因此，例如：熵(S)=- (9/14)*Log2(9/14) - (5/14)*Log2(5/14) = 0.940 注意，如果S的所有成员都

浏览 4提问于2013-06-17得票数 1

回答已采纳

1回答

什么应该作为熵的来源？

、、

我有基于硬件的RNG，包括TRNG和PRNG.TRNG给出了一个512位的数字，被用作PRNG的种子.RNG使用PRNG生成160位随机数，并在2^{20}数之后重新播种.我想使用基于硬件的RNG作为熵源应使用什么作为熵源，即TRNG或PRNG的输出？

浏览 0提问于2016-07-29得票数 10

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

特征选择-条件熵

tf.nn.softmax_cross_entropy_with_logits如何计算tensorflow中的最大交叉熵？

什么是排列熵？

加密图像置乱后的熵

如何在斯坦福分类器中使用朴素贝叶斯分类器、支持向量机和最大增强

用卡方判别压缩数据和随机数据

斯坦福分类器ColumnDataClassifier

keras模型训练的最高损失量是多少？

决策树分割策略

滑雪板的Logistic回归函数

哈希编码的字符串之间有熵区别吗？

位与异或结合时的比特熵公式

对于不同的优化度量，决策树的构建有何不同？

使用tensorflow进行情感分析

当分割被完全分类时，在ID3算法中计算属性的熵

如何用Pytorch计算语言模型的困惑

是什么创建了‘`maxent_treebank_pos_tagger/english.泡菜’？

如何在建立决策树时找到分割点的熵？

关于ID3机器学习算法中统计熵概念的几个疑问

什么应该作为熵的来源？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐