腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
特征选择-条件
熵
、
、
本文提出了一种用于文本分类中特征选择的条件
熵
定义
算法
。我遵循CharuC.Aggarwal (5.2.2)在机器学习文本中的
公式
。作者提到,条件
熵
值介于(0,log(类数))之间,而我的情况是(0,0.6931472)。作者还提到,
最大
值的特征可以删除,但是他没有给出定义‘
最大
’的标准的进一步信息(是
熵
的
最大
值还是
最大
熵
值的集合?) 你有没有把条件
熵
应用于特征选择?这里总结了我的条件
熵</e
浏览 0
提问于2020-09-17
得票数 2
回答已采纳
1
回答
tf.nn.softmax_cross_entropy_with_logits如何计算tensorflow中的
最大
交叉
熵
?
tf.nn.softmax_cross_entropy_with_logits,文档显示它计算了逻辑和标签之间的
最大
交叉
熵
,这意味着什么?它不是应用了交叉
熵
损失函数
公式
吗?为什么文档说它计算软
最大
交叉
熵
?
浏览 5
提问于2017-05-22
得票数 2
1
回答
什么是排列
熵
?
、
我想知道什么是置换
熵
(PE)。然后,我了解了这论文,它描述了体育。现在,假设我们有一个由
熵
源产生的伪随机排列,我们使用了一个统一的洗牌
算法
(比如Fisher-Yates洗牌
算法
)。另外,假设我们使用256位
熵
来洗牌\{0,1\}^8\rightarrow\{0,1\}^8.那么,输出排列可以具有
最大
256位
熵
的事实是真的吗?对于
熵
的每一个值,我们将得到一个唯一的对应排列。
浏览 0
提问于2020-11-10
得票数 0
1
回答
加密图像置乱后的
熵
、
、
我有一个叫做arnold 2-D map的
算法
,它只排列图像的像素,而不改变像素的值。但是,当我计算主图像和加密版本的
熵
值时,这些值变得不同。我不能理解这一点,因为由于
熵
的
公式
只涉及图像中像素值的概率,并且在应用猫映射后保持不变,所以为什么
熵
应该改变。有人能帮上忙吗
浏览 1
提问于2017-03-25
得票数 0
1
回答
如何在斯坦福分类器中使用朴素贝叶斯分类器、支持向量机和
最大
增强
、
、
、
、
目前,我正在使用朴素贝叶斯
算法
、支持向量机和
最大
熵
算法
制作一个引文句子分类器,目前我的数据是110个非引文句子和10个引文句子。我使用代码从斯坦福分类器示例中进行分类,结果很好。但是分类器是准牛顿的。如何使用朴素贝叶斯分类器、支持向量机和
最大
熵
?我已经尝试编辑prop文件并添加"useNB=true",但结果发现所有数据都是非引用句类。我已经在上读过javadoc了,我不知道应该把朴素贝叶斯
算法
的setClass放在哪里
浏览 0
提问于2015-10-26
得票数 1
2
回答
用卡方判别压缩数据和随机数据
、
我首先通过计算这类数据的
熵
来尝试,在这两种情况下,
熵
值都非常高(几乎是
最大
值),因此这种方法似乎不起区别作用。 我读过关于卡方
算法
的文章,但我从未使用过它(实际上,我在解释结果时仍然存在一些问题)。有谁知道这个
算法
能带来更好的结果吗?
浏览 0
提问于2012-08-15
得票数 6
1
回答
斯坦福分类器ColumnDataClassifier
、
我正在使用斯坦福分类器提供的
最大
熵
算法
来执行定制的命名实体识别。输出文件提供5列 P(clAnswer)和P(goldAnswer)的区别是什么?
浏览 3
提问于2017-11-14
得票数 0
回答已采纳
1
回答
keras模型训练的最高损失量是多少?
、
、
、
我正在使用Keras训练我的模型,并尝试读取评估统计数据。我知道损失函数是用来做什么的,但是最高值可能是多少呢?越接近零越好,但我不知道0.2是不是更好。我可以看到,在更多的迭代之后,损失正在下降,准确率也在提高。 我训练模型的代码如下: def trainModel(bow,unitlabels,units): print("X_train: ", x_train) print("Y_train: ", y_train
浏览 27
提问于2019-05-09
得票数 1
回答已采纳
1
回答
决策树分割策略
、
、
、
、
我有一个包含4个分类特征(胆固醇、收缩压、舒张压和吸烟率)的数据集。我使用决策树分类器来找出中风的概率。由于它是二叉树,因此有三种可能的方法来拆分第一个特征,即将类别{0和1分组到一个叶子,将2分组到另一个叶子},或者{0和2,1},或者{0,1和2}。我所知道的(请在这里纠正我)是所选择的分割是具有最小信息增益的分割(基尼杂质)。{0 + 1 , 2} --> 0.17 {1 + 2 , 0} --> 0.
浏览 3
提问于2019-12-24
得票数 0
3
回答
滑雪板的Logistic回归函数
、
、
、
、
我的问题是:
最大
可能性估计是什么?这是如何计算的?什么是误差度量?使用的优化
算法
是什么?
浏览 6
提问于2014-07-24
得票数 5
回答已采纳
2
回答
哈希编码的字符串之间有
熵
区别吗?
、
当然,如果我将(例如) SHA-2应用于base64编码的字符串,它将给我一个与原始数据不同的结果,但是从
熵
的角度来看,这有什么区别吗?
浏览 0
提问于2015-11-07
得票数 7
2
回答
位与异或结合时的比特
熵
公式
、
、
、
假设位A和B都有每比特的.5
熵
位。A和B的排他性或,即A⊕B的单比特
熵
会有多少个比特?我猜这个
公式
类似于每比特
熵
的\mathord{\mathrm{E}}(A⊕B)=1-(1 - \mathord{\mathrm{E}}(A))(1-\mathord{\mathrm{E}}(B))=.75另外,我是否正确地解释过,你只能通过低
熵
度的异或比特来接近每比特的1位
熵
,但实际上却无法达到它呢?
浏览 0
提问于2020-10-06
得票数 3
回答已采纳
1
回答
对于不同的优化度量,决策树的构建有何不同?
、
、
、
我理解如何使用诸如
熵
、基尼指数和方差减少等准则构造决策树(在ID3
算法
中)。但是这些标准的
公式
并不关心诸如准确性、召回、AUC、kappa、f1分数等优化指标。对于不同的分类/回归
算法
,这些变化是否有一个模式?
浏览 0
提问于2020-03-13
得票数 1
3
回答
使用tensorflow进行情感分析
、
我看过下面的教程 我曾经使用过朴素贝叶斯分类器,
最大
熵
算法
和Scikit学习分类器,我想知道tensorflow是否提供了更好的
算法
。这是正确的起点吗?或者还有其他选择吗?
浏览 0
提问于2015-12-10
得票数 18
2
回答
当分割被完全分类时,在ID3
算法
中计算属性的
熵
、
、
我最近读到了ID3
算法
,它说选择最好的属性进行分割应该导致
最大
的信息增益,这可以在
熵
的帮助下计算。
熵
(X)= 0.8*_E(5,3) + 0.2*_E(2,0) 然而,第二个分裂P(1)是完全分类的,这导致了一个数学错误,因为log2(0)是负无穷大。在这种情况下,如何计算
熵
?
浏览 0
提问于2016-09-30
得票数 3
1
回答
如何用Pytorch计算语言模型的困惑
、
、
我是微调GPT-2模型的语言生成任务使用拥抱面对变形金刚库-毕火炬,我需要计算一个评估分数(困惑)的微调模型。但我不知道如何利用损失来做到这一点。我想知道如何计算模型的困惑与sum_loss或平均损失或任何其他建议也是欢迎的。任何帮助都是徒劳无功。outputs = model(article_tens, labels=article_tens) loss.backward() sum_loss = sum_lo
浏览 0
提问于2020-05-24
得票数 3
回答已采纳
1
回答
是什么创建了‘`maxent_treebank_pos_tagger/english.泡菜’?
、
、
、
nltk包的内置语音标记似乎没有针对我的用例()进行优化。显示它使用了一个名为maxent_treebank_pos_tagger的保存的、经过预先训练的分类器。除了大量的googling之外,到目前为止,我试图直接查看.pickle对象,以找到它内部的任何线索,从下面开始x = load("nltk_data
浏览 0
提问于2015-07-13
得票数 10
1
回答
如何在建立决策树时找到分割点的
熵
?
、
、
、
训练样本的
熵
为−4/9 log2(4/9)−5/9−(5/9)= 0.9911。所以我按升序对a3值进行排序,找出它们的分裂点。但是如何计算它们的
熵
呢? 上述图像中的信息增益列仅为0.9911 -
熵
.
熵
的
公式
是: 但我不明白如何用这个
公式
来求分裂点的
熵
。
浏览 2
提问于2017-03-24
得票数 0
回答已采纳
1
回答
关于ID3机器学习
算法
中统计
熵
概念的几个疑问
、
、
、
、
我正在研究统计
熵
概念,这是ID3机器学习
算法
所使用的。 因此,例如:
熵
(S)=- (9/14)*Log2(9/14) - (5/14)*Log2(5/14) = 0.940 注意,如果S的所有成员都
浏览 4
提问于2013-06-17
得票数 1
回答已采纳
1
回答
什么应该作为
熵
的来源?
、
、
我有基于硬件的RNG,包括TRNG和PRNG.TRNG给出了一个512位的数字,被用作PRNG的种子.RNG使用PRNG生成160位随机数,并在2^{20}数之后重新播种.我想使用基于硬件的RNG作为
熵
源应使用什么作为
熵
源,即TRNG或PRNG的输出?
浏览 0
提问于2016-07-29
得票数 10
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
最大熵模型原理小结
一文读懂最大熵原理及Python实现
数据挖掘算法——利用信息熵构建决策树
公式难!如何不看公式也能理解支持向量机算法
熵基科技:公司算法对CPU依赖性不高
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券