腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何
通过
在
交叉
熵
中
添加
负
熵
来
创建
自定义
损失
函数
?
、
、
、
、
作者讨论了
通过
向
负
对数似然
添加
负
熵
项
来
惩罚低
熵
输出分布以及为模型训练
创建
自定义
损失
函数
来对神经网络进行正则化。 ? 值β控制置信度惩罚的强度。我已经为分类
交叉
熵
编写了一个
自定义
函数
,如下所示,但需要将
负
熵
项
添加
到
损失
函数
中<
浏览 33
提问于2021-08-24
得票数 5
回答已采纳
1
回答
二元
交叉
熵
是
如何
工作的?
、
、
、
、
在
将汇总数据传递到逻辑
函数
(
在
范围$$
中
规范化)之前,必须对权重进行优化,以获得预期的结果。为了为分类目的寻找最优权重,必须找到相对最小的误差
函数
,这可以是cross
熵
。据我所知,
交叉
熵
测量两个概率分布之间的量化,由位两种概率分布的同一事件集之间的差异
来
衡量。 由于某些原因,
交叉
熵
等价于
负
对数似然。$p$和$q$两种概率分布之间的
交叉
熵
损
浏览 0
提问于2018-07-13
得票数 5
回答已采纳
1
回答
MXNET
自定义
损失
函数
和eval_metric
如何
在MXNET
中
创建
自定义
损失
函数
?例如,我希望计算每个可能标签的加权
交叉
熵
损失
,而不是计算一个标签的
交叉
熵
损失
(使用标准mx.sym.SoftmaxOutput层
来
计算
交叉
熵
损失
,并返回一个可以作为
损失
符号传递给拟合
函数
的符号)。MXNET教程提到使用 mx.symbol
浏览 26
提问于2017-08-22
得票数 3
1
回答
交叉
熵
损失
和逻辑
损失
有什么区别吗?
、
、
、
我想用一个逻辑
损失
函数
作为我的深度学习模型
来
解决一个二元分类问题。我正在用角码
来
建立模型。然而,keras没有任何预先定义的逻辑。
在
阅读关于
损失
函数
的文章时,我遇到了关于
交叉
熵
损失
和逻辑
损失
的混淆陈述。在这个维基百科
中
,有一个关于物流
损失
和
交叉
熵
损失
的单独章节。然而,在这个维基百科
中
,它提到:
浏览 0
提问于2018-03-01
得票数 3
2
回答
火炬
中
的软
交叉
熵
、
、
、
我有一个小问题,实现一个软
交叉
熵
损失
在
火把。 对于我的模型,我需要实现一个加权的软
交叉
熵
损失
,这意味着目标值也是概率向量,而不是热向量。一般来说,我有点搞不懂
如何
用pytorch
创建
一个
自定义
损失
函数
,以及自动梯度是
如何
遵循
自定义
损失
函数
的,特别是
在
模型建立之后,我们应用了一些非数学的
浏览 2
提问于2021-08-24
得票数 0
1
回答
多个正分类的流量
损失
计算
、
、
、
我的标签看起来像这样这意味着
在
匹配的示例输入
中
存在类1, 4。
如何
为这样的标签
创建
一个热编码标签?哪种
损失
函数
更适合这种情况(乙状结肠
交叉
熵
、softmax
交叉
熵
或稀疏softmax
交叉
熵
)?
浏览 1
提问于2018-01-27
得票数 0
回答已采纳
1
回答
当预测已经有可能时,毕火炬进行
交叉
熵
损失
。
、
、
、
、
因此,通常可以使用PyTorch
中
的
交叉
熵
损失
函数
来应用范畴
交叉
熵
,或者将logsoftmax与
负
日志相似
函数
结合起来,例如:loss = nn.NLLLoss其中的数据如下所示:
如何
在Py
浏览 0
提问于2019-07-18
得票数 3
回答已采纳
1
回答
如何
在Keras或Tensorflow中将L1范数
添加
到
损失
函数
中
?
、
、
、
、
我试图重现一篇深度学习论文的实验结果, 我注意到
损失
函数
,类别
交叉
熵
具有L1正则化,可以在下面看到, ? 那么,
如何
计算模型复杂度并在Keras/Tensorflow
中
添加
正确的
自定义
损失
函数
呢?
浏览 38
提问于2019-10-15
得票数 1
回答已采纳
1
回答
GRU
损失
降至0.9,但不会进一步下降,PyTorch
、
、
、
、
tensor([4.8500e-01, 9.7813e-06, 5.1498e-01, 6.2428e-06, 7.5929e-06], grad_fn=<SelectBackward>)
损失
为对于这些简单的输入数据,GRU
损失
是如此之大。原因何在?这段代码中有什么错误吗?我使用cross_entropy作为
损失
函数
,使用Adam作为优化器。学习率为0.001。我
添加
了批量归一化,它加快了训练速度,但
损失
和准确率相同。为什么
损失
不会减少到0.
浏览 40
提问于2020-10-15
得票数 2
回答已采纳
1
回答
我对配重的一般理解正确吗?
、
、
、
我试着做一个例子,向我自己解释权重是
如何
从数学上找到的。如果我下面写的是胡说八道的话,我很高兴听到你的解释。谢谢。 。
浏览 2
提问于2017-01-29
得票数 1
3
回答
什么是体重衰减?
、
、
、
在
浏览网站上的时,我看到了一段让我有点困惑的段落: 训练网络进行N维分类的常用方法是多项式logistic回归。softmax回归Softmax回归将一个softmax非线性应用于网络的输出,并计算归一化预测和标签的1-热编码之间的
交叉
熵
。对于正则化,我们还将通常的质量衰减
损失
应用于所有学习变量。模型的目标
函数
是
交叉
熵
损失
和所有这些重量衰减项之和,由
损失
()
函数
返回。我
在
论坛上读过一些关于什么是重
浏览 14
提问于2017-08-07
得票数 2
回答已采纳
1
回答
交叉
熵
损失
Pytorch
、
、
、
、
我有一个关于我的pytorch网络
中
交叉
熵
损失
的最佳实现的问题。我正在构建一个网络,用于预测Volume-Pictures的3D分割。训练时输入到我的网络
中
的形状是batch_size,input_channels,width,height,depth。输入通道等于1,因为我只有灰度图像,深度取决于组成3D体积的2D图片的数量。现在我想计算
交叉
熵
损失
。它收敛到0.5-0.6的
损失
,并且它只预测整个输出是背景。我该怎么办? 如果有人能帮
浏览 2
提问于2021-06-08
得票数 0
1
回答
当可能发生多个操作时,策略梯度是多少?
、
我想把它扩展到多个动作,所以我相信我需要输出层上的softmax激活
函数
。但是,我不确定输出层的梯度应该是多少。如果我
在
监督学习环境中使用具有softmax激活的
交叉
熵
损失
函数
,神经元的梯度就是:其中target[i] = 1用于所需的操作,0用于所有其他操作。然而,强化学习似乎使用
负
对数似然作为
损失
,而不是
交叉
熵
。这是
如何
改变梯度的?
浏览 6
提问于2017-05-10
得票数 3
回答已采纳
2
回答
Keras版本的组合
交叉
熵
和校准
损失
、
、
、
、
该研究
通过
测量预测置信度和准确性(DCA)之间的差异,并将其作为辅助项
添加
到
交叉
熵
损失
中
,将校准纳入深度学习模型的训练过程。据说DCA项适用于当
交叉
熵
损失
减少时应用惩罚,但准确性处于平台期。Pytorch
中
的代码如下: import torch def cross_entropy_with_dca_loss(logitsaccuracies)
浏览 64
提问于2021-08-12
得票数 0
回答已采纳
1
回答
对二元
交叉
熵
损失
SGD的理解
、
、
、
、
我试图用数学来描述随机梯度下降
如何
被用来最小化二元
交叉
熵
损失
。对于二进制
交叉
熵
损失
,我使用以下定义(遵循https://arxiv.org/abs/2009.14119):L_{tot} = \sum_{k=1}^K L(\sigma(z_k),y_k)\\ L为了结合这些定义,我认为
通过
使用参数z_k (因为这是模型试图学习的内容)
来
最小化二进制
交叉
熵
<em
浏览 0
提问于2022-05-19
得票数 1
回答已采纳
1
回答
Tensorflow ValueError: logits和标签必须具有相同的形状((无,2) vs (无,1))
、
、
在这里,我将电影评论分类为三类(正为1,中性为0,
负
为-1),使用二进制
交叉
熵
。所以,当我试图用tensorflow估计
来
包装我的keras模型时,我得到了误差。
浏览 3
提问于2020-08-12
得票数 2
回答已采纳
4
回答
为什么不使用均方误差
来
解决分类问题呢?
、
、
、
、
我正在努力找出正确的网络
损失
函数
。问题是,当我使用二元
交叉
熵
作为
损失
函数
时,训练和测试的
损失
值要比使用均方误差(MSE)
函数
要高。我不知道
如何
证明这些结果是合理的。为什么不使用均方误
浏览 0
提问于2019-05-06
得票数 11
回答已采纳
1
回答
拥抱面部变形金库培训师的
损失
函数
是什么?
、
、
、
、
拥抱面部变形金库培训师的
损失
函数
是什么?在他们的
中
,他们提到可以
通过
重写类
中
的compute_loss方法
来
指定
自定义
的丢失
函数
。但是,如果我不使用该方法覆盖并使用训练器直接细化伯特模型以进行情感分类,那么默认的
损失
函数
是什么?是绝对
交叉
熵
吗?谢谢!
浏览 13
提问于2022-03-23
得票数 4
回答已采纳
5
回答
我应该在我的LSTM中使用哪种丢失功能?为什么?
、
、
、
现在我不确定我应该使用哪种丢失
函数
。现在,我只知道两个预定义的
损失
函数
稍微好一点,这两个
函数
似乎都不适合我的例子:编辑 另一个问题:您会在Keras中使用哪种激活功能?
浏览 0
提问于2019-02-23
得票数 1
回答已采纳
1
回答
Keras "acc“度量-一种算法
、
、
在
Keras
中
,我经常看到人们用均方误差
函数
和"acc“作为度量标准
来
编译模型。如果我将我的
损失
函数
更改为二进制
交叉
熵
作为一个例子,并使用'acc‘作为度量标准呢?这是与第一种情况相同的度量标准,还是Keras基于
损失
函数
改变这个acc -所以在这种情况下是二进制
交叉
熵
?
浏览 0
提问于2019-03-13
得票数 1
回答已采纳
点击加载更多
相关
资讯
transformer 模型的损失函数
Focal Loss详解以及为什么能够提高处理不平衡数据分类的表现
从信息论的角度来理解损失函数
机器学习中常用的损失函数
KL散度和交叉熵的对比介绍
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券