Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Keras中损失函数的意义?

Keras中损失函数的意义?
EN

Stack Overflow用户
提问于 2020-05-04 01:34:45
回答 1查看 440关注 0票数 0

我用python中的keras建立了一个神经网络,无法真正理解损失函数的含义。

这里首先介绍一些一般信息:我使用了类为0-9的扑克手数据集,这是我用OneHotEncoding编写的向量。我在最后一层使用了softmax激活,所以我的输出告诉我,如果样本属于某个类,向量中的10个条目中的每个条目的概率。例如:我的实际输入(0,1,0,0,0,0,0,0,0,0,0),这意味着第1类(从0-9表示从没有牌到皇家同花顺),第1类意味着一对(如果你知道扑克)。利用神经网络,它得到了像(0.4,0.2,0.1,0.1,0.2,0, 0,0,0,0)这样的输出,这意味着我的样本属于0类,20 %属于1类,等等!

好了!我还使用二进制cross_entropy作为损失,准确性度量和.当我从keras中使用mode.evaluate()时,我得到了类似于0.16的损失,我不知道如何解释这一点。这是否意味着,平均而言,我的预测偏离了真实的0.16?所以如果我对0级的预测是0.5,也可以是0.66或0.34?或者我怎么解释它?

请派人来帮忙!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-05-04 02:08:38

首先,根据您的问题定义,您有一个多类问题。因此,您应该使用categorical_crossentropy。二进制cross_entropy适用于两类问题或多标签分类.

但一般情况下,损失函数的值具有相对的影响值。首先,您必须理解cross_entropy的含义。公式是:

其中c是观测的正确分类

Y是二进制指示符(0或1),如果类标号c是观测值o的正确分类,那么p是c类的预测概率。

对于二进制交叉熵,M等于2。对于范畴交叉熵,M>2。因此,当预测的概率收敛到实际标号时,交叉熵就会减小:

现在让我们以您的示例为例,其中您有10个类,实际输入是:(0,1,0,0,0,0,0,0,0,0,0,0,0)。如果你损失了0.16,就意味着

这意味着您的模型已将0.85分配给正确的标签。

因此,损失函数给出正确分类概率的日志。在角点中,损失是按整批计算的,它是整个数据在特定批次中正确分类概率的日志的平均值。如果您使用evaluate函数,那么您正在评估的整个数据的正确分类概率的日志平均值。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61589138

复制
相关文章
Keras 模型多输出 loss weight metrics 设置
keras支持模型多输入多输出,本文记录多输出时loss、loss weight和metrics的设置方式。 模型输出 假设模型具有多个输出 classify: 二维数组,分类softmax输出,需要配置交叉熵损失 segmentation:与输入同尺寸map,sigmoid输出,需要配置二分类损失 others:自定义其他输出,需要自定义损失 具体配置 model 变量均为模型中网络层 inputs = [input_1 , input_2] outputs = [classify, segm
为为为什么
2022/08/05
5770
R语言深度学习Keras循环神经网络(RNN)模型预测多输出变量时间序列
递归神经网络被用来分析序列数据。它在隐藏单元之间建立递归连接,并在学习序列后预测输出。 在本教程中,我们将简要地学习如何用R中的Keras RNN模型来拟合和预测多输出的序列数据,你也可以对时间序列数据应用同样的方法。我们将使用Keras R接口在R中实现神经网络:
拓端
2021/09/30
2.2K0
R语言深度学习Keras循环神经网络(RNN)模型预测多输出变量时间序列
预测金融时间序列——Keras 中的 MLP 模型
本文的目的是展示使用时间序列从数据处理到构建神经网络和验证结果的过程。作为一个例子,金融系列被选择为完全随机的,一般来说,如果传统的神经网络架构能够捕获必要的模式来预测金融工具的行为,那就很有趣了。
磐创AI
2021/11/11
5.4K1
预测金融时间序列——Keras 中的 MLP 模型
Keras学习(一)—— Keras 模型(keras.model): Sequential 顺序模型 和 Model 模型
首先了解Keras的一个很好的途径就是通过 文档 Keras 中文文档地址: https://keras.io/zh/models/about-keras-models/
全栈程序员站长
2022/11/15
1.6K0
Keras模型
文件下载:https://download.csdn.net/download/sxf1061700625/19229828
小锋学长生活大爆炸
2021/06/11
5270
Keras保存模型
一、不保存模型只显示大概结构 model.summary() 这个函数会打印模型结构,但是仅仅是打印到控制台。
润森
2019/11/04
1.1K0
9种平台帮助你深度学习Keras
Keras是一个Python深度学习库,它可以使用高效的Theano或TensorFlow符号数学库作为后端。同时,Keras很容易使用,你可以在几分钟内开发出你的第一个多层感知器,卷积神经网络,或者
AiTechYun
2018/03/02
8390
9种平台帮助你深度学习Keras
6 种用 LSTM 做时间序列预测的模型结构 - Keras 实现
LSTM(Long Short Term Memory Network)长短时记忆网络,是一种改进之后的循环神经网络,可以解决 RNN 无法处理长距离的依赖的问题,在时间序列预测问题上面也有广泛的应用。
杨熹
2019/04/07
10.4K1
Keras 实现 LSTM时间序列预测
本文将介绍如何用 keras 深度学习的框架搭建 LSTM 模型对时间序列做预测。
机器学习AI算法工程
2019/10/28
2.4K1
Keras 学习笔记(三)Keras Sequential 顺序模型
你可以通过将网络层实例的列表传递给 Sequential 的构造器,来创建一个 Sequential 模型:
种花家的奋斗兔
2020/11/12
2.4K0
根据序列,进行中后序列输出
#include #include #include #include typedef struct BiTNode {//二叉树结点 char data; //数据 struct BiTNode* lchild, * rchild; //左右孩子指针 } BiTNode, * BiTree; int nn = 0; int CreateBiTree(BiTree* T) {//按先序序列创建二叉树 char data; sc
川川菜鸟
2021/10/18
2570
序列生成模型(一):序列概率模型
  序列数据在深度学习应用中非常常见,它们是按照时间顺序或者其他顺序排列的数据集合。序列数据的处理通常涉及到捕捉数据中的时间关系、趋势和模式,因此需要使用专门的模型来处理这些信息。以下是一些常见的序列数据类型以及相应的深度学习应用:
Qomolangma
2024/07/30
2380
序列生成模型(一):序列概率模型
可视化Keras模型
您是否曾经想过您的神经网络实际上是如何连接不同的神经元的?如果您可以可视化所设计的模型架构,那不是很好吗?如果您可以将模型架构下载为演示时可以使用的图像,那不是很好吗?如果所有这些都为“是”,那么您来对地方了。 在本文中,我将向你展示一个Ë xciting Python包/模块/库,可用于可视化Keras模型。无论是卷积神经网络还是人工神经网络,该库都将帮助您可视化所创建模型的结构。 Keras Visualizer是一个开源python库,在可视化模型如何逐层连接方面确实很有帮助。因此,让我们开始吧。
致Great
2021/02/25
1.5K0
可视化Keras模型
C#序列化反序列化帮助类
//转载:http://hi.baidu.com/fxh19860822/blog/item/df35230b3ded441495ca6bd5.html 在C#中常见的序列化的方法主要也有三个:BinaryFormatter、SoapFormatter、XML序列化 /// <summary> /// 提供序列化和反序列化对象的相关静态方法。 /// </summary> public class SerializerHelper { ///
跟着阿笨一起玩NET
2018/09/18
1.6K0
Keras多输入模型实例
一般情况下,利用Keras建立模型,会使用线性模型(Sequential),但是在一些特殊情况下,我们或许会有多个input,这样的话,我们就不会使用线性模型,而使用Keras的Model。
Ziyue
2020/01/15
2.4K0
Keras多输入模型实例
keras系列︱Sequential与Model模型、keras基本结构功能(一)
该文章介绍了在深度学习模型中,不同的层对输入进行计算,从而影响模型的性能。文章详细讨论了卷积层、池化层、全连接层和LSTM层的特点和作用,以及如何使用这些层来构建高性能的模型。此外,文章还探讨了如何通过冻结层和重新训练层来提高模型的性能。
悟乙己
2018/01/02
10.2K0
keras系列︱Sequential与Model模型、keras基本结构功能(一)
理解keras中的sequential模型
keras中的主要数据结构是model(模型),它提供定义完整计算图的方法。通过将图层添加到现有模型/计算图,我们可以构建出复杂的神经网络。
云水木石
2019/07/02
3.7K0
keras中文-快速开始Sequential模型
模型需要知道输入数据的shape,因此,Sequential的第一层需要接受一个关于输入数据shape的参数,后面的各个层则可以自动的推导出中间数据的shape,因此不需要为每个层都指定这个参数。有几种方法来为第一层指定输入数据的shape
CreateAMind
2018/07/25
9420
keras中文-快速开始Sequential模型
Keras中的多变量时间序列预测-LSTMs
神经网络诸如长短期记忆(LSTM)递归神经网络,几乎可以无缝地对多变量输入问题进行建模。
朱卫军 AI Python
2022/04/02
3.2K0
Keras中的多变量时间序列预测-LSTMs
python在Keras中使用LSTM解决序列问题
时间序列预测是指我们必须根据时间相关的输入来预测结果的问题类型。时间序列数据的典型示例是股市数据,其中股价随时间变化。
拓端
2020/09/26
3.6K0

相似问题

Keras加载的模型输出与训练模型输出不同。

10

Keras序列模型返回损失'nan‘

30

Keras模型的输出训练参数

10

产生相同输出的Keras模型

50

Keras中间层(注意模型)输出

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档