开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么KL发散会产生nan？是数学错误还是我的输入数据不正确？

KL发散是指在信息论中的一种度量，用于衡量两个概率分布之间的差异。KL发散的计算公式为D(P||Q) = Σ(P(x) * log(P(x)/Q(x)))，其中P和Q分别表示两个概率分布。

当KL发散产生NaN（Not a Number）时，通常是由于输入数据不正确导致的。具体来说，可能存在以下几种情况：

数据范围问题：KL发散计算中的概率值应该在0到1之间，如果输入的概率值超出了这个范围，就会导致计算结果为NaN。因此，需要检查输入数据的范围是否正确。
数据缺失问题：如果输入的概率分布中存在缺失值或者某些概率为0的情况，也会导致KL发散计算结果为NaN。在计算KL发散之前，需要确保输入数据完整且没有缺失。
分母为0问题：KL发散计算中的分母不能为0，否则会导致计算结果为NaN。因此，需要检查输入数据中是否存在分母为0的情况。
数据格式问题：KL发散的计算需要保证输入数据的格式正确，例如概率分布的维度和元素个数需要一致。如果输入数据的格式不正确，就会导致计算结果为NaN。

总结来说，当KL发散产生NaN时，需要检查输入数据的范围、完整性、分母是否为0以及数据格式是否正确。如果以上问题都排除了，那么可能是数学计算中的一些特殊情况导致的。在这种情况下，可以尝试使用其他方法或者算法来计算KL发散，或者检查是否存在其他错误导致计算结果不正确。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

发散与收敛的漫谈2022.9.26

知识的悖论：（不正确的知识，不能影响行为。而正确的知识，一旦影响了行为，环境变化，知识又变为旧知识。）

02

警惕！损失Loss为Nan或者超级大的原因

训练或者预测过程中经常会遇到训练损失值或者验证损失值不正常、无穷大、或者直接nan的情况：

05

Tensorflow入门教程（十一）——数值稳定性

上一篇我介绍了一些如何调试Tensorflow模型。这一篇我会说一说数值稳定性。

02

ICLR 2020 满分论文 | 额外高斯先验目标，缓解负多样性无知

International Conference on Learning Representations（ICLR）（国际学习表征会议）是深度学习的顶级会议。ICLR 2020将于2020年 4 月 26 日在埃塞俄比亚首都亚的斯亚贝巴举行，本届会议共收到2594篇论文，有687篇被接收，其中48篇orals，108篇spotlights和531篇poster。在这687篇被录用的文章中有34篇是满分论文。上海交通大学计算机系智能交互与认知工程、上海高校重点实验室赵海教授及其合作者的论文被评为ICLR2020满分论文之一。

03

来吧！带你漫游 Wasserstein GAN 的世界！

前言上次带大家写了原始版的 GAN，只生成了高斯分布。但兔子哥哥发现在 GAN 论文的底下，有 GAN 生成图片的 example。因此，这足以说明 GAN 亦有能力生成图片，并非只有 DCGAN

04

独家 | 你的神经网络不起作用的37个理由（附链接）

有一个网络已经训练了12个小时。一切看起来都很好：梯度是逐渐变化的，损失在减少。但接下来的预测：都是零，所有的图像背景都没有被检测到。“我做错了什么？”——我问我的电脑，但它没有回答我。

02

[数据清洗]-看上去一样的数字

数据不正确（格式不正确，数据不准确，数据缺失）我们做什么都是徒劳。数据清洗时数据分析的第一步，也是最耗时的一步。数据清洗很枯燥，但是随着数据清理技巧越来越熟练，就有越有可能从他人无从下手的文档中获取

03

你的神经网络不起作用的37个理由

有一个网络已经训练了12个小时。一切看起来都很好：梯度是逐渐变化的，损失在减少。但接下来的预测：都是零，所有的图像背景都没有被检测到。“我做错了什么？”——我问我的电脑，但它没有回答我。

00

GPT-4 做「世界模型」，让LLM从「错题」中学习，推理能力显著提升

这段时间，大语言模型在各种 NLP 任务中取得了重大进展，尤其是在需要复杂的思维链（CoT）推理的数学问题方面。

04

CUDA error: device-side assert triggered

CUDA是一种通用的并行计算平台和编程模型，可以使用CUDA C/C++编写高性能的GPU加速代码。然而，在使用CUDA进行开发时，有时会遇到"cuda error: device-side assert triggered"的错误。本文将介绍这个错误的原因，以及如何解决它。

01

一网打尽！深度学习常见问题！

在传统软件工程中，程序问题（即Bugs）会导致程序崩溃，但开发人员可以通过检查错误来了解原因。

01

为什么我不再推荐你用Julia？

选自yuri.is 作者：Yuri Vishnevsky 机器之心编译编辑：蛋酱、小舟从诞生之日起，Julia 已经走过了十多个年头。作为一个面向科学计算的高性能动态高级程序设计语言，Julia 在许多情况下拥有能与编译型语言相媲美的性能，且足够灵活。曾有开发者盛言赞美 Julia，从速度、通用性、多重派发等多个维度出发，认为 Julia 甚至比 Python 更胜一筹。当然，也有人发现了 Julia 尚存在一些不足之处，开发者 Yuri Vishnevsky 就写了一篇博客控诉 Julia，并

03

RLHF中的「RL」是必需的吗？有人用二进制交叉熵直接微调LLM，效果更好

近来，在大型数据集上训练的无监督语言模型已经获得了令人惊讶的能力。然而，这些模型是在具有各种目标、优先事项和技能集的人类生成的数据上训练的，其中一些目标和技能设定未必希望被模仿。

02

Nat. Comput. Sci. | 人类般的直觉行为和推理偏见在大型语言模型中出现，但在ChatGPT中消失了

今天为大家介绍的是来自Michal Kosinski团队的一篇论文。作者设计了一系列语义幻觉和认知反思测试，旨在诱发直觉性但错误的反应。作者将这些任务（传统上用于研究人类的推理和决策能力）应用于OpenAI的生成预训练变换器模型家族。结果显示，随着模型在规模和语言能力上的扩展，它们越来越多地显示出类似人类的直觉型思维和相关的认知错误。这一模式随着ChatGPT模型的引入而显著转变，这些模型倾向于正确响应，避免了任务中设置的陷阱。ChatGPT-3.5和4都利用输入输出上下文窗口进行思维链推理。作者的发现强调了将心理学方法应用于研究大型语言模型的价值，因为这可以揭示先前未被发现的突现特性。

01

独家 | 你的神经网络不起作用的37个理由（附链接）

有一个网络已经训练了12个小时。一切看起来都很好：梯度是逐渐变化的，损失在减少。但接下来的预测：都是零，所有的图像背景都没有被检测到。“我做错了什么？”——我问我的电脑，但它没有回答我。

01

前端代码规范常见错误一

携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第23天，点击查看活动详情 >> # CSS知识框架

03

重学Javascript之数据类型

模板字符串是ES6中出现的。作为新出现的特性，必定是为了解决以前存在的一些痛点，及做了扩展。

00

C++中的 sqrt、sqrtl 和 sqrtf

C++库中有多种函数可用于计算数字的平方根。最突出的是使用 sqrt。它以双重作为论据。 header 定义了另外两个内置函数，用于计算一个数字（sqrt 除外）的平方根，该数字的参数类型为float和long double。因此，用于计算C++平方根的所有函数都是：

03

OpenAI用GPT-3与小学生比数学，水平达90%！60亿小模型性能翻倍，追平1750亿大模型

---- 新智元报道来源：OpenAI 编辑：好困小咸鱼【新智元导读】近日，OpenAI训练了一个系统可以解决小学数学问题。一个9-12岁的小孩子在测试中得分为60分，而OpenAI的新方法在同样的问题上可以拿到55分，已经达到了人类小学生90%左右的水平！还记得上小学时，被「口算天天练」里面的应用题绕晕的阴影吗？来，试一道！「小明每半小时喝一瓶水。一个普通的数独难题要花他45分钟。一个极难的数独需要4倍的时间。做一道极难的数独那段时间他喝了多少瓶水？」不算难吧。但这回，OpenA

02

斯坦福提出机器学习开发新思路：无Bug的随机计算图Certigrad（已开源）

选自Github 机器之心编译参与：李泽南、蒋思源在实践中，机器学习算法经常会出现各种错误，而造成错误的原因也经常难以找到。近日，斯坦福大学的研究者提出了一种开发机器学习系统的新思路：以数学定理为基础构建机器学习随机计算图，以达到无 bug、自动化的目的，他们提出了随机计算图系统 Certigrad。在实验中，研究人员证明了该方法在未经大量优化的情况下达到了可以和 TensorFlow 相媲美的表现。目前，该项目已经开源。项目链接：https://github.com/dselsam/certigr

07

java四舍五入成整数的方法

在java的Math类中，提供了许许多多的和数学计算有关的方法，其中也包括取整的，关于取整的有向下取整的floor(double d)返回值double，rint(double d),round(double d)和round(float f)。

02

深度学习的这些坑你都遇到过吗？神经网络11大常见陷阱及应对方法

如果你的神经网络不工作，该怎么办?本文作者列举了搭建神经网络时可能遇到的11个常见问题，包括预处理数据、正则化、学习率、激活函数、网络权重设置等，并提供解决方法和原因解释，是深度学习实践的有用资料。

07

深度学习的这些坑你都遇到过吗？神经网络 11 大常见陷阱及应对方法

【新智元导读】如果你的神经网络不工作，该怎么办？本文作者列举了搭建神经网络时可能遇到的11个常见问题，包括预处理数据、正则化、学习率、激活函数、网络权重设置等，并提供解决方法和原因解释，是深度学习实践的有用资料。如果你的神经网络不工作，该怎么办？作者在这里列出了建神经网络时所有可能做错的事情，以及他自己的解决经验。忘记规范化数据忘记检查结果忘记预处理数据忘记使用正则化使用的batch太大使用了不正确的学习率在最后层使用了错误的激活函数你的网络包含了Bad Gradients 初始化网络权重

04

深度学习这些坑你都遇到过吗？

原文地址：My Neural Network isn't working! What should I do? 如果你的神经网络不工作，该怎么办？本文作者列举了搭建神经网络时可能遇到的11个常见问题

05

辨别真假数据科学家必备手册:深度学习45个基础问题（附答案）

大数据文摘作品，转载要求见文末作者 | Faizan Shaikh 编译团队 | Aileen，曹翔，刘晓莉，行者简介早在2009年，深度学习还只是一个新兴领域，只有少数人认为它是一个多产的研究方向。今天，深度学习正在被用来开发那些过去被认为是不可能完成的应用。语音识别，图像识别，数据中的模式识别，照片中的对象分类，字符文本生成，自动驾驶汽车等等只是其中几个示例。因此，熟悉深度学习及其概念显得尤为重要。在这个测试中，我们考察了社区成员的深度学习基本概念。总共有1070人参加了这项技能测试。

08

Wasserstein GAN：GAN稳定训练的突破

In no experiment did we see evidence of mode collapse for the WGAN algorithm.

01

记录模型训练时loss值的变化情况

一般我们在训练神经网络模型的时候，都是每隔多少步，输出打印一下loss或者每一步打印一下loss，今天发现了另一种记录loss变化的方法，就是用

02

训练的神经网络不工作？一文带你跨过这37个坑

选自Medium 作者：Slav Ivanov 机器之心编译参与：黄小天、Smith 近日，Slav Ivanov 在 Medium 上发表了一篇题为《37 Reasons why your Neural Network is not working》的文章，从四个方面（数据集、数据归一化／增强、实现、训练），对自己长久以来的神经网络调试经验做了 37 条总结，并穿插了不少出色的个人想法和思考，希望能帮助你跨过神经网络训练中的 37 个大坑。机器之心对该文进行了编译，原文链接请见文末。神经网络已经持续训

一文教你构建图书推荐系统【附代码】

推荐系统在电子商务网站中广泛被使用，如何向用户推荐最适合其品味的产品是研究的重点。本文在Book Crossing数据集的基础上进行图书推荐系统的研究，详细讲解了构建推荐系统的步骤：加载数据集（图书、用户、评分表）、检查各个数据集等，并实现了基于流行度的简单推荐系统和基于协同过滤的推荐系统（基于用户和基于item）。通读本文，相信你一定能理解简单推荐系统的构建过程。

03

【干货】一文教你构建图书推荐系统（附代码）

【导读】推荐系统在电子商务网站中广泛被使用，如何向用户推荐最适合其品味的产品是研究的重点。本文在Book Crossing数据集的基础上进行图书推荐系统的研究，详细讲解了构建推荐系统的步骤：加载数据集

02

北大计算机博士生先于OpenAI发表预训练语言模型求解数学题论文，曾被顶会拒绝

---- 新智元报道来源：EMNLP 编辑：好困小咸鱼【新智元导读】北大博士生沈剑豪同学一篇关于「用语言模型来解决数学应用题」的EMNLP投稿在综合评审时被认为不够重要，收录于Findings而没有被主会接收。有趣的是，OpenAI的最新工作与该论文的方法不谋而合，并表示非常好用。最近，EMNLP 2021开奖了！华人作者包揽了最佳长、短论文。然而，有人欢喜有人忧。北大博士生沈剑豪领衔的一篇关于「用语言模型来解决数学应用题」（Generate & rank: A multi-task

03

5 个原则教你Debug神经网络

很多情况下，研究人员会遇到一个问题：使用机器学习框架实现的神经网络可能与理论模型相去甚远。验证这款模型是否可靠，直接方式就是不断修正和调参。

02

人类：我觉得1+1=956446，你觉得呢？大模型：啊对对对

大型语言模型（LLM）的自然语言理解与生成能力一直备受称赞，特别是 ChatGPT 等对话式语言模型能够与人类流畅、自然地进行多轮对话。

01

如何在tweet上识别不实消息（二）

我们提出的特征到目前为止都是基于个人tweet的内容。在第二组特征我们专注于tweet上的用户行为。我们观察了4种类型的基于网络的性能，并建立2种捕获他们的特征。

01

useState避坑指南

React的useState钩子是开发人员在处理函数组件状态时不可或缺的工具。尽管它看起来似乎很简单，但即使是经验丰富的开发人员也可能犯一些常见的错误，导致意外行为和错误。在本文中，我们将探讨八个常见的useState错误，并提供详细的解释和示例，以帮助你避免这些陷阱。

01

解决ValueError: Could not interpret input day

在进行日期处理时，我们有时会遇到ValueError: Could not interpret input day的错误。这个错误通常是由于输入的日期格式不正确或无法解释导致的。在本篇文章中，我们将介绍这个错误的可能原因，并提供一些解决方案来避免或修复这个错误。

05

NumPy 1.26 中文文档（五十八）

这次 NumPy 发布是迄今为止最大的，共有 684 个 PRs 由 184 人贡献并已合并。有关此次发布支持的 Python 版本为 3.7-3.9，不再支持 Python 3.6。重点是

01

春节充电系列：李宏毅2017机器学习课程学习笔记23之结构化学习-Structured SVM（part 1）

【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的Structured learning-linear model，这一节将主要针对讨论Structured learning-Structured SVM。本文内容主要针对机器学习中Structured learning-Structured SVM的Separable Case,proof of Termination以及Non-separable Case 分别详细介绍。话不多说，让我们一起学习这些内容吧课件网址： http:/

04

iOS上new Date异常解决办法

最近有一个项目要实现使用Angluar写一个简历模板, 用户输入姓名/生日/简介...等内容, 然后生成一份在线的简历

02

【论文解读】让我们逐步验证

本文简要介绍了大模型热门论文“Let’s Verify Step by Step ”的相关工作。近年来，大型语言模型在执行复杂的多步骤推理的能力上有了显著的提高。然而，即使是最先进的模型也会经常产生逻辑错误。为了训练更可靠的模型，可以转向为最终结果提供反馈的结果监督，或者转向为每个中间推理步骤提供反馈的过程监督。考虑到训练可靠模型的重要性，并且考虑到人工反馈的高成本，仔细比较这两种方法是很重要的。最近的工作已经开始了这种比较，但仍存在许多问题。论文进行了自己的调查，发现在解决具有挑战性的MATH数据集的问题时，过程监督明显优于结果监督。论文的过程监督模型解决了来自数学测试集的一个代表性子集中的78%的问题。此外，论文还发现，主动学习显著提高了过程监督的有效性。为了支持相关研究，论文还发布了PRM800K，这是一个包含80万 step-level人类反馈标签的完整数据集，用于训练论文的最佳反馈模型。

01

JS基础测试: 下列说法中不正确的是？

JSON：JavaScript 对象表示法（JavaScript Object Notation）。

01

js中==和===有什么不同之处

javaScript具有严格和类型转换相等比较。对于严格相等比较符，要求比较的对象必须具有相同的类型，并且：

03

机器学习中的 7 大损失函数实战总结（附Python演练）

决定走上坡的路径将耗费我们的体力和时间。决定走下坡的路径将使我们受益。因此，下坡的成本是更小的。

02

Tensorflow - Cross Entropy Loss

根据应用场景中,分类目标的独立性与互斥性, 可以选择 sigmoid 或者 softmax 来实现.

06

时至今日，浏览器色彩居然仍旧失真？

物理上正确的颜色渐变（例如，沿着颜色之间的失焦边缘，你会得到想要的），在中点周围同样明亮，代表两种颜色之间的平均。不正确的渲染会使中间变成浑浊的暗色。

PRML读书笔记(3) - 深度理解机器学习之信息论(Information Theory)

「总结自经典教材《Pattern Recognition and Machine Learning》以及김동국教授的人工神经网络纯理论课程。在此感谢作者及教授的辛苦教学。本篇内容很多东西没有很明确地说明，可能会有很多不正确的地方，欢迎指正。」

03

使用 Python 进行数据清洗的完整指南

如果你没有听过，那么请记住：数据清洗是数据科学工作流程的基础。机器学习模型会根据你提供的数据执行，混乱的数据会导致性能下降甚至错误的结果，而干净的数据是良好模型性能的先决条件。当然干净的数据并不意味着一直都有好的性能，模型的正确选择（剩余 20%）也很重要，但是没有干净的数据，即使是再强大的模型也无法达到预期的水平。

03

使用Python的错误计算器

Python 中的错误计算器是某些计算给出错误结果的计算器。在 Python 中，我们可以创建自己的计算器并使用它来进行数学计算。如果我们想创建一个有缺陷的计算器，我们需要在执行计算的函数中创建或引入错误。在本文中，我们将使用 Python 创建一个有缺陷的计算器。

02

暴力破解-H3C路由器-MSR900

所暴力破解的设备信息华三路由器设备型号 MSR900 软件版本 CMW520-R2311 所用到的工具 Firefox浏览器及其插件Proxy Switcher， OWASP ZAP代理抓包工具。 OWASP ZAP 代理抓包工具 https://www.owasp.org/index.php/OWASP_Zed_Attack_Proxy_Project PKAV HTTP Fuzzer 1.5.6（这个工具下载后内含pdf说明书可自行阅读学习） http://www.pkav.net/too

06

自然梯度优化详解

对于一阶近似，所有现代的深度学习模型都是使用梯度下降训练的。在梯度下降的每一步，您的参数值开始于某个起点，并将它们移动到最大的损失减少的方向。通过对损失对整个参数向量求导，也就是雅可比矩阵。然而，这只是损失的一阶导数，它没有告诉你曲率的任何信息，或者说，一阶导数变化的有多快。由于您所处的区域中，您对一阶导数的局部近似可能不会从该估计值点(例如，就在一座大山前面的一条向下的曲线)推广到很远的地方，所以您通常希望谨慎，不要迈出太大的一步。因此，为了谨慎起见，我们用步长控制前进的速度，即α（alpha），如下式所示。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭