首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

我的机器学习概率论篇排列 组合古典概率联合概率条件概率全概率公式贝叶斯公式独立事件随机变量离散型随机变量连续型随机变量期望和方差三个基本定理参数估计

前言: 概率论的理解有些抽象,掌握概率论的方法,用实际样本去无限接近真实,熟练掌握并且使用一些最基本的概念是前提,比如,均值,方差 排列 组合 计算各种公式的基础 排列 image.png 组合...image.png 古典概率 事件A 构成事件A发生的基本时间有a个 不构成事件A发生的基本事件有b个 image.png 联合概率 两个事件共同发生记为P(AB) 条件概率...指 数 分 布 3)正 态 分 布 image.png 一般正态函数的计算,先转化为标准正态函数 期望和方差 学完最好,证明一下前面各个分布的期望和方差...期望 也就是均值,是概率加权下的“平均值”,是每次可能 结果的概率乘以其结果的总和,反映的实随机变量平均取值大小。...)离散型 image.png 2)连续型 image.png 由于f(x)>0,f(x)取对数之后的单调性不变,所以可转化为: image.png 你可能感冒的文章:

2K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    第一句话正确的概率是百分之百,但这是一句废话,不能提供任何信息量,因为所有人的生日都是一年之中的特定一天;第二句话正确的概率是1/2,它能提供一定的信息量;第三句话正确的概率只有12/365,但是它能提供最大的信息量...所以我们看到: 在缺乏任何先验信息的条件下,一句话正确的概率越大,则它提供的信息量越小 。 在知道表述的信息量和表述正确的概率是反相关后,接下来我们来建立它们之间的定量关系。...一个自然的假设是两个独立表述的信息量具有可加性,例如上面第二句话和上面第三句话提供的总信息量是它们各自提供的信息量之和; 两个独立表述正确的概率具有可乘性,例如上面第二句话和第三句话同时正确的概率为1/...2×12/365=6/365,是它们各自正确概率的乘积。...香农熵 信息量和概率的这种性质促使我们把信息量定义为概率的对数 , 假设一个表述正确的概率是P,则这个表述包含的信息量Q定义为: Q=-k \log P 这里 k是一个正的常数,这保证了当正确概率

    89510

    华中科技提出 FasterDiT: 在不修改架构的情况下实现更快的扩散 Transformers 训练 !

    对数正态采样是一种出色的先导策略,并在后续工作中被证明是有效的[17]。 但是,它也存在一些局限性。...根据SD3的探索,对数正态(-0.5, 1)在ImageNet[13]上的Frechet Inception距离(FID)结果明显优于对数正态(0.5, 0.6)。...作者实现了一个对数正态函数(lognorm)[1]来调整两种不同的时间表(图2a&b)的步进采样,结果如图4所示。作者的分析表明,虽然定义良好的采样策略可以提高性能,但也可能引入风险。...然后,作者通过调整训练数据的方差(std)来将PDF调整到关注训练过程中的最优SNR。进一步,作者使用对数正态函数[1]来突出调整区域的重点。...具体来说,作者在时间步长采样中使用logit正态函数[1],其中和分别设置为0和1。值得注意的是,将设置为0的原因是PDF已经正确偏移(参见图3)。

    11910

    正态性检验

    我们先来想一下正态分布的特征,正态分布的x轴为样本值,从左到右x是逐渐增大的,y轴是每个样本值对应的出现的概率。概率值先上升后下降,且在中间位置达到最高。...2.1 KS检验 KS检验是基于样本累积分布函数来进行判断的。可以用于判断某个样本集是否符合某个已知分布,也可以用于检验两个样本之间的显著性差异。...CDF( cumulative distribution function):累积分布函数,是概率密度函数的积分。 ?...shapiro是专门用于正态性检验的,所以不需要指明分布类型。且 shapiro 不适合做样本数>5000的正态性检验。...03.非正态数据的处理办法 一般数据不是正态就是偏态,如果偏态不严重可以对数据取平方根来进行转换。如果偏态很严重,则可以对数据进行对数转换。转换方法在偏态文章中也有讲过。

    2K20

    一文读懂机器学习分类算法(附图文详解)

    首先对变量之间的关系进行线性回归以构建模型,分类的阈值假设为0.5。 ? 然后将Logistic函数应用于回归分析,得到两类的概率。 该函数给出了事件发生和不发生概率的对数。...在朴素贝叶斯的基础上,高斯朴素贝叶斯根据二项(正态)分布对数据进行分类。 ? P(class|data) 表示给定特征(属性)后数据属于某类(目标)的后验概率。...精度 精度是指在所有预测为正例的分类中,预测正确的程度为正例的效果。 ? 精度越高越好。...召回率 召回率是指在所有预测为正例(被正确预测为真的和没被正确预测但为真的)的分类样本中,召回率是指预测正确的程度。它,也被称为敏感度或真正率(TPR)。 ? 召回率越高越好。...累积精度曲线 CAP代表一个模型沿y轴为真正率的累积百分比与沿x轴的该分类样本累积百分比。CAP不同于接受者操作曲线(ROC,绘制的是真正率与假正率的关系)。

    2K20

    机器学习分类算法

    首先对变量之间的关系进行线性回归以构建模型,分类的阈值假设为0.5。 ? 然后将Logistic函数应用于回归分析,得到两类的概率。 该函数给出了事件发生和不发生概率的对数。...在朴素贝叶斯的基础上,高斯朴素贝叶斯根据二项(正态)分布对数据进行分类。 ? P(class|data) 表示给定特征(属性)后数据属于某类(目标)的后验概率。...精度 精度是指在所有预测为正例的分类中,预测正确的程度为正例的效果。 ? 精度越高越好。...召回率 召回率是指在所有预测为正例(被正确预测为真的和没被正确预测但为真的)的分类样本中,召回率是指预测正确的程度。它,也被称为敏感度或真正率(TPR)。 ? 召回率越高越好。...累积精度曲线 CAP代表一个模型沿y轴为真正率的累积百分比与沿x轴的该分类样本累积百分比。CAP不同于接受者操作曲线(ROC,绘制的是真正率与假正率的关系)。

    1.6K20

    来!一起捋一捋机器学习分类算法

    首先对变量之间的关系进行线性回归以构建模型,分类的阈值假设为0.5。 ? 然后将Logistic函数应用于回归分析,得到两类的概率。 该函数给出了事件发生和不发生概率的对数。...在朴素贝叶斯的基础上,高斯朴素贝叶斯根据二项(正态)分布对数据进行分类。 ? P(class|data) 表示给定特征(属性)后数据属于某类(目标)的后验概率。...精度 精度是指在所有预测为正例的分类中,预测正确的程度为正例的效果。 ? 精度越高越好。...召回率 召回率是指在所有预测为正例(被正确预测为真的和没被正确预测但为真的)的分类样本中,召回率是指预测正确的程度。它,也被称为敏感度或真正率(TPR)。 ? 召回率越高越好。...累积精度曲线 CAP代表一个模型沿y轴为真正率的累积百分比与沿x轴的该分类样本累积百分比。CAP不同于接受者操作曲线(ROC,绘制的是真正率与假正率的关系)。

    44331

    来!一起捋一捋机器学习分类算法

    首先对变量之间的关系进行线性回归以构建模型,分类的阈值假设为0.5。 ? 然后将Logistic函数应用于回归分析,得到两类的概率。 该函数给出了事件发生和不发生概率的对数。...在朴素贝叶斯的基础上,高斯朴素贝叶斯根据二项(正态)分布对数据进行分类。 ? P(class|data) 表示给定特征(属性)后数据属于某类(目标)的后验概率。...精度 精度是指在所有预测为正例的分类中,预测正确的程度为正例的效果。 ? 精度越高越好。...召回率 召回率是指在所有预测为正例(被正确预测为真的和没被正确预测但为真的)的分类样本中,召回率是指预测正确的程度。它,也被称为敏感度或真正率(TPR)。 ? 召回率越高越好。...累积精度曲线 CAP代表一个模型沿y轴为真正率的累积百分比与沿x轴的该分类样本累积百分比。CAP不同于接受者操作曲线(ROC,绘制的是真正率与假正率的关系)。

    44830

    收藏 | 来!一起捋一捋机器学习分类算法

    首先对变量之间的关系进行线性回归以构建模型,分类的阈值假设为0.5。 ? 然后将Logistic函数应用于回归分析,得到两类的概率。 该函数给出了事件发生和不发生概率的对数。...在朴素贝叶斯的基础上,高斯朴素贝叶斯根据二项(正态)分布对数据进行分类。 ? P(class|data) 表示给定特征(属性)后数据属于某类(目标)的后验概率。...精度 精度是指在所有预测为正例的分类中,预测正确的程度为正例的效果。 ? 精度越高越好。...召回率 召回率是指在所有预测为正例(被正确预测为真的和没被正确预测但为真的)的分类样本中,召回率是指预测正确的程度。它,也被称为敏感度或真正率(TPR)。 ? 召回率越高越好。...累积精度曲线 CAP代表一个模型沿y轴为真正率的累积百分比与沿x轴的该分类样本累积百分比。CAP不同于接受者操作曲线(ROC,绘制的是真正率与假正率的关系)。

    48220

    来!一起捋一捋机器学习分类算法

    首先对变量之间的关系进行线性回归以构建模型,分类的阈值假设为0.5。 ? 然后将Logistic函数应用于回归分析,得到两类的概率。 该函数给出了事件发生和不发生概率的对数。...在朴素贝叶斯的基础上,高斯朴素贝叶斯根据二项(正态)分布对数据进行分类。 ? P(class|data) 表示给定特征(属性)后数据属于某类(目标)的后验概率。...精度 精度是指在所有预测为正例的分类中,预测正确的程度为正例的效果。 ? 精度越高越好。...召回率 召回率是指在所有预测为正例(被正确预测为真的和没被正确预测但为真的)的分类样本中,召回率是指预测正确的程度。它,也被称为敏感度或真正率(TPR)。 ? 召回率越高越好。...累积精度曲线 CAP代表一个模型沿y轴为真正率的累积百分比与沿x轴的该分类样本累积百分比。CAP不同于接受者操作曲线(ROC,绘制的是真正率与假正率的关系)。

    47520

    医学统计学:总体均数的估计与假设检验

    ,根据P 值作出的推断结论具有概率性,因此其结论不可能完全正确,可能发生如下「两种错误」: ?...应根据分析目的、资料类型和分布、设计方案的种类、样本含量大小等选用适当的检验方法。 「正确理解”显著性“一词的含义」。...7.1 正态性检验 正态性检验的方法总的来说有两大类:「图示法」和「计算法」。 图示法主要采用「概率图」(P-P plot)和「分位数图」(Q-Q plot)。...其中 P-P 图是以实际或观察的累积频率对被检验分布的理论或期望累积频率作图,而 Q-Q 图则是以实际或观察的分位数对被检验分布的理论或期望分位数作图,其中以 Q-Q 图的效率较高。...适用条件: 对数正态分布资料,即原始数据的效应是相乘时 各样本标准差与均数成比例或变异系数是常数 「平方根变换」(square root transformation)。

    2.1K30

    用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析|附代码数据

    hist(x,y) 使用累积分布函数的核估计器将数据转换为 copula 。...例如,金融风险的蒙特卡罗模拟可能具有代表不同保险损失来源的随机输入。这些输入可能被建模为对数正态随机变量。一个合理的问题是这两个输入之间的依赖性如何影响模拟结果。...从模拟中得出的结论很可能取决于 X1 和 X2 是否具有相关性。 在这种情况下,二元对数正态分布是一个简单的解决方案,当然很容易推广到更高维度和边缘分布是 不同 对数正态的情况。...构建相依双变量分布的更通用方法 尽管创建二元对数正态的上述构造很简单,但它用于说明更普遍适用的方法。首先,我们从二元正态分布生成值对。这两个变量之间存在统计相关性,且均具有正态边缘分布。...但是, X1 和 X2 的线性相关性是 rho是 _不_正确的。例如,在原始对数正态情况下,该相关有一个形式:   cor(X1,X2) = (exp(rho.

    1K40

    用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析

    当 u 包含通过边缘累积分布函数的参数估计转换为单位超立方体的数据时,这称为边缘_推断函数 (IFM)_ 方法。...hist(x,y) 使用累积分布函数的核估计器将数据转换为 copula 。...从模拟中得出的结论很可能取决于 X1 和 X2 是否具有相关性。 在这种情况下,二元对数正态分布是一个简单的解决方案,当然很容易推广到更高维度和边缘分布是 不同 对数正态的情况。...构建相依双变量分布的更通用方法 尽管创建二元对数正态的上述构造很简单,但它用于说明更普遍适用的方法。首先,我们从二元正态分布生成值对。这两个变量之间存在统计相关性,且均具有正态边缘分布。...但是, X1 和 X2 的线性相关性是 rho是 _不_正确的。例如,在原始对数正态情况下,该相关有一个形式: cor(X1,X2) = (exp(rho.

    2.7K12

    用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析|附代码数据

    hist(x,y) 使用累积分布函数的核估计器将数据转换为 copula 。...例如,金融风险的蒙特卡罗模拟可能具有代表不同保险损失来源的随机输入。这些输入可能被建模为对数正态随机变量。一个合理的问题是这两个输入之间的依赖性如何影响模拟结果。...从模拟中得出的结论很可能取决于 X1 和 X2 是否具有相关性。 在这种情况下,二元对数正态分布是一个简单的解决方案,当然很容易推广到更高维度和边缘分布是 不同 对数正态的情况。...构建相依双变量分布的更通用方法 尽管创建二元对数正态的上述构造很简单,但它用于说明更普遍适用的方法。首先,我们从二元正态分布生成值对。这两个变量之间存在统计相关性,且均具有正态边缘分布。...但是, X1 和 X2 的线性相关性是 rho是 _不_正确的。例如,在原始对数正态情况下,该相关有一个形式:   cor(X1,X2) = (exp(rho.

    60200

    用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析|附代码数据

    hist(x,y) 使用累积分布函数的核估计器将数据转换为 copula 。...例如,金融风险的蒙特卡罗模拟可能具有代表不同保险损失来源的随机输入。这些输入可能被建模为对数正态随机变量。一个合理的问题是这两个输入之间的依赖性如何影响模拟结果。...从模拟中得出的结论很可能取决于 X1 和 X2 是否具有相关性。 在这种情况下,二元对数正态分布是一个简单的解决方案,当然很容易推广到更高维度和边缘分布是 不同 对数正态的情况。...构建相依双变量分布的更通用方法 尽管创建二元对数正态的上述构造很简单,但它用于说明更普遍适用的方法。首先,我们从二元正态分布生成值对。这两个变量之间存在统计相关性,且均具有正态边缘分布。...但是, X1 和 X2 的线性相关性是 rho是 _不_正确的。例如,在原始对数正态情况下,该相关有一个形式:   cor(X1,X2) = (exp(rho.

    50530

    用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析|附代码数据

    当 u 包含通过边缘累积分布函数的参数估计转换为单位超立方体的数据时,这称为边缘_推断函数 (IFM)_ 方法。...hist(x,y) 使用累积分布函数的核估计器将数据转换为 copula 。...从模拟中得出的结论很可能取决于 X1 和 X2 是否具有相关性。 在这种情况下,二元对数正态分布是一个简单的解决方案,当然很容易推广到更高维度和边缘分布是 不同 对数正态的情况。...构建相依双变量分布的更通用方法 尽管创建二元对数正态的上述构造很简单,但它用于说明更普遍适用的方法。首先,我们从二元正态分布生成值对。这两个变量之间存在统计相关性,且均具有正态边缘分布。...但是, X1 和 X2 的线性相关性是 rho是 _不_正确的。例如,在原始对数正态情况下,该相关有一个形式:   cor(X1,X2) = (exp(rho.

    67900

    用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析|附代码数据

    当 u 包含通过边缘累积分布函数的参数估计转换为单位超立方体的数据时,这称为边缘_推断函数 (IFM)_ 方法。...hist(x,y) 使用累积分布函数的核估计器将数据转换为 copula 。...从模拟中得出的结论很可能取决于 X1 和 X2 是否具有相关性。 在这种情况下,二元对数正态分布是一个简单的解决方案,当然很容易推广到更高维度和边缘分布是 不同 对数正态的情况。...构建相依双变量分布的更通用方法 尽管创建二元对数正态的上述构造很简单,但它用于说明更普遍适用的方法。首先,我们从二元正态分布生成值对。这两个变量之间存在统计相关性,且均具有正态边缘分布。...但是, X1 和 X2 的线性相关性是 rho是 _不_正确的。例如,在原始对数正态情况下,该相关有一个形式:   cor(X1,X2) = (exp(rho.

    75720

    出场率No.1的逻辑回归算法,是怎样“炼成”的?

    没被线性模型捕捉到的随机因素服从正态分布。 从理论上来说,任何数据放在任何模型里都会得到相应的参数估计,进而通过模型对数据进行预测。...那我们可不可以找到一组参数,与特征矩阵相乘,直接得到表示概率的结果呢? 单单从应用的角度来说,是可以的,但是并不好。这是因为线性回归得到值是没有限制的,值域从负无穷到正无穷的值。...如果我们将其转换为分类问题,则可以得到阶梯函数如下: 更进一步,我们将上面的函数转变为求概率,即客户购买理财产品的概率如下: 其中,是随机变量的累积分布函数,表示客户购买的比例。...因此可以使用标准逻辑分布的累积分布函数来替换正态分布的累积分布函数。...在分类结果的背后是隐藏变量的博弈,我们认为隐藏变量与特征是线性相关的,因此就可以对隐藏变量之差求概率(得到随机变量的累积分布函数),得到probit回归模型。

    76421

    BioScience: 贯穿科学界的对数正态分布

    为了加深对对数正态分布的理解,鼓励人们正确使用对数正态分布,并展示它们在生活中的重要性,我们提出了一个新的物理模型来产生对数正态分布,从而填补了一个百年来的空白。...正态分布反映了决策点序列的累积相加效应。在顶部离开漏斗的粒子与第一个障碍物的尖端相遇,并以相等的概率向左或向右偏离距离c。然后,它与第二行中的相应三角形相遇,并再次以相同的方式偏离,以此类推。...对于较大的行数,根据中心极限定理,概率逼近正态密度函数。在其最简单的形式中,这个数学定律规定许多(R)个独立的、同分布的随机变量的和在极限为r→∞的情况下是正态分布的。...由于对正态分布的普遍偏好,我们被要求找出服从正态分布但与对数正态分布不匹配的数据示例。有趣的是,最初的测量并没有产生任何这样的例子。如前所述,即使是女性身高的经典例子也同样符合这两种分布。...另一个原因与分布的历史有关:正态分布的已知和应用时间是其对数正态姊妹分布的两倍多。最后,与“对数正态”相比,“正态”这一概念让非统计学家产生了更多积极的联想。

    3.5K61
    领券