深度学习从业者,你需要知道概率分布相关的知识。这里有一份最常见的基本概率分布教程,大多数和使用 python 库进行深度学习有关。
Multi-Class
表示随机方差大于 2。N Times
意味着我们还考虑先验概率 P(X)。在贝叶斯概率论中,如果后验分布 p(θx)与先验概率分布 p(θ)在同一概率分布族中,则先验和后验称为共轭分布,先验称为似然函数的共轭先验。共轭先验维基百科在这里(https://en.wikipedia.org/wiki/Conjugate_prior)。无损原图可见:https://github.com/graykode/distribution-is-all-you-need/blob/master/overview.pptx
二、分布概率与特征
1. 均匀分布(连续)
均匀分布在 [a,b] 上具有相同的概率值,是简单概率分布。
2. 伯努利分布(离散)
3. 二项分布(离散)
参数为 n 和 p 的二项分布是一系列 n 个独立实验中成功次数的离散概率分布。
二项式分布是指通过指定要提前挑选的数量而考虑先验概率的分布。
"""
各分布的生成代码(算法进阶 附注):
https://github.com/graykode/distribution-is-all-you-need
Code by Tae-Hwan Hung(@graykode)
"""
import numpy as np
from matplotlib import pyplot as plt
import operator as op
from functools import reduce
def const(n, r):
r = min(r, n-r)
numer = reduce(op.mul, range(n, n-r, -1), 1)
denom = reduce(op.mul, range(1, r+1), 1)
return numer / denom
def binomial(n, p):
q = 1 - p
y = [const(n, k) * (p ** k) * (q ** (n-k)) for k in range(n)]
return y, np.mean(y), np.std(y)
for ls in [(0.5, 20), (0.7, 40), (0.5, 40)]:
p, n_experiment = ls[0], ls[1]
x = np.arange(n_experiment)
y, u, s = binomial(n_experiment, p)
plt.scatter(x, y, label=r'$\mu=%.2f,\ \sigma=%.2f$' % (u, s))
plt.legend()
plt.savefig('graph/binomial.png')
plt.show()
4. 多伯努利分布,分类分布(离散)
5. 多项式分布(离散)
多项式分布与分类分布的关系与伯努尔分布与二项分布的关系相同。
6. β分布(连续)
7. Dirichlet 分布(连续)
8. 伽马分布(连续)
9. 指数分布(连续)
指数分布是 α 为 1 时 γ 分布的特例。
10. 高斯分布(连续)
高斯分布是一种非常常见的连续概率分布。
11. 正态分布(连续)
正态分布为标准高斯分布,平均值为 0,标准差为 1。
12. 卡方分布(连续)
13. t 分布(连续)
t 分布是对称的钟形分布,与正态分布类似,但尾部较重,这意味着它更容易产生远低于平均值的值。
代码:https://github.com/graykode/distribution-is-all-you-need/
更多精彩内容请点击:机器学习文章精选!