已知,则可用香农熵估计该字符串中每个符号
编码所需的平均最小位数.
而非真实概率
,则对每个符号所需的编码的长度就会更大.这正是交叉熵所发挥作用的时候. 他允许用户以另外一种次优编码方案计算对同一个字符串进行编码所需的平均最小位数.
.下面计算采用ASCII编码时单词"HELLO"的交叉熵:
从而采用ASCII编码时,每个字符需要8个位,这与预期完全吻合.
替换为log完全没有任何问题,因为两者只相差一个常系数.
面向机器智能的tensorflow实践
本文分享自 DrawSky 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!