石头剪子布属于一种 zero-sum game,即一个人的 loss 是另一个人的 gain。
这个问题可以有多种解法,我们可以选择 linear programming 的方法:
设我们要求解的变量为:x = [U, R, P, S] U 是期望的效用,R 是出石头的概率,P 是出布的概率,S 是出剪子的概率。 我们的目标是在一组限制条件下,最大化 U。
这组限制条件由石头剪子布的 reward 矩阵 A 决定: 例如,有矩阵 A :
则限制条件为:
以及:R + P + S = 1。
结合前面几篇介绍 cvxopt 的文章看,我们可以将上图这个问题转化为带有 c,G,h,A,b 的约束问题格式:
所以可以得到:
有个 c,G,h,A,b 的数值,就可以调用 cvxopt 进行求解此优化问题,最后 solution 里面的 x 中后三项就是要求的概率。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有