1494年帕西里奥的著作首先提出,具体描述如下:
两个赌徒A、B各下注a元,胜率各为50%,约定先赢S局者可得2a元,当a赢\(s_1\)局,b赢\(s_2\)局时,比赛因故中断,问题是如何公平分配所有赌注2a元。例如S为6,\(s_1\)为5,\(s_2\)为2。
- 原作者给出的答案的是\(s_1:s_2\)分配,也就是说按照5:2去分配
- 1556年,塔太格利亚提出若\(s_1>s_2\),那么首先A可以取回自己的赌本a元,然后去走B的\(\frac{s_1-s_2}{s}*a\)元,换句话,就是按照\(\frac{S+s_1-s_2}{S-s_1+s_2}\) 的比例,也就是3:1去分配
- 1603年,法雷斯太尼提出应按照\(\frac{2S-1+s_1-s_2}{2S-1-s_1+s_2}\) 的比例,也就是7:4去分配
- 1539年,卡丹诺记\(r=S-s\)提出按\(\frac{r_2(r_2+1)}{r_1(r_1+1)}\) 的比例,也就是10:1去分配
这里要明晰的是期望与概率的关系,前面几种算法除了卡丹诺的都根据的是既成事实也就是经验来判断分配比例,那个最初的胜率50%基本不考虑。但公平的游戏每一局都是独立的而如果比赛继续,最多经过\(r=r_1+r_2-1\)局就会结束。如果A获胜,在r局中赢r1局即可,也就是个二项分布的累计概率p,B取胜的概率为(1-p),注金按这个比例分配就可以,也就是15:1,这个结果是帕斯卡在1654年提出的。在这种算法下,前面的成绩只决定了后面比赛的长短,而获胜的可能性则完全交给了50%的胜率。如果从头考虑这个问题,发展到第七局这个赛况也是从最初的胜率来的,如果以此为起点,前面概率无论多么小都是1了,好比将杨辉三角的顶端砍掉,从一个分支开始考虑问题发展。
此外,还有一种思路是从最坏可能去思考,也就是比赛最长时的概率是多少,最短又是多少,然后分别计算不同比赛长度的概率,前面的都是当前优势方的概率,累计可得,最后一种情况也就是最长比赛长度对应的是当前劣势方取胜的概率,其实只要算出这个数p,1-p就可以得到答案了。同时我们知道,最后一次必然是劣势方取胜,所以这个概率分布有点类似几何分布,其实这是负二项分布,几何分布只是它的一个特例。那么这种计算方法有什么应用呢?因为计算的是最长距离,可以用在时间估计上,当然二项分布也可以,就是需要绕一下。这个思路是费尔马在与帕斯卡通信时提出的。
后来这个问题被收到惠更斯的著作《几率的规律》中,这本书更关注于公平赌博并首次提出了期望的概念,同时,书中也关注了在赌博中一系列分金的问题,包括上面问题的多人推广,书末给出了5个问题,解起来技巧性强。下面给出其中一个:
A、B两人按照 ABBAABBAAABB… 方式掷两颗色子,如果A掷出6点或B掷出7点,游戏结束,先掷出为胜,求A、B的胜率。
在一次独立试验中,两颗公平色子出现6点或7点的概率本就不同,A的6点为0.139,B的7点为0.167。如果这是一个公平游戏,那么只能在次序上做文章,也就是A的尝试要有优势才会公平。在这个游戏中,A先掷就是出于这样的考虑,那么这个次序真的公平吗?假定\(p_i\)为A在(i-1)轮游戏后取胜的概率,可以得到下面的公式:
- \(p_1=0.139+p_2*(1-0.139)\)
- \(p_2=(1-0.167)*p_3\)
- \(p_3=(1-0.167)*p_4\)
- \(p_4=0.139+p_1*(1-0.139)\)
联立方程组,可得\(p_1\)为0.458,也就是说这个游戏设计上对A就是不利的,这里计算的技巧在于p4也就是3场比赛结束后A获胜的概率的计算灵活的使用了A的两场结果:首场不胜以后胜的概率\(p_1*(1-0.139)\),加上这场胜的概率0.139,而由于赛程序列是无限的,所以对每一场A参与的游戏,这场不赢以后赢的概率可认为是一致的,所以就有了这个解法。看起来解法巧妙不过仔细想想,似乎只用了开始4局就推断出了整体结论,后面的次序不起作用了,而且如果把这个解法用到B获胜概率的计算上就会出现下面的公式:
- \(p_1=(1-0.139)*p_2\)
- \(p_2=0.167+p_3(1-0.167)\)
- \(p_3=0.167+p_4(1-0.167)\)
- \(p_4=(1-0.139)*p_1\)
这样解出的\(p_1\)为0.247,对B也不利,其实这个解法巧妙归巧妙,但无限不规律的序列用近似去解应该是有问题的,最后产生悖论式的结果很可能源于对无限这个概念的模糊。
本文内容大量参考陈希孺老师的《数理统计学简史》,可作为读书笔记看待。