一个数学游戏在一个电视节目里,主持人转动轮盘,产生一个1到100的随机整数。参加者如果选择“要”,那么他就拿到产生的随机数那么多元钱,游戏结束。参加者如果选择“不要”,主持人再次转动轮盘,产生新的随机数,参加者如果选择“要”,那么他就拿到第二个随机数那么多元钱,游戏结束。参加者如果选择“不要”,主持人第三次转动轮盘,参加者没有选择,拿到第三个随机数那么多元钱,游戏结束。
问:参加者应该用如何的策略选择才能拿到最多的钱。在这种最优策略下,拿到的钱的期望值是多少。[吴永铮 (2-5 13:33, Long long ago)]
[ 传统版 |
sForum ][登录后回复]1楼
第一次>62选择要,第二次>50选择要[icky (2-5 18:04, Long long ago)] [ 传统版 | sForum ][登录后回复]2楼
如果题目改成不计次数但是玩得越多,但是每玩一次要给一元钱呢?[icky (2-5 18:41, Long long ago)] [ 传统版 | sForum ][登录后回复]3楼
这个游戏的价值是70.03[stevevai (2-5 22:06, Long long ago)] [ 传统版 | sForum ][登录后回复]4楼
(引用 icky:如果题目改成不计次数但是玩得越多,但是每玩一次要给一元钱呢?)见到87或者以上都停,不然continue. 这个游戏价值为 86.35714285714288在任意时刻,the future looks the same, so there is no reason why should one adopt a different continue/stop level at different time step.
In fact, 玩家在任何stage都会感觉到,如果玩下去能拿到86.35714285714288,跟当前实际的数字比较,就知道到底是要继续还是停止了。it is a kind of Amercian style, perpetual right.[stevevai (2-5 22:16, Long long ago)]
[ 传统版 |
sForum ][登录后回复]5楼