G*******C 发帖数: 566 | 1 一个fair dice,掷出1到5,可以选择再掷一次,或者得到相应数量的dollars,并且游
戏结束。如果掷出6,游戏结束,得到0。问怎样的停止策略可得到最大收益。
如果得到的奖励可累计,策略如何?如果是掷出6,前面的奖励归0,游戏结束。 | A**u 发帖数: 2458 | 2 看绿皮书 dynamic programming那章
这类题目都差不多,方法一样。 | M*******e 发帖数: 46 | 3 1)
If point less than or equal to 2 continue
If great than or equal to 3, stop
2)
If total less than 15, continue
If total equal to 15, doesn't matter
If total great than 15, stop
【在 G*******C 的大作中提到】 : 一个fair dice,掷出1到5,可以选择再掷一次,或者得到相应数量的dollars,并且游 : 戏结束。如果掷出6,游戏结束,得到0。问怎样的停止策略可得到最大收益。 : 如果得到的奖励可累计,策略如何?如果是掷出6,前面的奖励归0,游戏结束。
|
|