a*******o 发帖数: 290 | 1 可以用reinforced learning吗?针对每个人的参数都不一样吧。
或者是不是有专门的算法? |
c*****e 发帖数: 3226 | 2 这个也有 ml?
【在 a*******o 的大作中提到】 : 可以用reinforced learning吗?针对每个人的参数都不一样吧。 : 或者是不是有专门的算法?
|
a****x 发帖数: 93 | 3 game theory
【在 a*******o 的大作中提到】 : 可以用reinforced learning吗?针对每个人的参数都不一样吧。 : 或者是不是有专门的算法?
|
W***o 发帖数: 6519 | 4 不能吧?用什么来做rewards
【在 a*******o 的大作中提到】 : 可以用reinforced learning吗?针对每个人的参数都不一样吧。 : 或者是不是有专门的算法?
|
l*********s 发帖数: 5409 | |
a*******o 发帖数: 290 | 6 是不是可以把所有信息处理一下,用supervised learning?
信息包括最近n次双方的动作
目标是预测下次对手的动作。 |
c*****e 发帖数: 3226 | 7 这玩意儿完全随机的
【在 a*******o 的大作中提到】 : 是不是可以把所有信息处理一下,用supervised learning? : 信息包括最近n次双方的动作 : 目标是预测下次对手的动作。
|
a*******o 发帖数: 290 | 8 人玩的话不会是完全随机的。除非先扔骰子,然后根据骰子决定出啥
【在 c*****e 的大作中提到】 : 这玩意儿完全随机的
|
k*****u 发帖数: 1688 | 9 马尔可夫chain啊
或者简单的condition prob |