R*******k 发帖数: 72 | 1 这样岂不是不公平? 因为任何一个局面,如果对手犯傻,总是有可能会赢 |
a****t 发帖数: 7049 | 2 不会的,阿法狗算对方都是和自己一样强的,如果真输了,马上就会到10%赢率 |
t******l 发帖数: 10908 | 3 但这个赢率也是估计,如果胜率估计也是基于策略网络的,那策略网络万一发散了,也
就是实际的输局,被估计成赢局,那阿狗会坚持到最后一字的。
考虑给李九段送夜宵吧。。。
【在 a****t 的大作中提到】 : 不会的,阿法狗算对方都是和自己一样强的,如果真输了,马上就会到10%赢率
|
a****t 发帖数: 7049 | 4 你是说把对方也算出一个bug来?也有可能哈哈。。
【在 t******l 的大作中提到】 : 但这个赢率也是估计,如果胜率估计也是基于策略网络的,那策略网络万一发散了,也 : 就是实际的输局,被估计成赢局,那阿狗会坚持到最后一字的。 : 考虑给李九段送夜宵吧。。。
|
R*******k 发帖数: 72 | 5 如是alphaGo假设对手也跟它一样喜欢一路立... |
t******l 发帖数: 10908 | 6 很多时候写程序有一定的保险,比如要求连续四步都是估计赢率 10% 以下才认输。
但这样万一估计胜率的网络发散了,这一步估计出 5%,下一步却估计成 40%,如此
交替往复,那就永远也达不到连续四步都是 10% 以下了。。。
送夜宵吧。。。
【在 a****t 的大作中提到】 : 你是说把对方也算出一个bug来?也有可能哈哈。。
|
a****t 发帖数: 7049 | 7 也是,赢率本来是由黑白子下落而震荡的,是两个曲线。lim inf和lim sup也许不在一
起,呵呵。
【在 t******l 的大作中提到】 : 很多时候写程序有一定的保险,比如要求连续四步都是估计赢率 10% 以下才认输。 : 但这样万一估计胜率的网络发散了,这一步估计出 5%,下一步却估计成 40%,如此 : 交替往复,那就永远也达不到连续四步都是 10% 以下了。。。 : 送夜宵吧。。。
|
t******l 发帖数: 10908 | 8 阿狗终于认输了,不用送夜宵了。
【在 a****t 的大作中提到】 : 也是,赢率本来是由黑白子下落而震荡的,是两个曲线。lim inf和lim sup也许不在一 : 起,呵呵。
|