D*******r 发帖数: 2323 | 1 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
发现应手了。 |
x**w 发帖数: 7947 | 2 阿狗的勇士策略究竟是怎么样的?没看到过什么详细讲讲的。 |
a***m 发帖数: 5037 | 3 论文不会讲这种工程技巧
【在 x**w 的大作中提到】 : 阿狗的勇士策略究竟是怎么样的?没看到过什么详细讲讲的。
|
x**w 发帖数: 7947 | 4 他的论文好东西都没公开。田似乎已经表示复制不能。
【在 a***m 的大作中提到】 : 论文不会讲这种工程技巧
|
s*****V 发帖数: 21731 | 5 这个是指数级的,branching factor加一倍,时间是天文数字的提高
【在 D*******r 的大作中提到】 : 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的 : 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套? : 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就 : 发现应手了。
|
O**l 发帖数: 12923 | 6 其实就是policy network影响了MCT的分布
那个局部MCT几乎不可能算不清
【在 D*******r 的大作中提到】 : 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的 : 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套? : 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就 : 发现应手了。
|
D*******r 发帖数: 2323 | 7 当然不是说把所有变化算清,但是谁知道多算5分钟是不是就能算到人类下的那个套?
尤其是对形势的误判,我相信如果多算5分钟一定能纠偏不少。
【在 O**l 的大作中提到】 : 其实就是policy network影响了MCT的分布 : 那个局部MCT几乎不可能算不清
|
n*****t 发帖数: 22014 | 8 阿狗在劣势下确实会多算,比如本局最后差不多 2-3 分钟一手。
【在 D*******r 的大作中提到】 : 当然不是说把所有变化算清,但是谁知道多算5分钟是不是就能算到人类下的那个套? : 尤其是对形势的误判,我相信如果多算5分钟一定能纠偏不少。
|
D*******r 发帖数: 2323 | 9 你说的是劣势的时候会多算,因为它要找胜率能高于50%的应手。
我说的是它要对胜率陡变的时候警惕,那很可能是人类在下套。
【在 n*****t 的大作中提到】 : 阿狗在劣势下确实会多算,比如本局最后差不多 2-3 分钟一手。
|
h*h 发帖数: 27852 | 10 胜率估计本身成问题
我觉得把狗放在网上,和全世界棋民对战,是唯一的途径 |
r******i 发帖数: 1445 | 11 我估计它是固定用时。平均分配时间。比如一般每局一方有80-120手棋要走,就平均分
配成1-1.5分钟一手棋。
雷蒙德也发现了,alphago在走人类认为的“必应手”时,仍然要考虑一分钟才走,而
不是马上就走。
当电脑和电脑对战的时候,平均分配时间的战略很合理。但是对人就不一定了。也许下
一步deepmind的工程师可以考虑在这方面优化一下。
【在 D*******r 的大作中提到】 : 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的 : 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套? : 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就 : 发现应手了。
|
s***e 发帖数: 5242 | 12 因为不能穷举,所以必须规定搜索的宽度和广度,这就大概控制了计算时间。
对于所谓必然手,其实永远不是必然的,即使落子网络觉得一个落子胜率远大于其他的
落子,也必须run一遍搜索树。
【在 D*******r 的大作中提到】 : 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的 : 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套? : 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就 : 发现应手了。
|
h*******2 发帖数: 5093 | 13 其实一直在算,没歇着
【在 D*******r 的大作中提到】 : 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的 : 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套? : 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就 : 发现应手了。
|