由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 我以前提到过阿法狗应该有更灵活的用时策略
相关主题
第三局估计也没啥可看了阿法狗生怕人类还不够绝望
阿法狗下围棋离人类还差的远从第四盘棋看狗狗的弱点
阿法狗怎么做到每天练习几十万盘棋?写过程序的都知道
阿法狗第二局最令人震惊的地方在于阿法狗怎样算气的?
阿发狗仍然不是不可战胜说说我眼中阿尔法的棋力
[探讨]影响胜率的几大因素ZZ打败阿狗的方法探讨,热点扩散法
大家对Alphago的胜率理解有误阿狗的特点总结
阿发狗片面追求胜率猜一下几个AlphaGo崩了的原因
相关话题的讨论汇总
话题: 用时话题: 胜率话题: 阿法话题: 阿狗话题: 策略
进入Go版参与讨论
1 (共1页)
D*******r
发帖数: 2323
1
从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
发现应手了。
x**w
发帖数: 7947
2
阿狗的勇士策略究竟是怎么样的?没看到过什么详细讲讲的。
a***m
发帖数: 5037
3
论文不会讲这种工程技巧

【在 x**w 的大作中提到】
: 阿狗的勇士策略究竟是怎么样的?没看到过什么详细讲讲的。
x**w
发帖数: 7947
4
他的论文好东西都没公开。田似乎已经表示复制不能。

【在 a***m 的大作中提到】
: 论文不会讲这种工程技巧
s*****V
发帖数: 21731
5
这个是指数级的,branching factor加一倍,时间是天文数字的提高

【在 D*******r 的大作中提到】
: 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
: 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
: 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
: 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
: 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
: 发现应手了。

O**l
发帖数: 12923
6
其实就是policy network影响了MCT的分布
那个局部MCT几乎不可能算不清

【在 D*******r 的大作中提到】
: 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
: 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
: 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
: 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
: 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
: 发现应手了。

D*******r
发帖数: 2323
7
当然不是说把所有变化算清,但是谁知道多算5分钟是不是就能算到人类下的那个套?
尤其是对形势的误判,我相信如果多算5分钟一定能纠偏不少。

【在 O**l 的大作中提到】
: 其实就是policy network影响了MCT的分布
: 那个局部MCT几乎不可能算不清

n*****t
发帖数: 22014
8
阿狗在劣势下确实会多算,比如本局最后差不多 2-3 分钟一手。

【在 D*******r 的大作中提到】
: 当然不是说把所有变化算清,但是谁知道多算5分钟是不是就能算到人类下的那个套?
: 尤其是对形势的误判,我相信如果多算5分钟一定能纠偏不少。

D*******r
发帖数: 2323
9
你说的是劣势的时候会多算,因为它要找胜率能高于50%的应手。
我说的是它要对胜率陡变的时候警惕,那很可能是人类在下套。

【在 n*****t 的大作中提到】
: 阿狗在劣势下确实会多算,比如本局最后差不多 2-3 分钟一手。
h*h
发帖数: 27852
10
胜率估计本身成问题
我觉得把狗放在网上,和全世界棋民对战,是唯一的途径
r******i
发帖数: 1445
11
我估计它是固定用时。平均分配时间。比如一般每局一方有80-120手棋要走,就平均分
配成1-1.5分钟一手棋。
雷蒙德也发现了,alphago在走人类认为的“必应手”时,仍然要考虑一分钟才走,而
不是马上就走。
当电脑和电脑对战的时候,平均分配时间的战略很合理。但是对人就不一定了。也许下
一步deepmind的工程师可以考虑在这方面优化一下。

【在 D*******r 的大作中提到】
: 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
: 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
: 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
: 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
: 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
: 发现应手了。

s***e
发帖数: 5242
12
因为不能穷举,所以必须规定搜索的宽度和广度,这就大概控制了计算时间。
对于所谓必然手,其实永远不是必然的,即使落子网络觉得一个落子胜率远大于其他的
落子,也必须run一遍搜索树。

【在 D*******r 的大作中提到】
: 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
: 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
: 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
: 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
: 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
: 发现应手了。

h*******2
发帖数: 5093
13
其实一直在算,没歇着

【在 D*******r 的大作中提到】
: 从现在的四局看,阿法狗的用时基本上还是属于平均用时,每手一分钟左右时间。
: 看了还是需要有一个比较动态的用时策略才好,比如说,遇到胜率评估陡升或者都降的
: 时候,就要加大计算时间,因为这种情况,往往就是人类给阿狗下套的时候。
: 比如说这次阿狗看见胜率陡然从55%升到70%,就心里冷笑:哼,小样儿,给老子下套?
: 待老子好好算算,然后把周围所有的点全部深算50步以上,也来个长考20分钟,估计就
: 发现应手了。

1 (共1页)
进入Go版参与讨论
相关主题
猜一下几个AlphaGo崩了的原因阿发狗仍然不是不可战胜
我看了前3盘,李世石都是在阿狗落子[探讨]影响胜率的几大因素ZZ
听上去,李思思第五局策略已定?大家对Alphago的胜率理解有误
zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】阿发狗片面追求胜率
第三局估计也没啥可看了阿法狗生怕人类还不够绝望
阿法狗下围棋离人类还差的远从第四盘棋看狗狗的弱点
阿法狗怎么做到每天练习几十万盘棋?写过程序的都知道
阿法狗第二局最令人震惊的地方在于阿法狗怎样算气的?
相关话题的讨论汇总
话题: 用时话题: 胜率话题: 阿法话题: 阿狗话题: 策略