我以前提到过阿法狗应该有更灵活的用时策略 - Go版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 我以前提到过阿法狗应该有更灵活的用时策略

相关主题
● 第三局估计也没啥可看了	● 阿法狗生怕人类还不够绝望
● 阿法狗下围棋离人类还差的远	● 从第四盘棋看狗狗的弱点
● 阿法狗怎么做到每天练习几十万盘棋？	● 写过程序的都知道
● 阿法狗第二局最令人震惊的地方在于	● 阿法狗怎样算气的？
● 阿发狗仍然不是不可战胜	● 说说我眼中阿尔法的棋力
● [探讨]影响胜率的几大因素ZZ	● 打败阿狗的方法探讨，热点扩散法
● 大家对Alphago的胜率理解有误	● 阿狗的特点总结
● 阿发狗片面追求胜率	● 猜一下几个AlphaGo崩了的原因

相关话题的讨论汇总
话题: 用时话题: 胜率话题: 阿法话题: 阿狗话题: 策略

进入Go版参与讨论

1

(共1页)

D*******r 发帖数: 2323	1 从现在的四局看，阿法狗的用时基本上还是属于平均用时，每手一分钟左右时间。看了还是需要有一个比较动态的用时策略才好，比如说，遇到胜率评估陡升或者都降的时候，就要加大计算时间，因为这种情况，往往就是人类给阿狗下套的时候。比如说这次阿狗看见胜率陡然从55%升到70%，就心里冷笑：哼，小样儿，给老子下套？待老子好好算算，然后把周围所有的点全部深算50步以上，也来个长考20分钟，估计就发现应手了。
x**w 发帖数: 7947	2 阿狗的勇士策略究竟是怎么样的？没看到过什么详细讲讲的。
a***m 发帖数: 5037	3 论文不会讲这种工程技巧【在 x**w 的大作中提到】 : 阿狗的勇士策略究竟是怎么样的？没看到过什么详细讲讲的。
x**w 发帖数: 7947	4 他的论文好东西都没公开。田似乎已经表示复制不能。【在 a***m 的大作中提到】 : 论文不会讲这种工程技巧
s*****V 发帖数: 21731	5 这个是指数级的，branching factor加一倍，时间是天文数字的提高【在 D*******r 的大作中提到】 : 从现在的四局看，阿法狗的用时基本上还是属于平均用时，每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好，比如说，遇到胜率评估陡升或者都降的 : 时候，就要加大计算时间，因为这种情况，往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%，就心里冷笑：哼，小样儿，给老子下套？ : 待老子好好算算，然后把周围所有的点全部深算50步以上，也来个长考20分钟，估计就 : 发现应手了。
O**l 发帖数: 12923	6 其实就是policy network影响了MCT的分布那个局部MCT几乎不可能算不清【在 D*******r 的大作中提到】 : 从现在的四局看，阿法狗的用时基本上还是属于平均用时，每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好，比如说，遇到胜率评估陡升或者都降的 : 时候，就要加大计算时间，因为这种情况，往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%，就心里冷笑：哼，小样儿，给老子下套？ : 待老子好好算算，然后把周围所有的点全部深算50步以上，也来个长考20分钟，估计就 : 发现应手了。
D*******r 发帖数: 2323	7 当然不是说把所有变化算清，但是谁知道多算5分钟是不是就能算到人类下的那个套？尤其是对形势的误判，我相信如果多算5分钟一定能纠偏不少。【在 O**l 的大作中提到】 : 其实就是policy network影响了MCT的分布 : 那个局部MCT几乎不可能算不清
n*****t 发帖数: 22014	8 阿狗在劣势下确实会多算，比如本局最后差不多 2-3 分钟一手。【在 D*******r 的大作中提到】 : 当然不是说把所有变化算清，但是谁知道多算5分钟是不是就能算到人类下的那个套？ : 尤其是对形势的误判，我相信如果多算5分钟一定能纠偏不少。
D*******r 发帖数: 2323	9 你说的是劣势的时候会多算，因为它要找胜率能高于50%的应手。我说的是它要对胜率陡变的时候警惕，那很可能是人类在下套。【在 n*****t 的大作中提到】 : 阿狗在劣势下确实会多算，比如本局最后差不多 2-3 分钟一手。
h*h 发帖数: 27852	10 胜率估计本身成问题我觉得把狗放在网上，和全世界棋民对战，是唯一的途径
r******i 发帖数: 1445	11 我估计它是固定用时。平均分配时间。比如一般每局一方有80-120手棋要走，就平均分配成1-1.5分钟一手棋。雷蒙德也发现了，alphago在走人类认为的“必应手”时，仍然要考虑一分钟才走，而不是马上就走。当电脑和电脑对战的时候，平均分配时间的战略很合理。但是对人就不一定了。也许下一步deepmind的工程师可以考虑在这方面优化一下。【在 D*******r 的大作中提到】 : 从现在的四局看，阿法狗的用时基本上还是属于平均用时，每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好，比如说，遇到胜率评估陡升或者都降的 : 时候，就要加大计算时间，因为这种情况，往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%，就心里冷笑：哼，小样儿，给老子下套？ : 待老子好好算算，然后把周围所有的点全部深算50步以上，也来个长考20分钟，估计就 : 发现应手了。
s***e 发帖数: 5242	12 因为不能穷举，所以必须规定搜索的宽度和广度，这就大概控制了计算时间。对于所谓必然手，其实永远不是必然的，即使落子网络觉得一个落子胜率远大于其他的落子，也必须run一遍搜索树。【在 D*******r 的大作中提到】 : 从现在的四局看，阿法狗的用时基本上还是属于平均用时，每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好，比如说，遇到胜率评估陡升或者都降的 : 时候，就要加大计算时间，因为这种情况，往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%，就心里冷笑：哼，小样儿，给老子下套？ : 待老子好好算算，然后把周围所有的点全部深算50步以上，也来个长考20分钟，估计就 : 发现应手了。
h*******2 发帖数: 5093	13 其实一直在算，没歇着【在 D*******r 的大作中提到】 : 从现在的四局看，阿法狗的用时基本上还是属于平均用时，每手一分钟左右时间。 : 看了还是需要有一个比较动态的用时策略才好，比如说，遇到胜率评估陡升或者都降的 : 时候，就要加大计算时间，因为这种情况，往往就是人类给阿狗下套的时候。 : 比如说这次阿狗看见胜率陡然从55%升到70%，就心里冷笑：哼，小样儿，给老子下套？ : 待老子好好算算，然后把周围所有的点全部深算50步以上，也来个长考20分钟，估计就 : 发现应手了。

1

(共1页)

进入Go版参与讨论

相关主题
● 猜一下几个AlphaGo崩了的原因	● 阿发狗仍然不是不可战胜
● 我看了前3盘，李世石都是在阿狗落子	● [探讨]影响胜率的几大因素ZZ
● 听上去，李思思第五局策略已定？	● 大家对Alphago的胜率理解有误
● zt【FACEBOOK 围棋软件专家田渊栋博士对第四盘分析】	● 阿发狗片面追求胜率
● 第三局估计也没啥可看了	● 阿法狗生怕人类还不够绝望
● 阿法狗下围棋离人类还差的远	● 从第四盘棋看狗狗的弱点
● 阿法狗怎么做到每天练习几十万盘棋？	● 写过程序的都知道
● 阿法狗第二局最令人震惊的地方在于	● 阿法狗怎样算气的？

相关话题的讨论汇总
话题: 用时话题: 胜率话题: 阿法话题: 阿狗话题: 策略

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)