我觉得阿法狗的bug是不愿意杀大龙 - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 我觉得阿法狗的bug是不愿意杀大龙

相关主题
● 狗狗不让打劫，是程序还不够完善？	● 仔细想了一下，阿法狗的算法在劫争上完全没有漏洞
● AlphaGo相关技术：蒙特卡罗(Monte Carlo)方法简介	● 柯洁虽然爱语不惊人死不休，但是正经说话是还是比较客观的
● 蒙特卡罗是不是有天生缺陷？	● 阿法狗第四局最终并不是输在对妙手的漏算上
● 打劫就是拼计算量	● 各位将军，阿狗到底输在哪一手啊
● 网上怎么这么多纠缠打劫的SB	● 人机大战之大结局-第五局之悬念丛生
● 阿狗的局部计算力问题	● 按罗洗河的判断，阿法狗可让顶尖职业四子
● 蒙特卡洛提速电脑围棋10年接近职业zz	● 如果是98年的石佛上
● 柯洁:电脑无敌?先过我这关我胜算大概六七成	● 为啥不走模仿棋？

相关话题的讨论汇总
话题: 大龙话题: 搜索话题: 阿法话题: 劫争话题: 意杀

进入Go版参与讨论

(共1页)

D*******r
发帖数: 2323

杀大龙有一些其实计算未必复杂，但是需要手数很多，而机器是没法通过棋形判断死活
的，它必须一直摆到对方没气时，才能确认能杀棋。
但是蒙特卡罗搜索不能一直往深处搜索，那样计算量太大。于是假设一条大龙需要30手
棋才能收完气杀死，但是阿法狗算了25手，对方大龙还没死，于是它就误以为大龙杀不
死，于是放弃那条搜索路线。
这么多盘棋，阿法狗虽然力量强大，但是却从不杀大龙，可能就是这个原因。

M*******p
发帖数: 5626

我觉的也有躲避劫争的因素，阿狗不怕打劫，但是明显不喜欢打劫，能躲就躲开了。

b*******8
发帖数: 37364

有些这个意思，上一盘就有这个感觉
可能是训练数据里，杀大龙的以失败居多

t******l
发帖数: 10908

对数的深度搜索要牺牲广度，这个决定必须要 policy network 来选择是不是更
深搜索。所以还是 policy network 不给力。

【在 D*******r 的大作中提到】

: 杀大龙有一些其实计算未必复杂，但是需要手数很多，而机器是没法通过棋形判断死活
: 的，它必须一直摆到对方没气时，才能确认能杀棋。
: 但是蒙特卡罗搜索不能一直往深处搜索，那样计算量太大。于是假设一条大龙需要30手
: 棋才能收完气杀死，但是阿法狗算了25手，对方大龙还没死，于是它就误以为大龙杀不
: 死，于是放弃那条搜索路线。
: 这么多盘棋，阿法狗虽然力量强大，但是却从不杀大龙，可能就是这个原因。

l******t
发帖数: 55733

应该是姐轮回太多超过了设定回合数，后面的估算就跑偏了。

d****o
发帖数: 443

好像是，变化太复杂了，越界了，搞一个大龙可能是秘药。

【在 D*******r 的大作中提到】

D*******r
发帖数: 2323

劫争也是这个原因，因为劫争需要手数很多，虽然未必复杂，但是它的计算比如说到达
25手时就停止了，它还没得出这个劫争的利弊，它就不会去开这个劫，所以它几乎不会
主动开劫。当然，被逼打劫了，它还是按它算法来就是了。

【在 M*******p 的大作中提到】

: 我觉的也有躲避劫争的因素，阿狗不怕打劫，但是明显不喜欢打劫，能躲就躲开了。

D*******r
发帖数: 2323

死活的计算没法用policy network来解决，必须真枪实棒地把气全部收完才行。

【在 t******l 的大作中提到】

: 对数的深度搜索要牺牲广度，这个决定必须要 policy network 来选择是不是更
: 深搜索。所以还是 policy network 不给力。

D*******r
发帖数: 2323

都不算计算太复杂，主要是在什么情况下，能狗动态决定搜索广度和深度的问题。一本
道的杀大龙，广度很小，但是因为手数需要很多，阿狗没有搜索到收完气那手，就放弃
了认为杀不死。

【在 d****o 的大作中提到】

: 好像是，变化太复杂了，越界了，搞一个大龙可能是秘药。

g*********e
发帖数: 14401

你们都没看蒙特卡洛搜索的介绍吧？
它是搜到比赛结束的

相关主题
● 阿狗的局部计算力问题	● 仔细想了一下，阿法狗的算法在劫争上完全没有漏洞
● 蒙特卡洛提速电脑围棋10年接近职业zz	● 柯洁虽然爱语不惊人死不休，但是正经说话是还是比较客观的
● 柯洁:电脑无敌?先过我这关我胜算大概六七成	● 阿法狗第四局最终并不是输在对妙手的漏算上
进入Go版参与讨论

D*******r
发帖数: 2323

你觉得可能吗？把全美国的机子绑一起，都做不到每步5个分支，搜索50步。

【在 g*********e 的大作中提到】

: 你们都没看蒙特卡洛搜索的介绍吧？
: 它是搜到比赛结束的

t******l
发帖数: 10908

当中有随机数发生器，不是全遍历的。

【在 g*********e 的大作中提到】

: 你们都没看蒙特卡洛搜索的介绍吧？
: 它是搜到比赛结束的

M*******p
发帖数: 5626

劫争的手数要放在这个25手里面，那么狗狗就是真的不善于打劫，因为复杂劫争肯定要
很多手的。所以，带劫争的极复杂局面应该就是狗狗的软肋。

【在 D*******r 的大作中提到】

: 劫争也是这个原因，因为劫争需要手数很多，虽然未必复杂，但是它的计算比如说到达
: 25手时就停止了，它还没得出这个劫争的利弊，它就不会去开这个劫，所以它几乎不会
: 主动开劫。当然，被逼打劫了，它还是按它算法来就是了。

t******l
发帖数: 10908

这倒是，反正大龙不多，以后所有大龙都算到底。

【在 D*******r 的大作中提到】

: 都不算计算太复杂，主要是在什么情况下，能狗动态决定搜索广度和深度的问题。一本
: 道的杀大龙，广度很小，但是因为手数需要很多，阿狗没有搜索到收完气那手，就放弃
: 了认为杀不死。

k*l
发帖数: 2574

silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能，
所以狗漏算了，因为在俩黑子中间，一般走的人少。

D*******r
发帖数: 2323

对于78的计算有没有漏算不清楚，要看它的log才知道。我是说李世石长左边子，置中
间大龙于不顾。狗的应手不是横跳一手，那样白上方几子的龙基本上就死了。但是阿法
狗的计算里没有杀大龙的目标，于是它选择飞，虽然还是笼罩着白棋，但是包围圈薄了
很多，然后白棋再一浅消，后面就出棋了。

【在 k*l 的大作中提到】

: silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能，
: 所以狗漏算了，因为在俩黑子中间，一般走的人少。

g*********e
发帖数: 14401

当然是剪纸的但对于没减掉的分支他要搜到低求一个score 然后backpropagate

【在 D*******r 的大作中提到】

: 你觉得可能吗？把全美国的机子绑一起，都做不到每步5个分支，搜索50步。

D*******r
发帖数: 2323

对呀，问题就在这里，杀大龙的那条枝因为进行了20步评分不高（因为龙没死），所以
那条枝就被剪了，去搜索别的评分高的枝了。
我们都知道，杀龙而杀不死最损自己的空，所以杀龙是蒙特卡罗搜索最容易被剪掉的枝。

【在 g*********e 的大作中提到】

: 当然是剪纸的但对于没减掉的分支他要搜到低求一个score 然后backpropagate

m******n
发帖数: 15691

那么给狗吃阳春流，狗岂不是真的难招架

【在 k*l 的大作中提到】

: silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能，
: 所以狗漏算了，因为在俩黑子中间，一般走的人少。

l******t
发帖数: 55733

阳春流对狗根本不是问题

【在 m******n 的大作中提到】

: 那么给狗吃阳春流，狗岂不是真的难招架

相关主题
● 各位将军，阿狗到底输在哪一手啊	● 如果是98年的石佛上
● 人机大战之大结局-第五局之悬念丛生	● 为啥不走模仿棋？
● 按罗洗河的判断，阿法狗可让顶尖职业四子	● 阿法狗怎么做到每天练习几十万盘棋？
进入Go版参与讨论

x****i
发帖数: 729

应该不是杀大龙。而是有几块棋互相牵扯到、形成“复杂”的局面时，狗的算法里有一
定的几率会把“显而易见”的不利形势忽略掉，顾此失彼，甚至对一些紧急的地方视而
不见。它93手长，显然是认为自己气足，能提掉左边的白子，已经完全没有任何水准
，不可理喻了。还是李的第78手下得好，突然增加了很多变化，狗算不清楚了。应该
不是死循环之类的错误，而是它的负责形势判断的policy部分出了问题，这部分有一些
盲点让狗忽略了。
https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol

【在 D*******r 的大作中提到】

h*h
发帖数: 27852

复杂局面下剪枝容易错。对付狗，扩散热点是对。现在返回也许也能胜狗了

【在 x****i 的大作中提到】

: 应该不是杀大龙。而是有几块棋互相牵扯到、形成“复杂”的局面时，狗的算法里有一
: 定的几率会把“显而易见”的不利形势忽略掉，顾此失彼，甚至对一些紧急的地方视而
: 不见。它93手长，显然是认为自己气足，能提掉左边的白子，已经完全没有任何水准
: ，不可理喻了。还是李的第78手下得好，突然增加了很多变化，狗算不清楚了。应该
: 不是死循环之类的错误，而是它的负责形势判断的policy部分出了问题，这部分有一些
: 盲点让狗忽略了。
: https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol

r******i
发帖数: 1445

蒙特卡洛是展开到比赛结束，但不是“搜索”。搜索要靠返回的值来选择路径，而蒙特
卡洛靠“随机”来选择路径。
从杀大龙的角度讲，如果蒙特卡洛某一步“随机”的走了不相干的招，可能大龙就杀不
死，导致错误的模拟结果。

【在 g*********e 的大作中提到】

: 你们都没看蒙特卡洛搜索的介绍吧？
: 它是搜到比赛结束的

h*********r
发帖数: 10182

好像很有道理

【在 D*******r 的大作中提到】

l*****i
发帖数: 20533

后来出现的很多bug招法暗示着阿发狗在中盘真正计算量很大时算法有漏洞。所以看起
来也许先稳固防守拖进中盘，到时候阿发狗如果判定自己处于劣势，自己就会出漏勺然
后一败涂地。相比之下，前三盘可能李都太心急了。如果真是这样，那弄个日本人去下
搞不好会意外轻松的获胜。

(共1页)

进入Go版参与讨论

相关主题
● 为啥不走模仿棋？	● 网上怎么这么多纠缠打劫的SB
● 阿法狗怎么做到每天练习几十万盘棋？	● 阿狗的局部计算力问题
● 第三场预期李世石被屠龙	● 蒙特卡洛提速电脑围棋10年接近职业zz
● 阿法狗要杀大龙啊！	● 柯洁:电脑无敌?先过我这关我胜算大概六七成
● 狗狗不让打劫，是程序还不够完善？	● 仔细想了一下，阿法狗的算法在劫争上完全没有漏洞
● AlphaGo相关技术：蒙特卡罗(Monte Carlo)方法简介	● 柯洁虽然爱语不惊人死不休，但是正经说话是还是比较客观的
● 蒙特卡罗是不是有天生缺陷？	● 阿法狗第四局最终并不是输在对妙手的漏算上
● 打劫就是拼计算量	● 各位将军，阿狗到底输在哪一手啊

相关话题的讨论汇总
话题: 大龙话题: 搜索话题: 阿法话题: 劫争话题: 意杀

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天