D*******r 发帖数: 2323 | 1 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
的,它必须一直摆到对方没气时,才能确认能杀棋。
但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
死,于是放弃那条搜索路线。
这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。 |
M*******p 发帖数: 5626 | 2 我觉的也有躲避劫争的因素,阿狗不怕打劫,但是明显不喜欢打劫,能躲就躲开了。 |
b*******8 发帖数: 37364 | 3 有些这个意思,上一盘就有这个感觉
可能是训练数据里,杀大龙的以失败居多 |
t******l 发帖数: 10908 | 4 对数的深度搜索要牺牲广度,这个决定必须要 policy network 来选择是不是更
深搜索。所以还是 policy network 不给力。
【在 D*******r 的大作中提到】 : 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活 : 的,它必须一直摆到对方没气时,才能确认能杀棋。 : 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手 : 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不 : 死,于是放弃那条搜索路线。 : 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。
|
l******t 发帖数: 55733 | 5 应该是姐轮回太多超过了设定回合数,后面的估算就跑偏了。 |
d****o 发帖数: 443 | 6 好像是,变化太复杂了,越界了,搞一个大龙可能是秘药。
【在 D*******r 的大作中提到】 : 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活 : 的,它必须一直摆到对方没气时,才能确认能杀棋。 : 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手 : 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不 : 死,于是放弃那条搜索路线。 : 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。
|
D*******r 发帖数: 2323 | 7 劫争也是这个原因,因为劫争需要手数很多,虽然未必复杂,但是它的计算比如说到达
25手时就停止了,它还没得出这个劫争的利弊,它就不会去开这个劫,所以它几乎不会
主动开劫。当然,被逼打劫了,它还是按它算法来就是了。
【在 M*******p 的大作中提到】 : 我觉的也有躲避劫争的因素,阿狗不怕打劫,但是明显不喜欢打劫,能躲就躲开了。
|
D*******r 发帖数: 2323 | 8 死活的计算没法用policy network来解决,必须真枪实棒地把气全部收完才行。
【在 t******l 的大作中提到】 : 对数的深度搜索要牺牲广度,这个决定必须要 policy network 来选择是不是更 : 深搜索。所以还是 policy network 不给力。
|
D*******r 发帖数: 2323 | 9 都不算计算太复杂,主要是在什么情况下,能狗动态决定搜索广度和深度的问题。一本
道的杀大龙,广度很小,但是因为手数需要很多,阿狗没有搜索到收完气那手,就放弃
了认为杀不死。
【在 d****o 的大作中提到】 : 好像是,变化太复杂了,越界了,搞一个大龙可能是秘药。
|
g*********e 发帖数: 14401 | 10 你们都没看蒙特卡洛搜索的介绍吧?
它是搜到比赛结束的 |
|
|
D*******r 发帖数: 2323 | 11 你觉得可能吗?把全美国的机子绑一起,都做不到每步5个分支,搜索50步。
【在 g*********e 的大作中提到】 : 你们都没看蒙特卡洛搜索的介绍吧? : 它是搜到比赛结束的
|
t******l 发帖数: 10908 | 12 当中有随机数发生器,不是全遍历的。
【在 g*********e 的大作中提到】 : 你们都没看蒙特卡洛搜索的介绍吧? : 它是搜到比赛结束的
|
M*******p 发帖数: 5626 | 13 劫争的手数要放在这个25手里面,那么狗狗就是真的不善于打劫,因为复杂劫争肯定要
很多手的。所以,带劫争的极复杂局面应该就是狗狗的软肋。
【在 D*******r 的大作中提到】 : 劫争也是这个原因,因为劫争需要手数很多,虽然未必复杂,但是它的计算比如说到达 : 25手时就停止了,它还没得出这个劫争的利弊,它就不会去开这个劫,所以它几乎不会 : 主动开劫。当然,被逼打劫了,它还是按它算法来就是了。
|
t******l 发帖数: 10908 | 14 这倒是,反正大龙不多,以后所有大龙都算到底。
【在 D*******r 的大作中提到】 : 都不算计算太复杂,主要是在什么情况下,能狗动态决定搜索广度和深度的问题。一本 : 道的杀大龙,广度很小,但是因为手数需要很多,阿狗没有搜索到收完气那手,就放弃 : 了认为杀不死。
|
k*l 发帖数: 2574 | 15 silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能,
所以狗漏算了,因为在俩黑子中间,一般走的人少。 |
D*******r 发帖数: 2323 | 16 对于78的计算有没有漏算不清楚,要看它的log才知道。我是说李世石长左边子,置中
间大龙于不顾。狗的应手不是横跳一手,那样白上方几子的龙基本上就死了。但是阿法
狗的计算里没有杀大龙的目标,于是它选择飞,虽然还是笼罩着白棋,但是包围圈薄了
很多,然后白棋再一浅消,后面就出棋了。
【在 k*l 的大作中提到】 : silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能, : 所以狗漏算了,因为在俩黑子中间,一般走的人少。
|
g*********e 发帖数: 14401 | 17 当然是剪纸的 但对于没减掉的分支他要搜到低 求一个score 然后backpropagate
【在 D*******r 的大作中提到】 : 你觉得可能吗?把全美国的机子绑一起,都做不到每步5个分支,搜索50步。
|
D*******r 发帖数: 2323 | 18 对呀,问题就在这里,杀大龙的那条枝因为进行了20步评分不高(因为龙没死),所以
那条枝就被剪了,去搜索别的评分高的枝了。
我们都知道,杀龙而杀不死最损自己的空,所以杀龙是蒙特卡罗搜索最容易被剪掉的枝。
【在 g*********e 的大作中提到】 : 当然是剪纸的 但对于没减掉的分支他要搜到低 求一个score 然后backpropagate
|
m******n 发帖数: 15691 | 19 那么给狗吃阳春流,狗岂不是真的难招架
【在 k*l 的大作中提到】 : silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能, : 所以狗漏算了,因为在俩黑子中间,一般走的人少。
|
l******t 发帖数: 55733 | 20
阳春流对狗根本不是问题
【在 m******n 的大作中提到】 : 那么给狗吃阳春流,狗岂不是真的难招架
|
|
|
x****i 发帖数: 729 | 21 应该不是杀大龙。而是有几块棋互相牵扯到、形成“复杂”的局面时,狗的算法里有一
定的几率会把“显而易见”的不利形势忽略掉,顾此失彼,甚至对一些紧急的地方视而
不见。 它93手长,显然是认为自己气足,能提掉左边的白子,已经完全没有任何水准
,不可理喻了。 还是李的第78手下得好,突然增加了很多变化,狗算不清楚了。应该
不是死循环之类的错误,而是它的负责形势判断的policy部分出了问题,这部分有一些
盲点让狗忽略了。
https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol
【在 D*******r 的大作中提到】 : 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活 : 的,它必须一直摆到对方没气时,才能确认能杀棋。 : 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手 : 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不 : 死,于是放弃那条搜索路线。 : 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。
|
h*h 发帖数: 27852 | 22 复杂局面下剪枝容易错。对付狗,扩散热点是对。现在返回也许也能胜狗了
【在 x****i 的大作中提到】 : 应该不是杀大龙。而是有几块棋互相牵扯到、形成“复杂”的局面时,狗的算法里有一 : 定的几率会把“显而易见”的不利形势忽略掉,顾此失彼,甚至对一些紧急的地方视而 : 不见。 它93手长,显然是认为自己气足,能提掉左边的白子,已经完全没有任何水准 : ,不可理喻了。 还是李的第78手下得好,突然增加了很多变化,狗算不清楚了。应该 : 不是死循环之类的错误,而是它的负责形势判断的policy部分出了问题,这部分有一些 : 盲点让狗忽略了。 : https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol
|
r******i 发帖数: 1445 | 23 蒙特卡洛是展开到比赛结束,但不是“搜索”。搜索要靠返回的值来选择路径,而蒙特
卡洛靠“随机”来选择路径。
从杀大龙的角度讲,如果蒙特卡洛某一步“随机”的走了不相干的招,可能大龙就杀不
死,导致错误的模拟结果。
【在 g*********e 的大作中提到】 : 你们都没看蒙特卡洛搜索的介绍吧? : 它是搜到比赛结束的
|
h*********r 发帖数: 10182 | 24 好像很有道理
【在 D*******r 的大作中提到】 : 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活 : 的,它必须一直摆到对方没气时,才能确认能杀棋。 : 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手 : 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不 : 死,于是放弃那条搜索路线。 : 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。
|
l*****i 发帖数: 20533 | 25 后来出现的很多bug招法暗示着阿发狗在中盘真正计算量很大时算法有漏洞。所以看起
来也许先稳固防守拖进中盘,到时候阿发狗如果判定自己处于劣势,自己就会出漏勺然
后一败涂地。相比之下,前三盘可能李都太心急了。如果真是这样,那弄个日本人去下
搞不好会意外轻松的获胜。 |