由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 我觉得阿法狗的bug是不愿意杀大龙
相关主题
狗狗不让打劫,是程序还不够完善?仔细想了一下,阿法狗的算法在劫争上完全没有漏洞
AlphaGo相关技术:蒙特卡罗(Monte Carlo)方法简介柯洁虽然爱语不惊人死不休,但是正经说话是还是比较客观的
蒙特卡罗是不是有天生缺陷?阿法狗第四局最终并不是输在对妙手的漏算上
打劫就是拼计算量各位将军,阿狗到底输在哪一手啊
网上怎么这么多纠缠打劫的SB人机大战之大结局-第五局之悬念丛生
阿狗的局部计算力问题按罗洗河的判断,阿法狗可让顶尖职业四子
蒙特卡洛提速电脑围棋10年接近职业zz如果是98年的石佛上
柯洁:电脑无敌?先过我这关 我胜算大概六七成为啥不走模仿棋?
相关话题的讨论汇总
话题: 大龙话题: 搜索话题: 阿法话题: 劫争话题: 意杀
进入Go版参与讨论
1 (共1页)
D*******r
发帖数: 2323
1
杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
的,它必须一直摆到对方没气时,才能确认能杀棋。
但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
死,于是放弃那条搜索路线。
这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。
M*******p
发帖数: 5626
2
我觉的也有躲避劫争的因素,阿狗不怕打劫,但是明显不喜欢打劫,能躲就躲开了。
b*******8
发帖数: 37364
3
有些这个意思,上一盘就有这个感觉
可能是训练数据里,杀大龙的以失败居多
t******l
发帖数: 10908
4
对数的深度搜索要牺牲广度,这个决定必须要 policy network 来选择是不是更
深搜索。所以还是 policy network 不给力。

【在 D*******r 的大作中提到】
: 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
: 的,它必须一直摆到对方没气时,才能确认能杀棋。
: 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
: 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
: 死,于是放弃那条搜索路线。
: 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。

l******t
发帖数: 55733
5
应该是姐轮回太多超过了设定回合数,后面的估算就跑偏了。
d****o
发帖数: 443
6
好像是,变化太复杂了,越界了,搞一个大龙可能是秘药。

【在 D*******r 的大作中提到】
: 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
: 的,它必须一直摆到对方没气时,才能确认能杀棋。
: 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
: 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
: 死,于是放弃那条搜索路线。
: 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。

D*******r
发帖数: 2323
7
劫争也是这个原因,因为劫争需要手数很多,虽然未必复杂,但是它的计算比如说到达
25手时就停止了,它还没得出这个劫争的利弊,它就不会去开这个劫,所以它几乎不会
主动开劫。当然,被逼打劫了,它还是按它算法来就是了。

【在 M*******p 的大作中提到】
: 我觉的也有躲避劫争的因素,阿狗不怕打劫,但是明显不喜欢打劫,能躲就躲开了。
D*******r
发帖数: 2323
8
死活的计算没法用policy network来解决,必须真枪实棒地把气全部收完才行。

【在 t******l 的大作中提到】
: 对数的深度搜索要牺牲广度,这个决定必须要 policy network 来选择是不是更
: 深搜索。所以还是 policy network 不给力。

D*******r
发帖数: 2323
9
都不算计算太复杂,主要是在什么情况下,能狗动态决定搜索广度和深度的问题。一本
道的杀大龙,广度很小,但是因为手数需要很多,阿狗没有搜索到收完气那手,就放弃
了认为杀不死。

【在 d****o 的大作中提到】
: 好像是,变化太复杂了,越界了,搞一个大龙可能是秘药。
g*********e
发帖数: 14401
10
你们都没看蒙特卡洛搜索的介绍吧?
它是搜到比赛结束的
相关主题
阿狗的局部计算力问题仔细想了一下,阿法狗的算法在劫争上完全没有漏洞
蒙特卡洛提速电脑围棋10年接近职业zz柯洁虽然爱语不惊人死不休,但是正经说话是还是比较客观的
柯洁:电脑无敌?先过我这关 我胜算大概六七成阿法狗第四局最终并不是输在对妙手的漏算上
进入Go版参与讨论
D*******r
发帖数: 2323
11
你觉得可能吗?把全美国的机子绑一起,都做不到每步5个分支,搜索50步。

【在 g*********e 的大作中提到】
: 你们都没看蒙特卡洛搜索的介绍吧?
: 它是搜到比赛结束的

t******l
发帖数: 10908
12
当中有随机数发生器,不是全遍历的。

【在 g*********e 的大作中提到】
: 你们都没看蒙特卡洛搜索的介绍吧?
: 它是搜到比赛结束的

M*******p
发帖数: 5626
13
劫争的手数要放在这个25手里面,那么狗狗就是真的不善于打劫,因为复杂劫争肯定要
很多手的。所以,带劫争的极复杂局面应该就是狗狗的软肋。

【在 D*******r 的大作中提到】
: 劫争也是这个原因,因为劫争需要手数很多,虽然未必复杂,但是它的计算比如说到达
: 25手时就停止了,它还没得出这个劫争的利弊,它就不会去开这个劫,所以它几乎不会
: 主动开劫。当然,被逼打劫了,它还是按它算法来就是了。

t******l
发帖数: 10908
14
这倒是,反正大龙不多,以后所有大龙都算到底。

【在 D*******r 的大作中提到】
: 都不算计算太复杂,主要是在什么情况下,能狗动态决定搜索广度和深度的问题。一本
: 道的杀大龙,广度很小,但是因为手数需要很多,阿狗没有搜索到收完气那手,就放弃
: 了认为杀不死。

k*l
发帖数: 2574
15
silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能,
所以狗漏算了,因为在俩黑子中间,一般走的人少。
D*******r
发帖数: 2323
16
对于78的计算有没有漏算不清楚,要看它的log才知道。我是说李世石长左边子,置中
间大龙于不顾。狗的应手不是横跳一手,那样白上方几子的龙基本上就死了。但是阿法
狗的计算里没有杀大龙的目标,于是它选择飞,虽然还是笼罩着白棋,但是包围圈薄了
很多,然后白棋再一浅消,后面就出棋了。

【在 k*l 的大作中提到】
: silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能,
: 所以狗漏算了,因为在俩黑子中间,一般走的人少。

g*********e
发帖数: 14401
17
当然是剪纸的 但对于没减掉的分支他要搜到低 求一个score 然后backpropagate

【在 D*******r 的大作中提到】
: 你觉得可能吗?把全美国的机子绑一起,都做不到每步5个分支,搜索50步。
D*******r
发帖数: 2323
18
对呀,问题就在这里,杀大龙的那条枝因为进行了20步评分不高(因为龙没死),所以
那条枝就被剪了,去搜索别的评分高的枝了。
我们都知道,杀龙而杀不死最损自己的空,所以杀龙是蒙特卡罗搜索最容易被剪掉的枝。

【在 g*********e 的大作中提到】
: 当然是剪纸的 但对于没减掉的分支他要搜到低 求一个score 然后backpropagate
m******n
发帖数: 15691
19
那么给狗吃阳春流,狗岂不是真的难招架

【在 k*l 的大作中提到】
: silver说狗是预测对方的下一步move然后作出对策和评价。真算全盘是不是还不可能,
: 所以狗漏算了,因为在俩黑子中间,一般走的人少。

l******t
发帖数: 55733
20

阳春流对狗根本不是问题

【在 m******n 的大作中提到】
: 那么给狗吃阳春流,狗岂不是真的难招架
相关主题
各位将军,阿狗到底输在哪一手啊如果是98年的石佛上
人机大战之大结局-第五局之悬念丛生为啥不走模仿棋?
按罗洗河的判断,阿法狗可让顶尖职业四子阿法狗怎么做到每天练习几十万盘棋?
进入Go版参与讨论
x****i
发帖数: 729
21
应该不是杀大龙。而是有几块棋互相牵扯到、形成“复杂”的局面时,狗的算法里有一
定的几率会把“显而易见”的不利形势忽略掉,顾此失彼,甚至对一些紧急的地方视而
不见。 它93手长,显然是认为自己气足,能提掉左边的白子,已经完全没有任何水准
,不可理喻了。 还是李的第78手下得好,突然增加了很多变化,狗算不清楚了。应该
不是死循环之类的错误,而是它的负责形势判断的policy部分出了问题,这部分有一些
盲点让狗忽略了。
https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol

【在 D*******r 的大作中提到】
: 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
: 的,它必须一直摆到对方没气时,才能确认能杀棋。
: 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
: 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
: 死,于是放弃那条搜索路线。
: 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。

h*h
发帖数: 27852
22
复杂局面下剪枝容易错。对付狗,扩散热点是对。现在返回也许也能胜狗了

【在 x****i 的大作中提到】
: 应该不是杀大龙。而是有几块棋互相牵扯到、形成“复杂”的局面时,狗的算法里有一
: 定的几率会把“显而易见”的不利形势忽略掉,顾此失彼,甚至对一些紧急的地方视而
: 不见。 它93手长,显然是认为自己气足,能提掉左边的白子,已经完全没有任何水准
: ,不可理喻了。 还是李的第78手下得好,突然增加了很多变化,狗算不清楚了。应该
: 不是死循环之类的错误,而是它的负责形势判断的policy部分出了问题,这部分有一些
: 盲点让狗忽略了。
: https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol

r******i
发帖数: 1445
23
蒙特卡洛是展开到比赛结束,但不是“搜索”。搜索要靠返回的值来选择路径,而蒙特
卡洛靠“随机”来选择路径。
从杀大龙的角度讲,如果蒙特卡洛某一步“随机”的走了不相干的招,可能大龙就杀不
死,导致错误的模拟结果。

【在 g*********e 的大作中提到】
: 你们都没看蒙特卡洛搜索的介绍吧?
: 它是搜到比赛结束的

h*********r
发帖数: 10182
24
好像很有道理

【在 D*******r 的大作中提到】
: 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
: 的,它必须一直摆到对方没气时,才能确认能杀棋。
: 但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
: 棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
: 死,于是放弃那条搜索路线。
: 这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。

l*****i
发帖数: 20533
25
后来出现的很多bug招法暗示着阿发狗在中盘真正计算量很大时算法有漏洞。所以看起
来也许先稳固防守拖进中盘,到时候阿发狗如果判定自己处于劣势,自己就会出漏勺然
后一败涂地。相比之下,前三盘可能李都太心急了。如果真是这样,那弄个日本人去下
搞不好会意外轻松的获胜。
1 (共1页)
进入Go版参与讨论
相关主题
为啥不走模仿棋?网上怎么这么多纠缠打劫的SB
阿法狗怎么做到每天练习几十万盘棋?阿狗的局部计算力问题
第三场预期李世石被屠龙蒙特卡洛提速电脑围棋10年接近职业zz
阿法狗要杀大龙啊!柯洁:电脑无敌?先过我这关 我胜算大概六七成
狗狗不让打劫,是程序还不够完善?仔细想了一下,阿法狗的算法在劫争上完全没有漏洞
AlphaGo相关技术:蒙特卡罗(Monte Carlo)方法简介柯洁虽然爱语不惊人死不休,但是正经说话是还是比较客观的
蒙特卡罗是不是有天生缺陷?阿法狗第四局最终并不是输在对妙手的漏算上
打劫就是拼计算量各位将军,阿狗到底输在哪一手啊
相关话题的讨论汇总
话题: 大龙话题: 搜索话题: 阿法话题: 劫争话题: 意杀