由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 再次思考“胜率”的误区
相关主题
我对AlphaGo的理解仔细想了一下,阿法狗的算法在劫争上完全没有漏洞
AlphaGo认为贴七目半持白有利也被证实了从这两段话,可以看出柯洁确实要高出古力一筹
想赢AlphaGo的唯一机会是走已有定式金志锡:让我两个可能是好胜负
第三局估计也没啥可看了我来说个有点意义的客观比赛方案,你们看怎样?
技术贴(懂围棋的请进)Google的AlphaGo和李世石围棋比赛后有哪些影响
第四局人机大战之大结局-第五局之悬念丛生
谈谈阿法狗的致命盲点,而且只会越改越差。李世石:我再也不想下这样的比赛了。
李世石是不是对alphago的下棋方法了解太少了当年跟皇军作战,比这绝望多了
相关话题的讨论汇总
话题: 胜率话题: 走法话题: 遍历话题: 90%话题: 棋手
进入Go版参与讨论
1 (共1页)
M*T
发帖数: 123
1
假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
这乍看之下会觉得很有利啊,可实际上真的很有利吗?
在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分
胡来手段(90%-89%=1%),那么对机器来说,真实的胜率其实只有20%!
a****o
发帖数: 6612
2
因为围棋没有和棋,机器能够遍历所有情况的情况下,内部计算的胜率要么是100%,要
么是0%。
当然,还存在一个输赢多少的问题。

【在 M*T 的大作中提到】
: 假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: 对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
: 这乍看之下会觉得很有利啊,可实际上真的很有利吗?
: 在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
: 甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
: 可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
: 大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
: 就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
: 那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
: 即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分

a****o
发帖数: 6612
3
之所以用胜率,是因为无法遍历所有情况,对没有走过的棋只是做了一个胜率的估计。

【在 M*T 的大作中提到】
: 假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: 对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
: 这乍看之下会觉得很有利啊,可实际上真的很有利吗?
: 在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
: 甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
: 可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
: 大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
: 就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
: 那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
: 即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分

M*T
发帖数: 123
4

我上面是简化了。实际胜率是综合平均值。详细说个我的理解吧(仍旧是超级简化版)。
围棋从第一步开始,有361种走法,第二步有360,第三步359……排除提子的话(不排除
就太复杂了,毕竟不是写论文),到最后摆满棋盘,总共有361!(阶乘)种途径。
这些天文数字的各种途径终了,肯定有胜有负。将结果全部标出来,然后顺着这棵树往
回汇总。
例如向上汇总到第100手时的某一个节点,以下那些分支途径里,最后输赢结果的比率
是1:4,那么就说这一手的胜率是80%。
人类棋手,尤其是顶尖棋手,应该能够凭经验主动找出比较接近赢棋结果的那些途径,
而不是像人工智能那样全部考虑一遍。所以说这种胜率的计算对人类选手不适用,太
bias了。

【在 a****o 的大作中提到】
: 因为围棋没有和棋,机器能够遍历所有情况的情况下,内部计算的胜率要么是100%,要
: 么是0%。
: 当然,还存在一个输赢多少的问题。

a****o
发帖数: 6612
5
官子阶段有可能能遍历。

)。
排除

【在 M*T 的大作中提到】
:
: 我上面是简化了。实际胜率是综合平均值。详细说个我的理解吧(仍旧是超级简化版)。
: 围棋从第一步开始,有361种走法,第二步有360,第三步359……排除提子的话(不排除
: 就太复杂了,毕竟不是写论文),到最后摆满棋盘,总共有361!(阶乘)种途径。
: 这些天文数字的各种途径终了,肯定有胜有负。将结果全部标出来,然后顺着这棵树往
: 回汇总。
: 例如向上汇总到第100手时的某一个节点,以下那些分支途径里,最后输赢结果的比率
: 是1:4,那么就说这一手的胜率是80%。
: 人类棋手,尤其是顶尖棋手,应该能够凭经验主动找出比较接近赢棋结果的那些途径,
: 而不是像人工智能那样全部考虑一遍。所以说这种胜率的计算对人类选手不适用,太

h*h
发帖数: 27852
6
怀疑
狗有官子概念吗

【在 a****o 的大作中提到】
: 官子阶段有可能能遍历。
:
: )。
: 排除

b*******8
发帖数: 37364
7
楼主说的对,10%里面可能含有必然赢棋的套路,其实该下10%。
对很多死活题,如果靠统计而不算到底的话,根本就下不出那个唯一正解路径。整盘棋
在围棋上帝眼里就是一个算清的死活题,没啥概率不概率的,赢棋的最正确下法,可能
藏在你认为的小概率选点后面。
D***s
发帖数: 5613
8
围棋其实有和棋的,实战中有三劫循环结果和了。好像是古力和李世石下的?
[在 MKT (market) 的大作中提到:]

:假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
:...........
a*****g
发帖数: 19398
9
三劫问题,都是后来人为规定的。
追本溯源,坚持每个局面就是个时间的 moment,不可以重复倒流,
这样就不存在三劫的问题。

【在 D***s 的大作中提到】
: 围棋其实有和棋的,实战中有三劫循环结果和了。好像是古力和李世石下的?
: [在 MKT (market) 的大作中提到:]
: :
: :假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: :...........

z****g
发帖数: 2497
10
你这个假设就不对,因为不可能找到必赢的套路,除非到盘尾。
估计阿法狗只能搜索有限的步数,这是由围棋的尺寸和现有的计算能力决定的,除非计
算机的计算能力有指数级的提高,这个缺陷无解。因为分布式计算也有天花板,1000台
,一万台并行可以实现,再往上呢?

【在 b*******8 的大作中提到】
: 楼主说的对,10%里面可能含有必然赢棋的套路,其实该下10%。
: 对很多死活题,如果靠统计而不算到底的话,根本就下不出那个唯一正解路径。整盘棋
: 在围棋上帝眼里就是一个算清的死活题,没啥概率不概率的,赢棋的最正确下法,可能
: 藏在你认为的小概率选点后面。

相关主题
第四局仔细想了一下,阿法狗的算法在劫争上完全没有漏洞
谈谈阿法狗的致命盲点,而且只会越改越差。从这两段话,可以看出柯洁确实要高出古力一筹
李世石是不是对alphago的下棋方法了解太少了金志锡:让我两个可能是好胜负
进入Go版参与讨论
D*******r
发帖数: 2323
11
“胜率”只是用来做形势判断,而不是用来确定行棋持续的。
我原来举国一个例子,假设你现在局面还落后半目,现在还剩三手棋,一个先手一目,
一个后手两目,一个后手三目。那么,先手一目这手棋的胜率就是50%,而另外两个后
手棋的胜率是0%。
阿狗下棋,它其实是在和自己下棋,它不知道对面坐的是李世石,还是樊麾,还是一个
18K,它能做的只能是尽量把对方的胜利可能性在概率机会上尽量减少。即使对方是顶
尖高手,总能走到10%的可能胜利的走法,阿狗它自己又要从这剩余的10%的走法中找到
自己胜率最高的可能性。所以整个对局过程,就是在比谁能够每步都是选在胜率多的那
一边。
存不存在一手,从当前到终局90%的终局都是输,只有10%的终局会赢,但这手却是如果
双方都以完全正确的应手进行,这手是绝对胜利的一手?数学告诉我们,不存在。

【在 M*T 的大作中提到】
: 假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: 对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
: 这乍看之下会觉得很有利啊,可实际上真的很有利吗?
: 在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
: 甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
: 可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
: 大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
: 就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
: 那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
: 即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分

n*****t
发帖数: 22014
12
你这胜率计算也是服了 。。。。

【在 D*******r 的大作中提到】
: “胜率”只是用来做形势判断,而不是用来确定行棋持续的。
: 我原来举国一个例子,假设你现在局面还落后半目,现在还剩三手棋,一个先手一目,
: 一个后手两目,一个后手三目。那么,先手一目这手棋的胜率就是50%,而另外两个后
: 手棋的胜率是0%。
: 阿狗下棋,它其实是在和自己下棋,它不知道对面坐的是李世石,还是樊麾,还是一个
: 18K,它能做的只能是尽量把对方的胜利可能性在概率机会上尽量减少。即使对方是顶
: 尖高手,总能走到10%的可能胜利的走法,阿狗它自己又要从这剩余的10%的走法中找到
: 自己胜率最高的可能性。所以整个对局过程,就是在比谁能够每步都是选在胜率多的那
: 一边。
: 存不存在一手,从当前到终局90%的终局都是输,只有10%的终局会赢,但这手却是如果

k*****e
发帖数: 22013
13
判断胜率不是随机乱走,
而是根据已有棋谱判断出来的高概率落子点,
阿法狗有个快速走子系统就是干这个的,
走子的水平相当于业余段位。
也就是说,让业余段位的人走1000盘,
然后在这个基础上估计胜率。
但是,我也无法解释在一路立是怎么走出来的。
初学的傻瓜也不会这么走吧。

【在 M*T 的大作中提到】
: 假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: 对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
: 这乍看之下会觉得很有利啊,可实际上真的很有利吗?
: 在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
: 甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
: 可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
: 大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
: 就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
: 那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
: 即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分

n*****t
发帖数: 22014
14
我估计类似人类打将,算不清或者极端落后的时候,通过落子减少盘面的复杂程度

【在 k*****e 的大作中提到】
: 判断胜率不是随机乱走,
: 而是根据已有棋谱判断出来的高概率落子点,
: 阿法狗有个快速走子系统就是干这个的,
: 走子的水平相当于业余段位。
: 也就是说,让业余段位的人走1000盘,
: 然后在这个基础上估计胜率。
: 但是,我也无法解释在一路立是怎么走出来的。
: 初学的傻瓜也不会这么走吧。

M*T
发帖数: 123
15

嗯,是的。这样对顶尖棋手还是会过于乐观,不过应该靠谱多了。

【在 k*****e 的大作中提到】
: 判断胜率不是随机乱走,
: 而是根据已有棋谱判断出来的高概率落子点,
: 阿法狗有个快速走子系统就是干这个的,
: 走子的水平相当于业余段位。
: 也就是说,让业余段位的人走1000盘,
: 然后在这个基础上估计胜率。
: 但是,我也无法解释在一路立是怎么走出来的。
: 初学的傻瓜也不会这么走吧。

b*******8
发帖数: 37364
16
我的哪个假设不对?

★ 发自iPhone App: ChineseWeb 11

【在 z****g 的大作中提到】
: 你这个假设就不对,因为不可能找到必赢的套路,除非到盘尾。
: 估计阿法狗只能搜索有限的步数,这是由围棋的尺寸和现有的计算能力决定的,除非计
: 算机的计算能力有指数级的提高,这个缺陷无解。因为分布式计算也有天花板,1000台
: ,一万台并行可以实现,再往上呢?

s******n
发帖数: 6806
17
胜率可能是狗左右互搏做的估算。也就是说这个胜率至少是面对顶级高手时的结果,不
会有你说的那些很烂的走法。
M*T
发帖数: 123
18
第五局右下的大勺子,很像是胜率的误区。
被黑棋打死,只有一种走法。
而其他狗狗评估的走法可能存有好几种,
(例如9种)。
于是走这个大勺子的“胜率”很高了。(90%)
b*******8
发帖数: 37364
19
就是这个误区。应该把无效分支去掉后估计概率。有些渣滓参与投票,搞乱了局面。

【在 M*T 的大作中提到】
: 第五局右下的大勺子,很像是胜率的误区。
: 被黑棋打死,只有一种走法。
: 而其他狗狗评估的走法可能存有好几种,
: (例如9种)。
: 于是走这个大勺子的“胜率”很高了。(90%)

r******i
发帖数: 1445
20

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~不完全是这样。alphago给走
法加权了的。也就是说即使是alphago认为的“好手”也有90%会输。

【在 M*T 的大作中提到】
: 假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: 对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
: 这乍看之下会觉得很有利啊,可实际上真的很有利吗?
: 在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
: 甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
: 可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
: 大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
: 就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
: 那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
: 即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分

相关主题
我来说个有点意义的客观比赛方案,你们看怎样?李世石:我再也不想下这样的比赛了。
Google的AlphaGo和李世石围棋比赛后有哪些影响当年跟皇军作战,比这绝望多了
人机大战之大结局-第五局之悬念丛生拿狗来验证历史上的棋手,很有意思
进入Go版参与讨论
r******i
发帖数: 1445
21
好像应氏规则是这样的?
http://senseis.xmp.net/?IngKoRule

【在 a*****g 的大作中提到】
: 三劫问题,都是后来人为规定的。
: 追本溯源,坚持每个局面就是个时间的 moment,不可以重复倒流,
: 这样就不存在三劫的问题。

m**c
发帖数: 7349
22

你先假设机器可以遍历,然后引用了阿发狗的思路。这就有点问题了。
阿发狗思路的前提就是假设机器不能遍历。Nature那篇paper上来就说
"In large games,such as chess and especially Go, eexhaustive search is
infeasible"。然后阿法据此步步优化。
回头来看,假如可以遍历,再假如是两台机器都遍历,我估计每一步都差不多50%,都在
阳光之下了。这跟掷硬币没啥区别了嘛。

【在 M*T 的大作中提到】
: 假设机器能够遍历所有情况,那么胜率90%,大概含义是说这一手之后,
: 对方所有的应对中,90%的走法是会输棋,仅有10%的走法会赢。
: 这乍看之下会觉得很有利啊,可实际上真的很有利吗?
: 在那些90%会输的应对里,很大一部分都是乱七八糟、攻防不顾、
: 甚至悍然送死都有的走法吧?对于人工智能可能没太大区别,
: 可对于一个职业棋手,尤其是顶尖棋手来说,那些随机胡来的走法
: 大部分几乎根本就不再考虑范围之内的吧?他花时间长考的,
: 就算有偏差,也基本上可以说,是非常接近那10%的走法范围的。
: 那么实际上,这个胜率就不过只是统计意义了。面对一个顶尖棋手,
: 即便他只能想到那10%的走法中的一半(5%),但是能剔除了大部分

t******l
发帖数: 10908
23
全局优化算法基本不能穷举遍历的,那句其实是灌 paper 的套话,凑字数。

【在 m**c 的大作中提到】
:
: 你先假设机器可以遍历,然后引用了阿发狗的思路。这就有点问题了。
: 阿发狗思路的前提就是假设机器不能遍历。Nature那篇paper上来就说
: "In large games,such as chess and especially Go, eexhaustive search is
: infeasible"。然后阿法据此步步优化。
: 回头来看,假如可以遍历,再假如是两台机器都遍历,我估计每一步都差不多50%,都在
: 阳光之下了。这跟掷硬币没啥区别了嘛。

M*T
发帖数: 123
24

可以修改一下,两条:
一、模拟深度有限,例如只能算30步。
二、不以全局输赢决定,而是用盘面数目的方式。
(当然数目在开局阶段近似于玩笑,但从中局开始,越往后还是越靠谱的。)
就优选出的各个着法算深30步,判断那之后的盘面目数比,然后树形回溯汇总。
这个当然模糊,不过在量子计算机之前,也只能这么凑合了吧。。。

【在 m**c 的大作中提到】
:
: 你先假设机器可以遍历,然后引用了阿发狗的思路。这就有点问题了。
: 阿发狗思路的前提就是假设机器不能遍历。Nature那篇paper上来就说
: "In large games,such as chess and especially Go, eexhaustive search is
: infeasible"。然后阿法据此步步优化。
: 回头来看,假如可以遍历,再假如是两台机器都遍历,我估计每一步都差不多50%,都在
: 阳光之下了。这跟掷硬币没啥区别了嘛。

B****n
发帖数: 11290
25
要換個思維 對它而言 能夠遍歷的就可算是官子 呵呵

【在 h*h 的大作中提到】
: 怀疑
: 狗有官子概念吗

n*****t
发帖数: 22014
26
开局的时候盘面有十几数十个可能选点,估计每个分支顶多算十来手吧。当然,选用大
型定势不见得便宜,一步步走下去可能都是一本道。倒是应该考虑左右呼应配合之类,
越是算不清的电脑越抓瞎。

【在 M*T 的大作中提到】
:
: 可以修改一下,两条:
: 一、模拟深度有限,例如只能算30步。
: 二、不以全局输赢决定,而是用盘面数目的方式。
: (当然数目在开局阶段近似于玩笑,但从中局开始,越往后还是越靠谱的。)
: 就优选出的各个着法算深30步,判断那之后的盘面目数比,然后树形回溯汇总。
: 这个当然模糊,不过在量子计算机之前,也只能这么凑合了吧。。。

t*n
发帖数: 14458
27
中国规则下也不可能出现所谓三劫无胜负
"第六条 禁止全局同形再现"

【在 r******i 的大作中提到】
: 好像应氏规则是这样的?
: http://senseis.xmp.net/?IngKoRule

1 (共1页)
进入Go版参与讨论
相关主题
当年跟皇军作战,比这绝望多了技术贴(懂围棋的请进)
拿狗来验证历史上的棋手,很有意思第四局
昨天的比赛至少是让先差距谈谈阿法狗的致命盲点,而且只会越改越差。
看阿法狗的自战棋谱有彻底崩溃的感觉李世石是不是对alphago的下棋方法了解太少了
我对AlphaGo的理解仔细想了一下,阿法狗的算法在劫争上完全没有漏洞
AlphaGo认为贴七目半持白有利也被证实了从这两段话,可以看出柯洁确实要高出古力一筹
想赢AlphaGo的唯一机会是走已有定式金志锡:让我两个可能是好胜负
第三局估计也没啥可看了我来说个有点意义的客观比赛方案,你们看怎样?
相关话题的讨论汇总
话题: 胜率话题: 走法话题: 遍历话题: 90%话题: 棋手