O****X 发帖数: 24292 | 1 真扯,周睿羊靠肉搏,还是充满了漏算的肉搏,还拿到专业的等级分第一 |
|
D*******r 发帖数: 2323 | 2 它用两千万盘左右互搏的结果来分析自己每一步又没有漏算,对每一步的价值估算是否
准确。 |
|
n******n 发帖数: 12088 | 3 电脑肯定没去想对手心理,也想不来。就是随机选了一步胜率大的棋。当然也可能漏算。 |
|
D*******r 发帖数: 2323 | 4 那是局面已经落后了,不拼就是安乐死,拼的话又没啥手段,指望计算机漏算或者犯错
而捡漏,结果啥也没捡着。
常下棋的人都知道,对手棋高一着的时候,自己的技术动作会变形的。 |
|
x**8 发帖数: 1939 | 5 人类的取胜之道在于:致胜的一系列妙手在十几手之外,因而被电脑漏算,并且不可挽
回,
显然李世石没有这样的能力, |
|
a***g 发帖数: 2761 | 6 这才是电脑的强项吧
人才会漏算吧,电脑是高概率最优 |
|
a***g 发帖数: 2761 | 7 恐怕包含妙手的分支剪不掉
也许下足够多盘,会有几次漏算 |
|
D*******r 发帖数: 2323 | 8 是相当于摆了几十万到上百万个变化图研讨,根据每个变化图来调整自己的policy
network的走子策略有没有漏算,自己的value network的加权价值是否准确。
而蒙特卡罗是在走子策略选定的参考点范围内进行计算,而它的赢棋概率也是结合
value network做加权调整。蒙特卡罗搜索本身就是树状搜索,然后砍枝淘汰。这个是
固定的algorithm,不是同过train出来的,所以左右互搏训练时,不需要加入搜索计算。 |
|
|
D*******r 发帖数: 2323 | 9 先以人类的对局为基础是以人类总结的知识为基础,建立基础模型。否则完全从自己的
对弈开始,要试遍所有的combination,数据量太大。有了基础模型后,然后它通过自
我对局找outlier,用此发现有没有在基础模型漏算的招法。相当于拆解几十万个变化
图,人类棋手几个每天拆解几十万个变化图来纠正自己的认识?
即使是人类的专业棋谱,计算机也不是简单地吸收,它将十几万盘棋谱,三千多万局面
进行复盘分析,调整基础模型的认识,人类棋手哪个能做到复盘十万棋谱,对三千万个
局面拆解分析局面? |
|
s***y 发帖数: 357 | 10 alpha go果然在复杂局面下还是可能漏算较优选点 (相对人类)。所以说围棋复杂度
还是一个重要的因素。 另外价值网络出现问题的可能也得到了验证 |
|
x****u 发帖数: 12955 | 11
就算夹右下是最佳解,也不等于这就惩罚到了。很难想象机器人会没有考虑到这个应手
。只要这个应手的后果不是需要几十手之后才能显现出来,机器人不可能漏算 |
|
m**o 发帖数: 9805 | 12 回头一看,小李两边都低头忍了也很有味道了,LOL
我感觉是黑棋一味追求外势,确实过分了
古力一个劲说这个走法,能忍第一回,不能再忍一回
没那个妙手的话白棋确实不好办
看样子弱点还是全局性的复杂局面,容易出现漏算 |
|
D*******r 发帖数: 2323 | 13 对于78的计算有没有漏算不清楚,要看它的log才知道。我是说李世石长左边子,置中
间大龙于不顾。狗的应手不是横跳一手,那样白上方几子的龙基本上就死了。但是阿法
狗的计算里没有杀大龙的目标,于是它选择飞,虽然还是笼罩着白棋,但是包围圈薄了
很多,然后白棋再一浅消,后面就出棋了。 |
|
g*c 发帖数: 68 | 14 中腹要杀大龙需要四面围定同时破掉眼位,这样导致选点过多,于是系统容易发生漏算
。另一方面是中腹围地的效率最低,所以人类棋手也不愿意走,这就导致训练样本不足
。今天李世石在两边早早抢实地定型,导致狗在边上找不到可利用的弱点,于是终于崩
了。第二局的时候如果李不出昏招再坚持一会没准也会出现今天的局面。当然今天会不
会是狗改用了新的测试版也说不准,反正没法监督他们用什么系统。
这几盘的规律感觉狗不怕被攻,但攻击对手时容易出现漏洞。李世石表现最好的两盘恰
恰是执白就说明了问题。所以后面还是先抢实地边上定型然后决战中腹。 |
|
n******r 发帖数: 4455 | 15 赞干货
我之前觉得赢电脑的理论可能在于选子器的漏算,没想到实战中居然遇到了
但是知道选子器有缺陷不代表可以有针对的攻击,除非狗开放选子器让人评估 |
|
a******0 发帖数: 121 | 16 Nature 文章:联机 AlphaGo 对单机 AlphaGo 胜率是70%。
联机 AlphaGo 搜索深度更高,但还不时(30%)输给用同样算法且慢很多的单机。这显
示AlphaGo 的算法是有很多漏算和随机性的。 |
|
h*********r 发帖数: 10182 | 17 这样人类棋手就有信心了。
感觉李师师3盘过后,已经信心完全比击垮了。
现在好了,alphago也会有有大恶手。心理上要比以前好多了。
水平发挥也会好很多。 |
|
|
b*******i 发帖数: 594 | 19 我倾向于分布系统紊乱造成的昏招迭出。
即使对白78有漏算,后面的胡下也是毫无道理的。我不太相信google测试程序的时候会
不测试局面落后的状况,我觉得有可能是分布系统的bug造成程序“以为”自己还占据
优势从而乱来,而不是算法的问题。还是看看今天的对局结果如何。 |
|
D*******r 发帖数: 2323 | 20 右边四子本来就没死,都谈不上僵尸。
对78的漏算和形势误判,导致83至97的发疯。否则依然是白难局。 |
|
D*******r 发帖数: 2323 | 21 主要是要看这种bug是不是容易repro,现在也没人敢说谁有能力在每局中repro白78手
那种让阿狗发昏的手段。
即使deepmind后台查log可以看到它砍掉了哪些有价值的搜索分支,他们也未必能总结
出这种漏算的pattern是什么。 |
|
D*******r 发帖数: 2323 | 22 或者这么说吧,业三助手不能帮助阿狗选哪个点,但有权力否决阿狗的选点,打回去让
它重想。 |
|
r***k 发帖数: 13586 | 23 93/97/101都属于明显的发疯行为,当然其中97最甚。 |
|
D*******r 发帖数: 2323 | 24 由业三水平能准确判断为发疯的那种应手,比如说左下角那一挖,损出去近10目。 |
|
|
t******l 发帖数: 10908 | 26 那主攻方向还是 DCNN 做的更好些。毕竟低级模块 MCT 受时间限制是天赋缺陷。 |
|
O**l 发帖数: 12923 | 27 问题DCNN这玩意根本没啥数学模型 完全是个黑箱子
不过他们现在从0开始训练 不用人类棋谱 应该是个思路
其实最简单方法应该就是时间分配算法再好一点 或者UCB1第二项的权值再大一点 |
|
z****g 发帖数: 2497 | 28 你认为李只用四盘就搞出一大bug是撞大运? 满打满算其实就两盘而已。。前两盘算是
遭遇战。
人类高手前两盘就看出阿发狗在劫争这一块是弱点,小李立马就得手了,这绝不是偶然
事件。 |
|
D*******r 发帖数: 2323 | 29 在没有足够多的测试次数及repro次数的验证下,你就是第一局就搞出一个大bug也无法
说明不是撞大运。 |
|
n*****t 发帖数: 22014 | 30 比如左下的碰,棋渣嘴上说不懂,心里是不以为然,结果是亏损。这种棋你让业三判断? |
|
D*******r 发帖数: 2323 | 31 业三判断不了的他就不否决不就完了。我说的是业三只否决他100%肯定是亏且亏不小
的。
我又不是说只要有业三把关,狗的棋就100%是绝对正确的,我只是说加一个业三水平的
把关,昨天那种棋阿狗就输不出去。
断? |
|
n*****t 发帖数: 22014 | 32 你还是没明白黑输在哪里
业三判断不了的他就不否决不就完了。我说的是业三只否决他100%肯定是亏且亏不小 |
|
z****g 发帖数: 2497 | 33 难道你认为这个bug不是reproducible的?你看看阿发狗敢放出来公测吗?
算了,就现在看狗狗是不敢拿出来公测的,要不deepmind没法圈钱了。 必须见好就收
。 |
|
m******V 发帖数: 1291 | 34 你的意思是说Al不能100%管用,还需要一个人站在旁边盯着,防止出错。如果那样是不
是人类这边也应该有个资讯团,或者可以摆棋防止误算,这样才公平?
你说狗是输在误算后的发疯上,即使狗不走发疯的几步,当时狗已经落后了,那么人这
边也不发疯无误算,狗怎么赢回来?难道你只允许人犯错,狗不犯错。那比赛意义何在
,是探讨棋理还是为了说明人总会犯错
业三判断不了的他就不否决不就完了。我说的是业三只否决他100%肯定是亏且亏不小 |
|
D*******r 发帖数: 2323 | 35 不要总是从A I和人P K的角度去想问题,换一个角度去看,我这是说对于一个本来是极
度复杂的智能工作,本来需要一个高智商的人经过十多年的艰苦训练才能达到的程度,
会被一个初学者加人工智能轻松胜任,你可以说初学者辅助人工智能,其实何尝不是人
工智能在辅助人。
比如说,无人驾驶汽车不能保证100%安全,那么是不是就没有用呢,如果车里有一个不
需要学车考驾照的坐车里做最基本辅助就能保证100%安全是不是好事?在美国的华人,
父母因为不会开车而出行不便,有这样的需要辅助的无人驾驶汽车是不是好事? |
|
|
d*********2 发帖数: 48111 | 37 一直都在说, 时间越长, 对电脑越有利.
如果是快棋赛, MCT的深度就很难取舍了 |
|
d*********2 发帖数: 48111 | 38 我觉得对围棋来说, 重现概率还是蛮大的
可以制造劫争, 制造大空, 制造杀棋等等延长计算步数的下法 |
|
|
d*********2 发帖数: 48111 | 40 昨天有一手棋, 左边白可以板断, 形成对称模仿棋.
结果李连续两次大忍让. 让狗走出来那个很脆弱的左边黑棋的棋形.
如果说李预先计划好了大棋, 应该就是这里了 |
|
n***i 发帖数: 4627 | 41 78以后白也没有什么便宜,只是局面非常复杂,估计没有人完全能算清,但是白旗不怎
么走基本安乐死了。
机器评估体系显然有缺陷,对78的评估出问题了,后面臭棋连出。换人下黑棋,这棋上
半场输不出去。 |
|
m*****n 发帖数: 3644 | 42 我觉得抽疯应该好修,但是漏算神之一手,打劫这些不好修。貌似打劫问题也不大。我
同意如果业余高手能把劫做大做重,几乎就能赢了。但是许多时候alpha能回避 |
|
c*********n 发帖数: 1282 | 43 第四盘阿发狗下棋速度快了不少,感觉是在测试到底需要搜索多少步就可以战胜人脑。
像是阿发狗,减少了需要搜索的步数,结果行棋快了,但漏算的棋。 |
|
n*****t 发帖数: 22014 | 44 很多关键落子都能在阿狗和小李子落子前判断出来,相当敏锐。
当然,敏锐不一定等于就能赢阿狗,对局中需要大量验算,而且要保证不能漏算。另外
这孩子有点糙,之前跟李世石对局,好几次落子的刹那开始后悔。不过好在进取心很强
,磨砺磨砺应该不愧当今围棋第一顶尖高手。
至于阿狗,无疑具备一流棋手的水准,但离人类的顶尖还有差距。而且,我不认为这种
差距是可以靠傻练在短时间可以弥补的,必须在算法上再有创新和突破。最主要的问题
还是围棋的理解,比如厚势到底能转化多少目。 |
|
O**l 发帖数: 12923 | 45 也不难复制 就是否一手漏算 这手有事关大局 胜率瞬间狂降
几十亿节点的UCT树瞬间清空 丫就用一分钟随机挑一个 就乱下了 |
|
h*********n 发帖数: 5789 | 46 然后再治孤。Alphago对于局部的计算很清楚,但是对于全局性的关键死活还是会漏算。
Alphago擅于积小胜成大胜,大局观相当好。 |
|
M*******p 发帖数: 5626 | 47 还是和阿法狗的算法有关,杀大龙和打劫在它选点里面应该都是胜率较低的选择,因为
步骤多,超出了它25步(?)的计算范畴,虽然这些手段在人类棋手看来却是胜率高的
选择。第四局它漏算78手(其实是假妙手)狗狗的工程师说了,是万分之一的概率,确
实很小,但是在那种局面下说不定就不止是万分之一了,因为那个局面牵扯到五块棋对
杀,还有劫争,这些合在一起应该是大大增加了狗狗出错的概率。你看其他几盘棋,像
第四盘这种复杂局面就没出现过,也可以说是狗狗“聪明”,提前就解消了复杂局面下
中盘打劫的隐患。不知道deepmind的团队能多大程度的解决这种问题,如果不能,当人
类和狗狗下了几千盘棋之后,或者deepmind团队公布了狗狗左右互搏的棋谱,这种隐患
迟早会被人们总结成规律出来的。 |
|
D*******r 发帖数: 2323 | 48 光是怪手不管用,还得这怪手成立或至少不亏。你布局阶段去一路连走几手是很怪,但
是漏算这样的怪手有咋了?
稍微聪明一点的时间分配算法可以在每次遇到搜索树清空的情况,都要加大搜索时间。
当然,这是在还没读秒的前提下。 |
|
D*******r 发帖数: 2323 | 49 不犯错包括更准确的计算和判断,大部分职业棋手的瓶颈不在手筋或者妙手漏算,而是
对取舍对方向的判断不准确。柯洁就说很多职业棋手的方向感都极差。
从准确判断形势,准确评估转换大小上来看,棋力还是属于智力范畴。不过智力也是运
动,区别于体育运动罢了,而且,即使是体育运动,有相当一部分也需要智力。
的, |
|
b*******8 发帖数: 37364 | 50 好吧,严格说如果狗是神,不存在突然增大,但有突然减少的情况,某方下错了。
不过狗也不是神,也有剪枝漏算的,所以也有下了一步狗突然发现胜率增大。 |
|