由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
USANews版 - 人机再战/柯洁对弈AlphaGo被看衰
相关主题
人机再战/怕柯洁惨败 央视直播喊停Linux官网被黑幕后:政治正确会毁了技术吗
中美人机大战第二盘究竟发生了什么今天google Alpahgo vs 李世石, 感兴趣的来加群
官宣:横扫人类围棋坛的Master就是AlphaGo哈哈, 我版讨论非法移民的一个帖在wechat传开了
电脑大战棋王 有一点永远做不到MO的选情比人机大战还紧张
围棋人机大战细则出炉 李世石最多拿到125万美元自由贸易这个事是这样
入主白宫14个月,特朗普越来越放飞自我Trump及其团队是真正的谋略家
芯片、OS、AI、5G,美国中国谁搞谁?TG把柯杰人机大战直播封了?
美再出手 管制14新科技出口 中国首当其衝真心搞不懂柯杰输棋为什么要哭?想当年米卡斯帕罗夫 (转载)
相关话题的讨论汇总
话题: alphago话题: 柯洁话题: 阿狗话题: 人机话题: 李世石
进入USANews版参与讨论
1 (共1页)
P****R
发帖数: 22479
1
中国棋手柯洁23日与AlphaGo对弈,图为柯洁在比赛中下第一步棋。(新华社)
谷歌(Google)人工智慧软体AlphaGo今天与中国围棋职业棋士柯洁对弈,外界对柯洁
普遍抱悲观预期。搜狐体育报导,在缠斗四个多小时之后,世界排名第一的柯洁执黑大
战AlphaGo,经过289手激斗,竭尽全力的柯洁仍难奈毫无波动的人工智能,以四分之一
子的最微小差距惜败。5月25日将进行柯洁对阵AlphaGo的第二局,先拿下二胜者胜利。
AlphaGo去年以四胜一败成绩击败南韩棋王李世石,柯洁曾透过微博放话,就算AlphaGo
战胜李世石,但「赢不了我」,这番话引起媒体与网友关注。今年的比赛23日至27日在
中国乌镇「围棋峰会」举行。柯洁在年初的网路测试上,输给AlphaGo的升级版「
Master」。
除一对一主赛事外,26日还有两场联手对决。一场是团队赛,由时越等中国五大围棋高
手组队,一对五围攻AlphaGo;另一场是配对赛,五大高手裡的古力、连笑,将分别与
AlphaGo搭档分组两队,彼此相互较量。
此次人机大战,三番棋获胜方奖金为150万美元,且不论胜负、出场费也高达30万美元
;在对抗时间上,也与第一季不同,当时李世石对AlphaGo的用时是每方二小时、一分
鐘读秒五次,此次则改採三小时的中国规则。
华商报报导,多数分析认为在三番棋对战中,柯洁战胜AlphaGo的可能性微乎其微,如
果只能赢一盘棋的话,赢棋的概率也只有10%。计算机专业的科学家李开復的观点更加
悲观,直言柯洁赢的概率几乎为零,「AlphaGo和李世石的人机大战是第一次,可能还
有悬念,但是现在进化的AlphaGo和柯洁的人机大战,不再拥有任何其他的可能。」
西安体院教授、围棋职业六段李星说,去年李世石与人工智能下棋,悬念是人类能不能
赢。此次柯洁与人工智能的比赛,关注点应该是柯洁怎麼输的。」「儘管我对柯洁赢棋
不敢抱希望,但也不想看到他不堪一击。如果柯洁的招法能迫使AlphaGo频繁陷入长时
间思考,最好还能坚持到最后惜败,我认为柯洁只要输得不窝囊,就算赢了。」
柯洁22日晚在微博发文「最后的对决」称:「决战前夕,感慨万千。无论输赢,这都将
是我与人工智慧最后的三盘对局。为什麼?我相信未来是属於人工智慧的。可它始终都
是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。」
柯洁在赛前最后一次接受媒体专访时表示:「会拚死一搏」。他说只想在决战中全力以
赴,「要下(棋)得精采,至少能给AlphaGo压力。」问他觉得AlphaGo是甚麼东西?他
笑说:「就是个变态。」
T**********e
发帖数: 29576
2
第一场据说机器赢他轻松,估计程序早设定好赢四分之一,给他面子,可以高呼比李世
石强
P****R
发帖数: 22479
3

一转眼一年又两个多月就过去了,阿狗刚刚赢得了与柯洁的第一局对弈的胜利
在赛后的新闻发布会上,从谷歌员工的口中亲耳得证了一年多以前的这个猜想
第一,谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练,从而在布局
与中盘阶段(这时候严格来说应该胜率起伏不是太大,因此胜率偏导落子的梯度较小)
,给阿狗以有意义的目标,避免丧失目标下臭棋。从整局的情况来看,我猜测阿狗这次
搞了两套模型,一套是这种multi-task的,用于布局与中盘,另一套是原来单一task的
,用于收官,因为这时候从策略上看,应该以求稳为主,而且梯度噪声的影响会比较小了
第二,谷歌声称这一代阿狗较上一代,计算量减小了一个数量级,也即10%,那么非常
直观地,可以较为肯定地猜测,阿狗2.0采用了MobileNets网络架构,从论文上看,也
基本上是正好运算量降一个数量级(Million Mult-Adds: 462->52.3, 4866->569)
第三,有记者提到了这个问题,但是估计是同传没有表达清楚,谷歌的回答有点文不对
题,就是这一代阿狗是不是完全靠左右互博训练出来的。猜测应该有那么一点意思,但
是还不够彻底。从谷歌的回答上,模模糊糊感觉value net的训练还是靠阿狗1.0的互博
至终盘的结果,因此理论上不能说已经完全脱离了最初用于训练的人类棋局的影响。另
一方面,从MobileNets方面来看,采取了一个比较重要的训练手段就是distillation,
那么阿狗2.0也很有可能是从阿狗1.0上蒸馏出来再进一步训练的。因此现阶段就说是从
零开始学围棋,可能还不是非常客观的
第四,谷歌提到这一代阿狗下棋,采用了10个TPU处理器。这个就不深究了,反正前几
天google I/O上也说了,估计英伟达老黄会感到菊花一紧吧
最后一句,去年跟一个叫pattern的兄弟谈到关于阿狗左右互博里牵涉到的
unsupervised learning的问题,看看这一年来火得发烫的各种GAN,也只能说当初我们
的想像力都还不够,哈哈

【在 T**********e 的大作中提到】
: 第一场据说机器赢他轻松,估计程序早设定好赢四分之一,给他面子,可以高呼比李世
: 石强

N*******M
发帖数: 3963
4
如果是我,我会先和AlphaGo进行一场水战,在游泳池里斗上30分钟再说。

AlphaGo

【在 P****R 的大作中提到】
: 转
: 一转眼一年又两个多月就过去了,阿狗刚刚赢得了与柯洁的第一局对弈的胜利
: 在赛后的新闻发布会上,从谷歌员工的口中亲耳得证了一年多以前的这个猜想
: 第一,谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练,从而在布局
: 与中盘阶段(这时候严格来说应该胜率起伏不是太大,因此胜率偏导落子的梯度较小)
: ,给阿狗以有意义的目标,避免丧失目标下臭棋。从整局的情况来看,我猜测阿狗这次
: 搞了两套模型,一套是这种multi-task的,用于布局与中盘,另一套是原来单一task的
: ,用于收官,因为这时候从策略上看,应该以求稳为主,而且梯度噪声的影响会比较小了
: 第二,谷歌声称这一代阿狗较上一代,计算量减小了一个数量级,也即10%,那么非常
: 直观地,可以较为肯定地猜测,阿狗2.0采用了MobileNets网络架构,从论文上看,也

1 (共1页)
进入USANews版参与讨论
相关主题
真心搞不懂柯杰输棋为什么要哭?想当年米卡斯帕罗夫 (转载)围棋人机大战细则出炉 李世石最多拿到125万美元
美国可能会在无人机上输给中国入主白宫14个月,特朗普越来越放飞自我
中国无人机入侵美国市场,为什么没有对手?芯片、OS、AI、5G,美国中国谁搞谁?
美国将研制可以一直飞不同补给的无人机美再出手 管制14新科技出口 中国首当其衝
人机再战/怕柯洁惨败 央视直播喊停Linux官网被黑幕后:政治正确会毁了技术吗
中美人机大战第二盘究竟发生了什么今天google Alpahgo vs 李世石, 感兴趣的来加群
官宣:横扫人类围棋坛的Master就是AlphaGo哈哈, 我版讨论非法移民的一个帖在wechat传开了
电脑大战棋王 有一点永远做不到MO的选情比人机大战还紧张
相关话题的讨论汇总
话题: alphago话题: 柯洁话题: 阿狗话题: 人机话题: 李世石