人机再战／柯洁对弈AlphaGo被看衰 - USANews版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

USANews版 - 人机再战／柯洁对弈AlphaGo被看衰

相关主题
● 人机再战／怕柯洁惨败央视直播喊停	● Linux官网被黑幕后:政治正确会毁了技术吗
● 中美人机大战第二盘究竟发生了什么	● 今天google Alpahgo vs 李世石，感兴趣的来加群
● 官宣：横扫人类围棋坛的Master就是AlphaGo	● 哈哈, 我版讨论非法移民的一个帖在wechat传开了
● 电脑大战棋王有一点永远做不到	● MO的选情比人机大战还紧张
● 围棋人机大战细则出炉李世石最多拿到125万美元	● 自由贸易这个事是这样
● 入主白宫14个月，特朗普越来越放飞自我	● Trump及其团队是真正的谋略家
● 芯片、OS、AI、5G，美国中国谁搞谁？	● TG把柯杰人机大战直播封了？
● 美再出手管制14新科技出口中国首当其衝	● 真心搞不懂柯杰输棋为什么要哭？想当年米卡斯帕罗夫 (转载)

相关话题的讨论汇总
话题: alphago话题: 柯洁话题: 阿狗话题: 人机话题: 李世石

进入USANews版参与讨论

1

(共1页)

P****R 发帖数: 22479	1 中国棋手柯洁23日与AlphaGo对弈，图为柯洁在比赛中下第一步棋。（新华社）谷歌（Google）人工智慧软体AlphaGo今天与中国围棋职业棋士柯洁对弈，外界对柯洁普遍抱悲观预期。搜狐体育报导，在缠斗四个多小时之后，世界排名第一的柯洁执黑大战AlphaGo，经过289手激斗，竭尽全力的柯洁仍难奈毫无波动的人工智能，以四分之一子的最微小差距惜败。5月25日将进行柯洁对阵AlphaGo的第二局，先拿下二胜者胜利。 AlphaGo去年以四胜一败成绩击败南韩棋王李世石，柯洁曾透过微博放话，就算AlphaGo 战胜李世石，但「赢不了我」，这番话引起媒体与网友关注。今年的比赛23日至27日在中国乌镇「围棋峰会」举行。柯洁在年初的网路测试上，输给AlphaGo的升级版「 Master」。除一对一主赛事外，26日还有两场联手对决。一场是团队赛，由时越等中国五大围棋高手组队，一对五围攻AlphaGo；另一场是配对赛，五大高手裡的古力、连笑，将分别与 AlphaGo搭档分组两队，彼此相互较量。此次人机大战，三番棋获胜方奖金为150万美元，且不论胜负、出场费也高达30万美元；在对抗时间上，也与第一季不同，当时李世石对AlphaGo的用时是每方二小时、一分鐘读秒五次，此次则改採三小时的中国规则。华商报报导，多数分析认为在三番棋对战中，柯洁战胜AlphaGo的可能性微乎其微，如果只能赢一盘棋的话，赢棋的概率也只有10%。计算机专业的科学家李开復的观点更加悲观，直言柯洁赢的概率几乎为零，「AlphaGo和李世石的人机大战是第一次，可能还有悬念，但是现在进化的AlphaGo和柯洁的人机大战，不再拥有任何其他的可能。」西安体院教授、围棋职业六段李星说，去年李世石与人工智能下棋，悬念是人类能不能赢。此次柯洁与人工智能的比赛，关注点应该是柯洁怎麼输的。」「儘管我对柯洁赢棋不敢抱希望，但也不想看到他不堪一击。如果柯洁的招法能迫使AlphaGo频繁陷入长时间思考，最好还能坚持到最后惜败，我认为柯洁只要输得不窝囊，就算赢了。」柯洁22日晚在微博发文「最后的对决」称：「决战前夕，感慨万千。无论输赢，这都将是我与人工智慧最后的三盘对局。为什麼？我相信未来是属於人工智慧的。可它始终都是冷冰冰的机器，与人类相比，我感觉不到它对围棋的热情和热爱。」柯洁在赛前最后一次接受媒体专访时表示：「会拚死一搏」。他说只想在决战中全力以赴，「要下（棋）得精采，至少能给AlphaGo压力。」问他觉得AlphaGo是甚麼东西？他笑说：「就是个变态。」
T**********e 发帖数: 29576	2 第一场据说机器赢他轻松，估计程序早设定好赢四分之一，给他面子，可以高呼比李世石强
P****R 发帖数: 22479	3 转一转眼一年又两个多月就过去了，阿狗刚刚赢得了与柯洁的第一局对弈的胜利在赛后的新闻发布会上，从谷歌员工的口中亲耳得证了一年多以前的这个猜想第一，谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练，从而在布局与中盘阶段（这时候严格来说应该胜率起伏不是太大，因此胜率偏导落子的梯度较小），给阿狗以有意义的目标，避免丧失目标下臭棋。从整局的情况来看，我猜测阿狗这次搞了两套模型，一套是这种multi-task的，用于布局与中盘，另一套是原来单一task的，用于收官，因为这时候从策略上看，应该以求稳为主，而且梯度噪声的影响会比较小了第二，谷歌声称这一代阿狗较上一代，计算量减小了一个数量级，也即10%，那么非常直观地，可以较为肯定地猜测，阿狗2.0采用了MobileNets网络架构，从论文上看，也基本上是正好运算量降一个数量级（Million Mult-Adds: 462->52.3, 4866->569）第三，有记者提到了这个问题，但是估计是同传没有表达清楚，谷歌的回答有点文不对题，就是这一代阿狗是不是完全靠左右互博训练出来的。猜测应该有那么一点意思，但是还不够彻底。从谷歌的回答上，模模糊糊感觉value net的训练还是靠阿狗1.0的互博至终盘的结果，因此理论上不能说已经完全脱离了最初用于训练的人类棋局的影响。另一方面，从MobileNets方面来看，采取了一个比较重要的训练手段就是distillation，那么阿狗2.0也很有可能是从阿狗1.0上蒸馏出来再进一步训练的。因此现阶段就说是从零开始学围棋，可能还不是非常客观的第四，谷歌提到这一代阿狗下棋，采用了10个TPU处理器。这个就不深究了，反正前几天google I/O上也说了，估计英伟达老黄会感到菊花一紧吧最后一句，去年跟一个叫pattern的兄弟谈到关于阿狗左右互博里牵涉到的 unsupervised learning的问题，看看这一年来火得发烫的各种GAN，也只能说当初我们的想像力都还不够，哈哈【在 T**********e 的大作中提到】 : 第一场据说机器赢他轻松，估计程序早设定好赢四分之一，给他面子，可以高呼比李世 : 石强
N*******M 发帖数: 3963	4 如果是我，我会先和AlphaGo进行一场水战，在游泳池里斗上30分钟再说。 AlphaGo 【在 P****R 的大作中提到】 : 转 : 一转眼一年又两个多月就过去了，阿狗刚刚赢得了与柯洁的第一局对弈的胜利 : 在赛后的新闻发布会上，从谷歌员工的口中亲耳得证了一年多以前的这个猜想 : 第一，谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练，从而在布局 : 与中盘阶段（这时候严格来说应该胜率起伏不是太大，因此胜率偏导落子的梯度较小） : ，给阿狗以有意义的目标，避免丧失目标下臭棋。从整局的情况来看，我猜测阿狗这次 : 搞了两套模型，一套是这种multi-task的，用于布局与中盘，另一套是原来单一task的 : ，用于收官，因为这时候从策略上看，应该以求稳为主，而且梯度噪声的影响会比较小了 : 第二，谷歌声称这一代阿狗较上一代，计算量减小了一个数量级，也即10%，那么非常 : 直观地，可以较为肯定地猜测，阿狗2.0采用了MobileNets网络架构，从论文上看，也

1

(共1页)

进入USANews版参与讨论

相关主题
● 真心搞不懂柯杰输棋为什么要哭？想当年米卡斯帕罗夫 (转载)	● 围棋人机大战细则出炉李世石最多拿到125万美元
● 美国可能会在无人机上输给中国	● 入主白宫14个月，特朗普越来越放飞自我
● 中国无人机入侵美国市场，为什么没有对手？	● 芯片、OS、AI、5G，美国中国谁搞谁？
● 美国将研制可以一直飞不同补给的无人机	● 美再出手管制14新科技出口中国首当其衝
● 人机再战／怕柯洁惨败央视直播喊停	● Linux官网被黑幕后:政治正确会毁了技术吗
● 中美人机大战第二盘究竟发生了什么	● 今天google Alpahgo vs 李世石，感兴趣的来加群
● 官宣：横扫人类围棋坛的Master就是AlphaGo	● 哈哈, 我版讨论非法移民的一个帖在wechat传开了
● 电脑大战棋王有一点永远做不到	● MO的选情比人机大战还紧张

相关话题的讨论汇总
话题: alphago话题: 柯洁话题: 阿狗话题: 人机话题: 李世石

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)