原来阿尔法下的是５秒版的ＺＥＮ - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 原来阿尔法下的是５秒版的ＺＥＮ

相关主题
● 神经网络的结构决定了他的极限	● AlphaGo的算法等技术分析
● AlphaGo通俗的解释	● 技术贴（懂围棋的请进）
● 看大家讨论中比较少提这个 reinforcement learning	● 猜一下几个AlphaGo崩了的原因
● 大家对Alphago的胜率理解有误	● zt【FACEBOOK 围棋软件专家田渊栋博士对第四盘分析】
● 金明完9段点评AlphaGo: 缺点明显	● 我现在敢80%肯定alpha go 搞不定小李的模仿棋
● 阿法狗生怕人类还不够绝望	● 现在回头再看第4局
● 哈萨比斯又给出新消息	● 罗洗河让AlphaGo四子的说法没有什么错
● 田渊栋【facebook 围棋程序负责人】：我怎么看 AlphaGo？	● 围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法

相关话题的讨论汇总
话题: zen话题: mct话题: dcnn话题: alphago话题: mcts

进入Go版参与讨论

(共1页)

s*****V
发帖数: 21731

不带这么赖皮吧，５秒版的罗洗河可以让９个．

O**l
发帖数: 12923

阿尔法自己也是5秒
[在 saturnV (土星五号) 的大作中提到：]
：不带这么赖皮吧，５秒版的罗洗河可以让９个．

n******n
发帖数: 12088

罗洗河的电脑太烂

【在 s*****V 的大作中提到】

: 不带这么赖皮吧，５秒版的罗洗河可以让９个．

s*****V
发帖数: 21731

让我们来读另外一段话，
"In the past six months we've built an AI that can make moves in as fast as
0.1 seconds and still be as good as previous systems that took years to
build," wrote CEO Mark Zuckerberg.

【在 O**l 的大作中提到】

: 阿尔法自己也是5秒
: [在 saturnV (土星五号) 的大作中提到：]
: ：不带这么赖皮吧，５秒版的罗洗河可以让９个．

O**l
发帖数: 12923

so 说明什么扎克伯格有机会和alpha比吗搞笑
而且这只能说明df大概和zen水平差不多
alphago 同样时间下99.8%
这智商 lol

as

【在 s*****V 的大作中提到】

: 让我们来读另外一段话，
: "In the past six months we've built an AI that can make moves in as fast as
: 0.1 seconds and still be as good as previous systems that took years to
: build," wrote CEO Mark Zuckerberg.

s*****V
发帖数: 21731

你这智商真是费劲啊．ＤＦ的算法跟阿尔法比较类似，可见这类算法的优势十比较快
，所以用５秒对他们来说不是瓶颈，但是对ＺＥＮ这些来说却约束了大部分性能．这十
谷歌春秋笔法的地方，普通的人不熟悉这些背景的话根本看不出猫腻．

【在 O**l 的大作中提到】

: so 说明什么扎克伯格有机会和alpha比吗搞笑
: 而且这只能说明df大概和zen水平差不多
: alphago 同样时间下99.8%
: 这智商 lol
:
: as

O**l
发帖数: 12923

你这即不动围棋又不懂算法的傻货我跟你说了多少遍两个完全不同
FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
GOOG 没有公布具体细节但是他说了他还有一个value CNN
他没有完全依赖monte-carlo simulation的结果来update UCB 来决定tree的生长
两者区别大了去了
传统MCT根本没有评估函数
你如果说fb goog算法类似那zen和它们两的算也类似
zen是heuristic prune+MCT
你这傻货这些有半点明白是怎么回事吗在这扯屁啊赶快泡菌斑去吧
你这智商不适合在这

【在 s*****V 的大作中提到】

: 你这智商真是费劲啊．ＤＦ的算法跟阿尔法比较类似，可见这类算法的优势十比较快
: ，所以用５秒对他们来说不是瓶颈，但是对ＺＥＮ这些来说却约束了大部分性能．这十
: 谷歌春秋笔法的地方，普通的人不熟悉这些背景的话根本看不出猫腻．

s*****V
发帖数: 21731

你装个鸡巴，你也不是这领域的专家，你也不知道谷歌是怎么做的，大家都是凭有限信
息做合理推测．反正５秒的ＺＥＮ是猴版这个是既定事实．

【在 O**l 的大作中提到】

: 你这即不动围棋又不懂算法的傻货我跟你说了多少遍两个完全不同
: FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
: GOOG 没有公布具体细节但是他说了他还有一个value CNN
: 他没有完全依赖monte-carlo simulation的结果来update UCB 来决定tree的生长
: 两者区别大了去了
: 传统MCT根本没有评估函数
: 你如果说fb goog算法类似那zen和它们两的算也类似
: zen是heuristic prune+MCT
: 你这傻货这些有半点明白是怎么回事吗在这扯屁啊赶快泡菌斑去吧
: 你这智商不适合在这

O**l
发帖数: 12923

搞笑傻粪又开始死撑了 alphago自己也是用5秒有啥不公平
难度要zen 1个小时alphago 5秒？笑死
我是不是砖家跟你半毛钱关系都没有
你既不知道MCT UCB RL是怎么回事又不知道deep learning, cnn 怎么回事
你这智商估计连围棋都不会下就敢在这乱喷一些让人笑掉大牙的东西
goog虽然没有细节但是policy cnn+value cnn+MCT 人家说得很清楚
当然你估计一头雾水啥都搞不清
你这傻货估计连minimax tree framework都不知道是咋回事
还是回菌斑那智商适合你

【在 s*****V 的大作中提到】

: 你装个鸡巴，你也不是这领域的专家，你也不知道谷歌是怎么做的，大家都是凭有限信
: 息做合理推测．反正５秒的ＺＥＮ是猴版这个是既定事实．

s*****V
发帖数: 21731

谷歌这个组的人对ＺＥＮ的缺点难道不门清么．　如果要公平竞争的话，３０秒对３０
秒就行了．如果要证明他们的程序牛ｂ，为啥不公布长考版３０秒的ＺＥＮ对局结果，
这样也会让人更信服．
你这条疯狗，刚刚还说不知道细节，现在又说的很清楚了．你能保证谷歌的算法不是和
脸书算法一样有时间优势么？

【在 O**l 的大作中提到】

: 搞笑傻粪又开始死撑了 alphago自己也是用5秒有啥不公平
: 难度要zen 1个小时alphago 5秒？笑死
: 我是不是砖家跟你半毛钱关系都没有
: 你既不知道MCT UCB RL是怎么回事又不知道deep learning, cnn 怎么回事
: 你这智商估计连围棋都不会下就敢在这乱喷一些让人笑掉大牙的东西
: goog虽然没有细节但是policy cnn+value cnn+MCT 人家说得很清楚
: 当然你估计一头雾水啥都搞不清
: 你这傻货估计连minimax tree framework都不知道是咋回事
: 还是回菌斑那智商适合你

相关主题
● 阿法狗生怕人类还不够绝望	● AlphaGo的算法等技术分析
● 哈萨比斯又给出新消息	● 技术贴（懂围棋的请进）
● 田渊栋【facebook 围棋程序负责人】：我怎么看 AlphaGo？	● 猜一下几个AlphaGo崩了的原因
进入Go版参与讨论

O**l
发帖数: 12923

傻粪一点干货都没有开始抠字眼了
我是说细节不清楚
但是策略是policy cnn + value cnn + MCT 是人家白纸黑字写着的
fb的策略是policy cnn + MCT这是他家自己爆的
对了你能跟我说说这算法有啥时间优势不扎克伯格一句话笑死？
就是FB新算法最后怎么走不是一样用MCT？
alphago人家常长考版赢了职业二段然后用机器对战成绩证明一下快棋能力有什么不
妥？
什么不懂得傻粪还喜欢瞎喷才是真疯狗不过你还是个弱智版疯狗

【在 s*****V 的大作中提到】

: 谷歌这个组的人对ＺＥＮ的缺点难道不门清么．　如果要公平竞争的话，３０秒对３０
: 秒就行了．如果要证明他们的程序牛ｂ，为啥不公布长考版３０秒的ＺＥＮ对局结果，
: 这样也会让人更信服．
: 你这条疯狗，刚刚还说不知道细节，现在又说的很清楚了．你能保证谷歌的算法不是和
: 脸书算法一样有时间优势么？

a******0
发帖数: 121

学术界数据筛选（data cherry picking)、只选择性地出示最佳案例（best case
scenario)的事是很常见的。
我猜想谷歌选择5秒限时，是因为要赢 Zen 4个让先；武宫9段4子让先输给了 Zen。

【在 s*****V 的大作中提到】

D*******r
发帖数: 2323

感觉谷歌现阶段隐瞒了很多数据，如果从评测棋力的测试来讲，他们不可能只测5秒限
时。
而且，阿尔法的短时表现确实比较弱一些，和樊麾还有5盘非正式比赛，没有自由支配
时间，直接就是30秒读秒。阿尔法赢3输2。

【在 a******0 的大作中提到】

: 学术界数据筛选（data cherry picking)、只选择性地出示最佳案例（best case
: scenario)的事是很常见的。
: 我猜想谷歌选择5秒限时，是因为要赢 Zen 4个让先；武宫9段4子让先输给了 Zen。

O**l
发帖数: 12923

alpha讲白了最终还是MCT
还是需要大量simulation 来评估UCB 需要时间

【在 D*******r 的大作中提到】

: 感觉谷歌现阶段隐瞒了很多数据，如果从评测棋力的测试来讲，他们不可能只测5秒限
: 时。
: 而且，阿尔法的短时表现确实比较弱一些，和樊麾还有5盘非正式比赛，没有自由支配
: 时间，直接就是30秒读秒。阿尔法赢3输2。

x**8
发帖数: 1939

虽然都是5秒，zen有几个cpu，alphaGo有几个？

【在 O**l 的大作中提到】

n******8
发帖数: 172

exactly.

【在 x**8 的大作中提到】

: 虽然都是5秒，zen有几个cpu，alphaGo有几个？

O**l
发帖数: 12923

crazystone是32核
而且又不是分先下是4子下

【在 x**8 的大作中提到】

: 虽然都是5秒，zen有几个cpu，alphaGo有几个？

x**8
发帖数: 1939

我问zen有几个，你告诉我crazystone干啥？

【在 O**l 的大作中提到】

: crazystone是32核
: 而且又不是分先下是4子下

w****i
发帖数: 964

No, darkfores1 does not have a MCT component, it plays instantly.

【在 O**l 的大作中提到】

O**l
发帖数: 12923

这是FB论文里自己说的
From the experiments, we clearly show that DCNN is tactically weak due to
the lack of search.
Search is a way to explore the solution space conditioned on the current
board situation, and build
a non-parametric local model for the game. The local model is more flexible
than the global model
learned from massive training data and more adapted to the current situation
. The state-of-the-art
approach in computer Go is Monte-Carlo Tree Search (MCTS). Fig. 4 shows its
basic principle.
Combining DCNN with MCTS requires nontrivial engineering efforts because
each rollout of MCTS
is way much faster than DCNN evaluation. Therefore, these two must run in
parallel with frequent
communications. Our basic implementation of MCTS gives 16k rollouts per
second (for 16 threads
on a machine with Intel Xeon CPU E5-2680 v2 at 2.80GHz) while it typically
takes 0.2s for DCNN
to give board evaluations of a batch size of 128 with 4 GPUs.
http://arxiv.org/pdf/1511.06410v2.pdf
不用MCT开什么玩笑
对杀时候气都不算了靠DCNN?

【在 w****i 的大作中提到】

:
: No, darkfores1 does not have a MCT component, it plays instantly.

相关主题
● zt【FACEBOOK 围棋软件专家田渊栋博士对第四盘分析】	● 罗洗河让AlphaGo四子的说法没有什么错
● 我现在敢80%肯定alpha go 搞不定小李的模仿棋	● 围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法
● 现在回头再看第4局	● 蒙特卡罗是不是有天生缺陷？
进入Go版参与讨论

O**l
发帖数: 12923

zen 是8个核
zen和crazystone水平差不多
和alphago 同样5秒下让4字 30%左右胜率

【在 x**8 的大作中提到】

: 我问zen有几个，你告诉我crazystone干啥？

w****i
发帖数: 964

You apparently didn't look at the paper carefully. I can imagine that when
you just heard of this paper maybe 10 minutes ago. darkforest/darkfores1/
darkfores2 is pure DCNN bot, and darkfores2 reaches stable kgs 3d, DCNN+MCT
is darkfmcts3
Their Abstract:
"""
Darkforest substantially improves the win rate for patternmatching
approaches against MCTS-based approaches, even with looser search
budgets. Against human players, the newest versions, darkfores2, achieve a
stable
3d level on KGS Go Server as a ranked bot, a substantial improvement upon
the estimated 4k-5k ranks for DCNN reported in Clark & Storkey (2015) based
on games against other machine players. Adding MCTS to darkfores2 creates a
much stronger player named darkfmcts3: with 5000 rollouts, it beats Pachi
with
10k rollouts in all 250 games; with 75k rollouts it achieves a stable 5d
level in
KGS server, on par with state-of-the-art Go AIs (e.g., Zen, DolBaram,
CrazyStone);
with 110k rollouts, it won the 3rd place in January KGS Go Tournament.
"""

flexible
situation
its

【在 O**l 的大作中提到】

: 这是FB论文里自己说的
: From the experiments, we clearly show that DCNN is tactically weak due to
: the lack of search.
: Search is a way to explore the solution space conditioned on the current
: board situation, and build
: a non-parametric local model for the game. The local model is more flexible
: than the global model
: learned from massive training data and more adapted to the current situation
: . The state-of-the-art
: approach in computer Go is Monte-Carlo Tree Search (MCTS). Fig. 4 shows its

x**8
发帖数: 1939

8核估计和quad i7+hyper thread没啥本质差别吧？
这配置基本就家里都有吧，zen在这配置下5秒的水平很差，
alphaGo 48cpu+8Gpu
distributed alphaGo 1202cpu+176Gpu
这种神配置跟zen 8核下5秒，其他评论我不想多说，不过这让我对李世石多了一分信心，

【在 O**l 的大作中提到】

: zen 是8个核
: zen和crazystone水平差不多
: 和alphago 同样5秒下让4字 30%左右胜率

O**l
发帖数: 12923

问题在于他自己也是5秒
时间提上去zen提高他也提高最后都是MCT

心，

【在 x**8 的大作中提到】

: 8核估计和quad i7+hyper thread没啥本质差别吧？
: 这配置基本就家里都有吧，zen在这配置下5秒的水平很差，
: alphaGo 48cpu+8Gpu
: distributed alphaGo 1202cpu+176Gpu
: 这种神配置跟zen 8核下5秒，其他评论我不想多说，不过这让我对李世石多了一分信心，

x**8
发帖数: 1939

一千个核的5秒和8核的5秒能一样么，
zen 8核5秒时候，算法还没有converge，强行中断跳出来的只是个局部的次优解，并没
有发挥出zen的真实水平，
zen 8核5秒类似于柯杰下 0.1秒，

【在 O**l 的大作中提到】

: 问题在于他自己也是5秒
: 时间提上去zen提高他也提高最后都是MCT
:
: 心，

O**l
发帖数: 12923

19*19 5秒两个都没converge

【在 x**8 的大作中提到】

: 一千个核的5秒和8核的5秒能一样么，
: zen 8核5秒时候，算法还没有converge，强行中断跳出来的只是个局部的次优解，并没
: 有发挥出zen的真实水平，
: zen 8核5秒类似于柯杰下 0.1秒，

x**8
发帖数: 1939

你是狗家派来的？
已经不fair了你，
irrational

【在 O**l 的大作中提到】

: 19*19 5秒两个都没converge

O**l
发帖数: 12923

我是说事实
19*19 5秒收官前多少核都没法converge

【在 x**8 的大作中提到】

: 你是狗家派来的？
: 已经不fair了你，
: irrational

x**8
发帖数: 1939

那一千个核和8核能一样吗？
zen在没converge时候水平很差，
alphaGo用一千个核跟zen 8核性能差的时候比，这个还用多说么？
这板上差不多都玩过zen，对zen 5秒和60秒的水平差距都有切身感受，
对这个你不用过多argue了，没用的，

【在 O**l 的大作中提到】

: 我是说事实
: 19*19 5秒收官前多少核都没法converge

O**l
发帖数: 12923

alphago 也是性能差的时候和zen性能差的时候比
alphago又没用1个小时

【在 x**8 的大作中提到】

: 那一千个核和8核能一样吗？
: zen在没converge时候水平很差，
: alphaGo用一千个核跟zen 8核性能差的时候比，这个还用多说么？
: 这板上差不多都玩过zen，对zen 5秒和60秒的水平差距都有切身感受，
: 对这个你不用过多argue了，没用的，

相关主题
● 推荐个免费的人工智能软件 Pachi	● AlphaGo通俗的解释
● 从第四盘棋看狗狗的弱点	● 看大家讨论中比较少提这个 reinforcement learning
● 神经网络的结构决定了他的极限	● 大家对Alphago的胜率理解有误
进入Go版参与讨论

x**8
发帖数: 1939

给zen一千个核，估计5秒就收敛完了，
总之这不是个公平的比试，板上除了你都看得到，我不在就此问题和你争论了，

【在 O**l 的大作中提到】

: alphago 也是性能差的时候和zen性能差的时候比
: alphago又没用1个小时

s*****V
发帖数: 21731

你到底懂不懂啊，ａｌｐｈａＧＯ这种算法的即使不做ＳＥＡＲＣＨ，也能走出比较合
理的对策，这个大概只需要0.1s的时间．ＤＦ１／２就是这么干的．而且ＳＥＡＲＣＨ
的时候，用ＣＮＮ的帮助选择ＴＯＰ　ＭＯＶＥＳ，可以搜索地更快．

【在 O**l 的大作中提到】

: alphago 也是性能差的时候和zen性能差的时候比
: alphago又没用1个小时

O**l
发帖数: 12923

你先说说CNN 是啥
怎么auto encoder. 怎么soft max.
什么时候supervise 什么时候unsupervised .
CNN和普通Dl比优势在哪
搞笑这种不学无术的傻粪听了几个名词也来跟我说这个

【在 s*****V 的大作中提到】

: 你到底懂不懂啊，ａｌｐｈａＧＯ这种算法的即使不做ＳＥＡＲＣＨ，也能走出比较合
: 理的对策，这个大概只需要0.1s的时间．ＤＦ１／２就是这么干的．而且ＳＥＡＲＣＨ
: 的时候，用ＣＮＮ的帮助选择ＴＯＰ　ＭＯＶＥＳ，可以搜索地更快．

r****y
发帖数: 26819

是啊，没懂，又不是参加做alphaGo的，在这版上刷屏求ego图啥。。。

【在 x**8 的大作中提到】

: 给zen一千个核，估计5秒就收敛完了，
: 总之这不是个公平的比试，板上除了你都看得到，我不在就此问题和你争论了，

S**C
发帖数: 2964

You are making implicit assumption that strength ratio between zen and
alphago at 5 seconds is equal to at, say, 5 minutes. It is not substantiated.

【在 O**l 的大作中提到】

: 问题在于他自己也是5秒
: 时间提上去zen提高他也提高最后都是MCT
:
: 心，

m*****n
发帖数: 3644

配置差这么多？！！！

心，

【在 x**8 的大作中提到】

(共1页)

进入Go版参与讨论

相关主题
● 围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法	● 金明完9段点评AlphaGo: 缺点明显
● 蒙特卡罗是不是有天生缺陷？	● 阿法狗生怕人类还不够绝望
● 推荐个免费的人工智能软件 Pachi	● 哈萨比斯又给出新消息
● 从第四盘棋看狗狗的弱点	● 田渊栋【facebook 围棋程序负责人】：我怎么看 AlphaGo？
● 神经网络的结构决定了他的极限	● AlphaGo的算法等技术分析
● AlphaGo通俗的解释	● 技术贴（懂围棋的请进）
● 看大家讨论中比较少提这个 reinforcement learning	● 猜一下几个AlphaGo崩了的原因
● 大家对Alphago的胜率理解有误	● zt【FACEBOOK 围棋软件专家田渊栋博士对第四盘分析】

相关话题的讨论汇总
话题: zen话题: mct话题: dcnn话题: alphago话题: mcts

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天