由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 原来阿尔法下的是5秒版的ZEN
相关主题
神经网络的结构决定了他的极限AlphaGo的算法等技术分析
AlphaGo通俗的解释技术贴(懂围棋的请进)
看大家讨论中比较少提这个 reinforcement learning猜一下几个AlphaGo崩了的原因
大家对Alphago的胜率理解有误zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
金明完9段点评AlphaGo: 缺点明显我现在敢80%肯定alpha go 搞不定小李的模仿棋
阿法狗生怕人类还不够绝望现在回头再看第4局
哈萨比斯又给出新消息罗洗河让AlphaGo四子的说法没有什么错
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法
相关话题的讨论汇总
话题: zen话题: mct话题: dcnn话题: alphago话题: mcts
进入Go版参与讨论
1 (共1页)
s*****V
发帖数: 21731
1
不带这么赖皮吧,5秒版的罗洗河可以让9个.
O**l
发帖数: 12923
2
阿尔法自己也是5秒
[在 saturnV (土星五号) 的大作中提到:]
:不带这么赖皮吧,5秒版的罗洗河可以让9个.
n******n
发帖数: 12088
3
罗洗河的电脑太烂

【在 s*****V 的大作中提到】
: 不带这么赖皮吧,5秒版的罗洗河可以让9个.
s*****V
发帖数: 21731
4
让我们来读另外一段话,
"In the past six months we've built an AI that can make moves in as fast as
0.1 seconds and still be as good as previous systems that took years to
build," wrote CEO Mark Zuckerberg.

【在 O**l 的大作中提到】
: 阿尔法自己也是5秒
: [在 saturnV (土星五号) 的大作中提到:]
: :不带这么赖皮吧,5秒版的罗洗河可以让9个.

O**l
发帖数: 12923
5
so 说明什么 扎克伯格有机会和alpha比吗 搞笑
而且这只能说明df大概和zen水平差不多
alphago 同样时间下99.8%
这智商 lol

as

【在 s*****V 的大作中提到】
: 让我们来读另外一段话,
: "In the past six months we've built an AI that can make moves in as fast as
: 0.1 seconds and still be as good as previous systems that took years to
: build," wrote CEO Mark Zuckerberg.

s*****V
发帖数: 21731
6
你这智商真是费劲啊.DF的算法跟阿尔法比较类似, 可见这类算法的优势十比较快
,所以用5秒对他们来说不是瓶颈,但是对ZEN这些来说却约束了大部分性能.这十
谷歌春秋笔法的地方,普通的人不熟悉这些背景的话根本看不出猫腻.

【在 O**l 的大作中提到】
: so 说明什么 扎克伯格有机会和alpha比吗 搞笑
: 而且这只能说明df大概和zen水平差不多
: alphago 同样时间下99.8%
: 这智商 lol
:
: as

O**l
发帖数: 12923
7
你这即不动围棋又不懂算法的傻货我跟你说了多少遍 两个完全不同
FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
GOOG 没有公布具体细节 但是他说了他还有一个value CNN
他没有完全依赖monte-carlo simulation的结果来update UCB 来决定tree的生长
两者区别大了去了
传统MCT根本没有评估函数
你如果说fb goog算法类似那zen和它们两的算也类似
zen是heuristic prune+MCT
你这傻货 这些有半点明白是怎么回事吗 在这扯屁啊 赶快泡菌斑去吧
你这智商不适合在这

【在 s*****V 的大作中提到】
: 你这智商真是费劲啊.DF的算法跟阿尔法比较类似, 可见这类算法的优势十比较快
: ,所以用5秒对他们来说不是瓶颈,但是对ZEN这些来说却约束了大部分性能.这十
: 谷歌春秋笔法的地方,普通的人不熟悉这些背景的话根本看不出猫腻.

s*****V
发帖数: 21731
8
你装个鸡巴,你也不是这领域的专家,你也不知道谷歌是怎么做的,大家都是凭有限信
息做合理推测.反正5秒的ZEN是猴版这个是既定事实.

【在 O**l 的大作中提到】
: 你这即不动围棋又不懂算法的傻货我跟你说了多少遍 两个完全不同
: FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
: GOOG 没有公布具体细节 但是他说了他还有一个value CNN
: 他没有完全依赖monte-carlo simulation的结果来update UCB 来决定tree的生长
: 两者区别大了去了
: 传统MCT根本没有评估函数
: 你如果说fb goog算法类似那zen和它们两的算也类似
: zen是heuristic prune+MCT
: 你这傻货 这些有半点明白是怎么回事吗 在这扯屁啊 赶快泡菌斑去吧
: 你这智商不适合在这

O**l
发帖数: 12923
9
搞笑 傻粪又开始死撑了 alphago自己也是用5秒 有啥不公平
难度要zen 1个小时alphago 5秒? 笑死
我是不是砖家跟你半毛钱关系都没有
你既不知道MCT UCB RL是怎么回事 又不知道deep learning, cnn 怎么回事
你这智商估计连围棋都不会下 就敢在这乱喷一些让人笑掉大牙的东西
goog虽然没有细节但是policy cnn+value cnn+MCT 人家说得很清楚
当然你估计一头雾水 啥都搞不清
你这傻货估计连minimax tree framework都不知道是咋回事
还是回菌斑 那智商适合你

【在 s*****V 的大作中提到】
: 你装个鸡巴,你也不是这领域的专家,你也不知道谷歌是怎么做的,大家都是凭有限信
: 息做合理推测.反正5秒的ZEN是猴版这个是既定事实.

s*****V
发帖数: 21731
10
谷歌这个组的人对ZEN的缺点难道不门清么. 如果要公平竞争的话,30秒对30
秒就行了.如果要证明他们的程序牛b,为啥不公布长考版30秒的ZEN对局结果,
这样也会让人更信服.
你这条疯狗,刚刚还说不知道细节,现在又说的很清楚了.你能保证谷歌的算法不是和
脸书算法一样有时间优势么?

【在 O**l 的大作中提到】
: 搞笑 傻粪又开始死撑了 alphago自己也是用5秒 有啥不公平
: 难度要zen 1个小时alphago 5秒? 笑死
: 我是不是砖家跟你半毛钱关系都没有
: 你既不知道MCT UCB RL是怎么回事 又不知道deep learning, cnn 怎么回事
: 你这智商估计连围棋都不会下 就敢在这乱喷一些让人笑掉大牙的东西
: goog虽然没有细节但是policy cnn+value cnn+MCT 人家说得很清楚
: 当然你估计一头雾水 啥都搞不清
: 你这傻货估计连minimax tree framework都不知道是咋回事
: 还是回菌斑 那智商适合你

相关主题
阿法狗生怕人类还不够绝望AlphaGo的算法等技术分析
哈萨比斯又给出新消息技术贴(懂围棋的请进)
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?猜一下几个AlphaGo崩了的原因
进入Go版参与讨论
O**l
发帖数: 12923
11
傻粪一点干货都没有 开始抠字眼了
我是说细节不清楚
但是策略是policy cnn + value cnn + MCT 是人家白纸黑字写着的
fb的策略是policy cnn + MCT这是他家自己爆的
对了你能跟我说说这算法有啥时间优势不 扎克伯格一句话 笑死?
就是FB新算法最后怎么走不是一样用MCT?
alphago人家常长考版赢了职业二段 然后用机器对战成绩证明一下快棋能力 有什么不
妥?
什么不懂得傻粪还喜欢瞎喷 才是真疯狗 不过你还是个弱智版疯狗

【在 s*****V 的大作中提到】
: 谷歌这个组的人对ZEN的缺点难道不门清么. 如果要公平竞争的话,30秒对30
: 秒就行了.如果要证明他们的程序牛b,为啥不公布长考版30秒的ZEN对局结果,
: 这样也会让人更信服.
: 你这条疯狗,刚刚还说不知道细节,现在又说的很清楚了.你能保证谷歌的算法不是和
: 脸书算法一样有时间优势么?

a******0
发帖数: 121
12
学术界数据筛选(data cherry picking)、只选择性地出示最佳案例(best case
scenario)的事是很常见的。
我猜想谷歌选择5秒限时,是因为要赢 Zen 4个让先;武宫9段4子让先输给了 Zen。

【在 s*****V 的大作中提到】
: 谷歌这个组的人对ZEN的缺点难道不门清么. 如果要公平竞争的话,30秒对30
: 秒就行了.如果要证明他们的程序牛b,为啥不公布长考版30秒的ZEN对局结果,
: 这样也会让人更信服.
: 你这条疯狗,刚刚还说不知道细节,现在又说的很清楚了.你能保证谷歌的算法不是和
: 脸书算法一样有时间优势么?

D*******r
发帖数: 2323
13
感觉谷歌现阶段隐瞒了很多数据,如果从评测棋力的测试来讲,他们不可能只测5秒限
时。
而且,阿尔法的短时表现确实比较弱一些,和樊麾还有5盘非正式比赛,没有自由支配
时间,直接就是30秒读秒。阿尔法赢3输2。

【在 a******0 的大作中提到】
: 学术界数据筛选(data cherry picking)、只选择性地出示最佳案例(best case
: scenario)的事是很常见的。
: 我猜想谷歌选择5秒限时,是因为要赢 Zen 4个让先;武宫9段4子让先输给了 Zen。

O**l
发帖数: 12923
14
alpha讲白了最终还是MCT
还是需要大量simulation 来评估UCB 需要时间

【在 D*******r 的大作中提到】
: 感觉谷歌现阶段隐瞒了很多数据,如果从评测棋力的测试来讲,他们不可能只测5秒限
: 时。
: 而且,阿尔法的短时表现确实比较弱一些,和樊麾还有5盘非正式比赛,没有自由支配
: 时间,直接就是30秒读秒。阿尔法赢3输2。

x**8
发帖数: 1939
15
虽然都是5秒,zen有几个cpu,alphaGo有几个?

【在 O**l 的大作中提到】
: 搞笑 傻粪又开始死撑了 alphago自己也是用5秒 有啥不公平
: 难度要zen 1个小时alphago 5秒? 笑死
: 我是不是砖家跟你半毛钱关系都没有
: 你既不知道MCT UCB RL是怎么回事 又不知道deep learning, cnn 怎么回事
: 你这智商估计连围棋都不会下 就敢在这乱喷一些让人笑掉大牙的东西
: goog虽然没有细节但是policy cnn+value cnn+MCT 人家说得很清楚
: 当然你估计一头雾水 啥都搞不清
: 你这傻货估计连minimax tree framework都不知道是咋回事
: 还是回菌斑 那智商适合你

n******8
发帖数: 172
16

exactly.

【在 x**8 的大作中提到】
: 虽然都是5秒,zen有几个cpu,alphaGo有几个?
O**l
发帖数: 12923
17
crazystone是32核
而且又不是分先下 是4子下

【在 x**8 的大作中提到】
: 虽然都是5秒,zen有几个cpu,alphaGo有几个?
x**8
发帖数: 1939
18
我问zen有几个,你告诉我crazystone干啥?

【在 O**l 的大作中提到】
: crazystone是32核
: 而且又不是分先下 是4子下

w****i
发帖数: 964
19

No, darkfores1 does not have a MCT component, it plays instantly.

【在 O**l 的大作中提到】
: 你这即不动围棋又不懂算法的傻货我跟你说了多少遍 两个完全不同
: FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
: GOOG 没有公布具体细节 但是他说了他还有一个value CNN
: 他没有完全依赖monte-carlo simulation的结果来update UCB 来决定tree的生长
: 两者区别大了去了
: 传统MCT根本没有评估函数
: 你如果说fb goog算法类似那zen和它们两的算也类似
: zen是heuristic prune+MCT
: 你这傻货 这些有半点明白是怎么回事吗 在这扯屁啊 赶快泡菌斑去吧
: 你这智商不适合在这

O**l
发帖数: 12923
20
这是FB论文里自己说的
From the experiments, we clearly show that DCNN is tactically weak due to
the lack of search.
Search is a way to explore the solution space conditioned on the current
board situation, and build
a non-parametric local model for the game. The local model is more flexible
than the global model
learned from massive training data and more adapted to the current situation
. The state-of-the-art
approach in computer Go is Monte-Carlo Tree Search (MCTS). Fig. 4 shows its
basic principle.
Combining DCNN with MCTS requires nontrivial engineering efforts because
each rollout of MCTS
is way much faster than DCNN evaluation. Therefore, these two must run in
parallel with frequent
communications. Our basic implementation of MCTS gives 16k rollouts per
second (for 16 threads
on a machine with Intel Xeon CPU E5-2680 v2 at 2.80GHz) while it typically
takes 0.2s for DCNN
to give board evaluations of a batch size of 128 with 4 GPUs.
http://arxiv.org/pdf/1511.06410v2.pdf
不用MCT开什么玩笑
对杀时候气都不算了 靠DCNN?

【在 w****i 的大作中提到】
:
: No, darkfores1 does not have a MCT component, it plays instantly.

相关主题
zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】罗洗河让AlphaGo四子的说法没有什么错
我现在敢80%肯定alpha go 搞不定小李的模仿棋围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法
现在回头再看第4局蒙特卡罗是不是有天生缺陷?
进入Go版参与讨论
O**l
发帖数: 12923
21
zen 是8个核
zen和crazystone水平差不多
和alphago 同样5秒下 让4字 30%左右胜率

【在 x**8 的大作中提到】
: 我问zen有几个,你告诉我crazystone干啥?
w****i
发帖数: 964
22
You apparently didn't look at the paper carefully. I can imagine that when
you just heard of this paper maybe 10 minutes ago. darkforest/darkfores1/
darkfores2 is pure DCNN bot, and darkfores2 reaches stable kgs 3d, DCNN+MCT
is darkfmcts3
Their Abstract:
"""
Darkforest substantially improves the win rate for patternmatching
approaches against MCTS-based approaches, even with looser search
budgets. Against human players, the newest versions, darkfores2, achieve a
stable
3d level on KGS Go Server as a ranked bot, a substantial improvement upon
the estimated 4k-5k ranks for DCNN reported in Clark & Storkey (2015) based
on games against other machine players. Adding MCTS to darkfores2 creates a
much stronger player named darkfmcts3: with 5000 rollouts, it beats Pachi
with
10k rollouts in all 250 games; with 75k rollouts it achieves a stable 5d
level in
KGS server, on par with state-of-the-art Go AIs (e.g., Zen, DolBaram,
CrazyStone);
with 110k rollouts, it won the 3rd place in January KGS Go Tournament.
"""

flexible
situation
its

【在 O**l 的大作中提到】
: 这是FB论文里自己说的
: From the experiments, we clearly show that DCNN is tactically weak due to
: the lack of search.
: Search is a way to explore the solution space conditioned on the current
: board situation, and build
: a non-parametric local model for the game. The local model is more flexible
: than the global model
: learned from massive training data and more adapted to the current situation
: . The state-of-the-art
: approach in computer Go is Monte-Carlo Tree Search (MCTS). Fig. 4 shows its

x**8
发帖数: 1939
23
8核估计和quad i7+hyper thread没啥本质差别吧?
这配置基本就家里都有吧,zen在这配置下5秒的水平很差,
alphaGo 48cpu+8Gpu
distributed alphaGo 1202cpu+176Gpu
这种神配置跟zen 8核下5秒,其他评论我不想多说,不过这让我对李世石多了一分信心,

【在 O**l 的大作中提到】
: zen 是8个核
: zen和crazystone水平差不多
: 和alphago 同样5秒下 让4字 30%左右胜率

O**l
发帖数: 12923
24
问题在于他自己也是5秒
时间提上去zen提高 他也提高 最后都是MCT

心,

【在 x**8 的大作中提到】
: 8核估计和quad i7+hyper thread没啥本质差别吧?
: 这配置基本就家里都有吧,zen在这配置下5秒的水平很差,
: alphaGo 48cpu+8Gpu
: distributed alphaGo 1202cpu+176Gpu
: 这种神配置跟zen 8核下5秒,其他评论我不想多说,不过这让我对李世石多了一分信心,

x**8
发帖数: 1939
25
一千个核的5秒和8核的5秒能一样么,
zen 8核5秒时候,算法还没有converge,强行中断跳出来的只是个局部的次优解,并没
有发挥出zen的真实水平,
zen 8核5秒类似于柯杰下 0.1秒,

【在 O**l 的大作中提到】
: 问题在于他自己也是5秒
: 时间提上去zen提高 他也提高 最后都是MCT
:
: 心,

O**l
发帖数: 12923
26
19*19 5秒 两个都没converge

【在 x**8 的大作中提到】
: 一千个核的5秒和8核的5秒能一样么,
: zen 8核5秒时候,算法还没有converge,强行中断跳出来的只是个局部的次优解,并没
: 有发挥出zen的真实水平,
: zen 8核5秒类似于柯杰下 0.1秒,

x**8
发帖数: 1939
27
你是狗家派来的?
已经不fair了你,
irrational

【在 O**l 的大作中提到】
: 19*19 5秒 两个都没converge
O**l
发帖数: 12923
28
我是说事实
19*19 5秒 收官前 多少核都没法converge

【在 x**8 的大作中提到】
: 你是狗家派来的?
: 已经不fair了你,
: irrational

x**8
发帖数: 1939
29
那一千个核和8核能一样吗?
zen在没converge时候水平很差,
alphaGo用一千个核跟zen 8核性能差的时候比,这个还用多说么?
这板上差不多都玩过zen,对zen 5秒和60秒的水平差距都有切身感受,
对这个你不用过多argue了,没用的,

【在 O**l 的大作中提到】
: 我是说事实
: 19*19 5秒 收官前 多少核都没法converge

O**l
发帖数: 12923
30
alphago 也是性能差的时候和zen性能差的时候比
alphago又没用1个小时

【在 x**8 的大作中提到】
: 那一千个核和8核能一样吗?
: zen在没converge时候水平很差,
: alphaGo用一千个核跟zen 8核性能差的时候比,这个还用多说么?
: 这板上差不多都玩过zen,对zen 5秒和60秒的水平差距都有切身感受,
: 对这个你不用过多argue了,没用的,

相关主题
推荐个免费的人工智能软件 PachiAlphaGo通俗的解释
从第四盘棋看狗狗的弱点看大家讨论中比较少提这个 reinforcement learning
神经网络的结构决定了他的极限大家对Alphago的胜率理解有误
进入Go版参与讨论
x**8
发帖数: 1939
31
给zen一千个核,估计5秒就收敛完了,
总之这不是个公平的比试,板上除了你都看得到,我不在就此问题和你争论了,

【在 O**l 的大作中提到】
: alphago 也是性能差的时候和zen性能差的时候比
: alphago又没用1个小时

s*****V
发帖数: 21731
32
你到底懂不懂啊,alphaGO这种算法的即使不做SEARCH,也能走出比较合
理的对策,这个大概只需要0.1s的时间.DF1/2就是这么干的.而且SEARCH
的时候,用CNN的帮助选择TOP MOVES,可以搜索地更快.

【在 O**l 的大作中提到】
: alphago 也是性能差的时候和zen性能差的时候比
: alphago又没用1个小时

O**l
发帖数: 12923
33
你先说说CNN 是啥
怎么auto encoder. 怎么soft max.
什么时候supervise 什么时候unsupervised .
CNN和普通Dl比优势在哪
搞笑 这种不学无术的傻粪听了几个名词也来跟我说这个

【在 s*****V 的大作中提到】
: 你到底懂不懂啊,alphaGO这种算法的即使不做SEARCH,也能走出比较合
: 理的对策,这个大概只需要0.1s的时间.DF1/2就是这么干的.而且SEARCH
: 的时候,用CNN的帮助选择TOP MOVES,可以搜索地更快.

r****y
发帖数: 26819
34
是啊,没懂,又不是参加做alphaGo的,在这版上刷屏求ego图啥。。。

【在 x**8 的大作中提到】
: 给zen一千个核,估计5秒就收敛完了,
: 总之这不是个公平的比试,板上除了你都看得到,我不在就此问题和你争论了,

S**C
发帖数: 2964
35
You are making implicit assumption that strength ratio between zen and
alphago at 5 seconds is equal to at, say, 5 minutes. It is not substantiated.

【在 O**l 的大作中提到】
: 问题在于他自己也是5秒
: 时间提上去zen提高 他也提高 最后都是MCT
:
: 心,

m*****n
发帖数: 3644
36
配置差这么多?!!!

心,

【在 x**8 的大作中提到】
: 8核估计和quad i7+hyper thread没啥本质差别吧?
: 这配置基本就家里都有吧,zen在这配置下5秒的水平很差,
: alphaGo 48cpu+8Gpu
: distributed alphaGo 1202cpu+176Gpu
: 这种神配置跟zen 8核下5秒,其他评论我不想多说,不过这让我对李世石多了一分信心,

1 (共1页)
进入Go版参与讨论
相关主题
围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法金明完9段点评AlphaGo: 缺点明显
蒙特卡罗是不是有天生缺陷?阿法狗生怕人类还不够绝望
推荐个免费的人工智能软件 Pachi哈萨比斯又给出新消息
从第四盘棋看狗狗的弱点田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?
神经网络的结构决定了他的极限AlphaGo的算法等技术分析
AlphaGo通俗的解释技术贴(懂围棋的请进)
看大家讨论中比较少提这个 reinforcement learning猜一下几个AlphaGo崩了的原因
大家对Alphago的胜率理解有误zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
相关话题的讨论汇总
话题: zen话题: mct话题: dcnn话题: alphago话题: mcts