由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 神经网络的结构决定了他的极限
相关主题
阿法狗生怕人类还不够绝望zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
原来阿尔法下的是5秒版的ZEN我现在敢80%肯定alpha go 搞不定小李的模仿棋
从第四盘棋看狗狗的弱点现在回头再看第4局
AlphaGo通俗的解释猜一下几个AlphaGo崩了的原因
技术贴(懂围棋的请进)大家对Alphago的胜率理解有误
看大家讨论中比较少提这个 reinforcement learning金明完9段点评AlphaGo: 缺点明显
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?写过程序的都知道
AlphaGo的算法等技术分析锵锵请的港大计算机系主任不懂啊
相关话题的讨论汇总
话题: mct话题: dcnn话题: heuristics话题: kgs话题: ucb
进入Go版参与讨论
1 (共1页)
x**8
发帖数: 1939
1
他的水平不是可以无限成长的,
多少年前搞过神经网络,
对不同的问题,要设计不同的网络结构,
网络学习也有好多参数要调整,
所以,这个alphaGo的棋力会有个极限,到了某个程度就会受限于他的网络结构的能力,
O**l
发帖数: 12923
2
你知道cnn吗
而且主要还是Mct 不要任何domain knowledge
Mct 9x9 早就无敌
19*19 state space太大 单纯Mct没发converge
Train 一个cnn prune一下 把每步 branch factor降到9*9的级别
然后Mct暴力求最优解
基本就是神了 李世石估计最多赢一盘 很有可能0:5
最后直接崩溃
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
D*******r
发帖数: 2323
3
从理论上讲,只要不是全覆盖的解法,就不能说找到了绝对最佳解,也就有了你所说的
它的极限。关键在于它的极限在人类的极限的上面还是下面。

力,

【在 x**8 的大作中提到】
: 他的水平不是可以无限成长的,
: 多少年前搞过神经网络,
: 对不同的问题,要设计不同的网络结构,
: 网络学习也有好多参数要调整,
: 所以,这个alphaGo的棋力会有个极限,到了某个程度就会受限于他的网络结构的能力,

m******n
发帖数: 15691
4
围棋每一步的branch factor不是9×9,虽然算不上19*19,但肯定大于9×9
只考虑9*9的话,一个引征 就挂了

【在 O**l 的大作中提到】
: 你知道cnn吗
: 而且主要还是Mct 不要任何domain knowledge
: Mct 9x9 早就无敌
: 19*19 state space太大 单纯Mct没发converge
: Train 一个cnn prune一下 把每步 branch factor降到9*9的级别
: 然后Mct暴力求最优解
: 基本就是神了 李世石估计最多赢一盘 很有可能0:5
: 最后直接崩溃
: [在 xy18 (家琪) 的大作中提到:]
: :他的水平不是可以无限成长的,

x**8
发帖数: 1939
5
看他说降到9x9就知道他是胡掰,一个神经网都没算过的主,

【在 m******n 的大作中提到】
: 围棋每一步的branch factor不是9×9,虽然算不上19*19,但肯定大于9×9
: 只考虑9*9的话,一个引征 就挂了

O**l
发帖数: 12923
6
引征 这些都是heuristic knowledge
Mct 之前 就能排除 这都是多少年前的技术了
不要拿人的思维来看
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
O**l
发帖数: 12923
7
你做过几个naive nn
这种30年前的玩意
连auto encoder soft max 是啥估计都不知道 瞎鸡吧扯什么
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
o*****p
发帖数: 2977
8
肯定。但问题是这个算法才诞生不久,在围棋上又是刚开始运用,合理的预期是:现
在的能力(打败弱职业选手)远远不是它的极限。
但我们都知道弱职业选手和强职业选手的差距其实没有那么大。
所以超过人类的最高的可能水平,是很可能的。

力,

【在 x**8 的大作中提到】
: 他的水平不是可以无限成长的,
: 多少年前搞过神经网络,
: 对不同的问题,要设计不同的网络结构,
: 网络学习也有好多参数要调整,
: 所以,这个alphaGo的棋力会有个极限,到了某个程度就会受限于他的网络结构的能力,

O**l
发帖数: 12923
9
最搞笑的是 还有人说5盘棋质量不高 所以水平不高
Mct核心是选最大Ucb值
也就是赢半目99% Ucb 和屠龙98%Ucb
机器一定选前者 走的会非常缓
你越弱 他越像在下指导棋
那五盘棋根本看不出来alpha 狗的实力上限
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
D*******r
发帖数: 2323
10
是这个道理,但是计算机UCB值对tree的搜索计算的,而现实中人会走出哪步棋的概率
是和机器计算的不一样的。这在机器局面领先时,并不那么重要,但是如果机器局面落
后的情况下,就很微妙了。
举个例子,现在机器局面落后,如果按UCB值计算,最佳的应手到最后会输五目。那么
机器是继续按UCB值排序下棋,以期后面对手犯小错而扳回呢?还是会选择放胜负手,
虽然UCB值不是最高,但是如果对手犯错就立刻能扳回,既所谓的僵尸流。
换句话说,现在的UCB值是静态算法,如何根据局面情况以及对手特征调整参数计算UCB
,那就太牛逼了。

【在 O**l 的大作中提到】
: 最搞笑的是 还有人说5盘棋质量不高 所以水平不高
: Mct核心是选最大Ucb值
: 也就是赢半目99% Ucb 和屠龙98%Ucb
: 机器一定选前者 走的会非常缓
: 你越弱 他越像在下指导棋
: 那五盘棋根本看不出来alpha 狗的实力上限
: [在 xy18 (家琪) 的大作中提到:]
: :他的水平不是可以无限成长的,
: :多少年前搞过神经网络,
: :...........

相关主题
看大家讨论中比较少提这个 reinforcement learningzt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?我现在敢80%肯定alpha go 搞不定小李的模仿棋
AlphaGo的算法等技术分析现在回头再看第4局
进入Go版参与讨论
O**l
发帖数: 12923
11
uCB 值就是对手犯错和自己犯错概率比值
Mct在落后的时候会下的非常aggressive
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
O**l
发帖数: 12923
12
ucb 值采集的montecarlo simulation结果只考虑输赢
根本不考虑赢多少只有0-1两个值
赢半目和赢100目 机器看起来都一样
Ucb值看重的是得到1的概率
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
O**l
发帖数: 12923
13
说老实话 goog 这玩意没啥新东西
这思路很多人提出过 只不过执行力不如他家强而已
最重要的mct和CNN 没有一个是Goog 搞出来的
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
o*****p
发帖数: 2977
14
重要的不是他是不是新东西,重要的是突破围棋这个AI挑战,所说明的他的潜力。以
前人们认为AI怎么都没办法学会围棋。现在它学会了。
可以说有可能人类任何智力能力,对计算机都不会是上限。这一点是非常可怕的。
好比以前火药都用来做二踢脚,他试了一下把城墙炸塌了。你不能说这没啥新东西。
他这么一下,就毋庸置疑的表明了火药对世界会有深刻的影响。

【在 O**l 的大作中提到】
: 说老实话 goog 这玩意没啥新东西
: 这思路很多人提出过 只不过执行力不如他家强而已
: 最重要的mct和CNN 没有一个是Goog 搞出来的
: [在 xy18 (家琪) 的大作中提到:]
: :他的水平不是可以无限成长的,
: :多少年前搞过神经网络,
: :...........

D*******r
发帖数: 2323
15
对呀,但是电脑在计算中的对手是另一个电脑,比如说对于电脑,选择某一步,它的下
一步有九种可能赢棋,有一种可能输棋,那么UBC值是90%。但是对于人类对手,不同实
力不同棋风的棋手,其UCB值都不一样。比如说偏实地的选手让他走宇宙流UCB就很低,
但是机器并不知道对手棋风和软肋,它还是按照对手是机器的方法去算UCB。
我说的就是,机器如何根据对手以往棋谱的特点去调整UCB的计算,或者说更牛逼的就
是在对局中去“感觉”对手特点而有针对性地动态计算UCB。

【在 O**l 的大作中提到】
: uCB 值就是对手犯错和自己犯错概率比值
: Mct在落后的时候会下的非常aggressive
: [在 xy18 (家琪) 的大作中提到:]
: :他的水平不是可以无限成长的,
: :多少年前搞过神经网络,
: :...........

x**8
发帖数: 1939
16
从人类棋手的角度看,近些年超一流之间的对局往往是赌对方也看不清短时间内算不明
白,我个人不觉得这是棋道的正路,AI高手的出现可能会让棋手回归到玩棋本身这个
game上,而不是玩人/人的弱点,这是很好的事情,
AI和人在围棋这件事情上很可能从此进入类似两强争霸的时期,
但是我相信总有一天,围棋这事情会被彻底算清算明白,也许某一天,人们开始发现,
电脑执黑第一手总是下到天元,并且再也不败。。。。

【在 o*****p 的大作中提到】
: 重要的不是他是不是新东西,重要的是突破围棋这个AI挑战,所说明的他的潜力。以
: 前人们认为AI怎么都没办法学会围棋。现在它学会了。
: 可以说有可能人类任何智力能力,对计算机都不会是上限。这一点是非常可怕的。
: 好比以前火药都用来做二踢脚,他试了一下把城墙炸塌了。你不能说这没啥新东西。
: 他这么一下,就毋庸置疑的表明了火药对世界会有深刻的影响。

n*********3
发帖数: 534
17
Oh,
Does self-learning lead to creativity or creation of new knowledge or new
style of play?
w**a
发帖数: 3510
18
有见地!这些年的棋杀的激烈,都是在赌在短时间里谁不到,错进错出。这下好了,电
脑一来,都给我老老实实算吧,看不清楚蒙不过电脑,尤其是所谓的僵尸流,茅坑流,
在电脑前不堪一击。
[在 xy18 (家琪) 的大作中提到:]
:他的水平不是可以无限成长的,
:多少年前搞过神经网络,
:...........
D*******r
发帖数: 2323
19
这就是我说的:
如果围棋每一步都走出上帝之手,那么围棋就是铺地板,所谓强手妙手都是基于对对手
应手错误的惩罚,或者对对手后面出勺子的期待。如果计算机是以对方应手也是最佳应
手来计算,注定它的招法也会比较平淡。不知道有没有参数可调,让计算机转变棋风,
变得更富有攻击性,或者更流水不争先保持均衡。
有一点是无疑的,计算机将对现在中韩流行的暴力攻击棋风进行一次革命,因为那些积
极主动的犀利攻击,在计算机的计算下,漏洞百出,只不过人看不出来,计算不过来而
已。
不知道这会不会带来一次日本式围棋的回归?

【在 x**8 的大作中提到】
: 从人类棋手的角度看,近些年超一流之间的对局往往是赌对方也看不清短时间内算不明
: 白,我个人不觉得这是棋道的正路,AI高手的出现可能会让棋手回归到玩棋本身这个
: game上,而不是玩人/人的弱点,这是很好的事情,
: AI和人在围棋这件事情上很可能从此进入类似两强争霸的时期,
: 但是我相信总有一天,围棋这事情会被彻底算清算明白,也许某一天,人们开始发现,
: 电脑执黑第一手总是下到天元,并且再也不败。。。。

w****i
发帖数: 964
20
MCT is basically a sampling method, MCT with random policy performs very
poorly. The existing MCT approaches before AlphaGO heavily rely on hand
crafted heuristics in their policies. This is exactly the reason why MCT
approaches basically stop going forward after reaching KGS 5-6d, for almost
5 years, because hand crafted heuristic hits the limit. The key component of
the new program is the policy/value network to automatically construct
heuristics through machine learning. The major player here is the heuristics
, not MCT. Early MCT without good heuristic functions are below kgs 1d,
while DCNN alone could reach ~kgs 3d.

【在 O**l 的大作中提到】
: 最搞笑的是 还有人说5盘棋质量不高 所以水平不高
: Mct核心是选最大Ucb值
: 也就是赢半目99% Ucb 和屠龙98%Ucb
: 机器一定选前者 走的会非常缓
: 你越弱 他越像在下指导棋
: 那五盘棋根本看不出来alpha 狗的实力上限
: [在 xy18 (家琪) 的大作中提到:]
: :他的水平不是可以无限成长的,
: :多少年前搞过神经网络,
: :...........

相关主题
猜一下几个AlphaGo崩了的原因写过程序的都知道
大家对Alphago的胜率理解有误锵锵请的港大计算机系主任不懂啊
金明完9段点评AlphaGo: 缺点明显我靠 小李凭这盘棋再入史册
进入Go版参与讨论
m*****n
发帖数: 3644
21
你说的棋手就是所谓的胜负师。这在业余棋手中更常见,往往可以越级挑战。
至于电脑执黑下到天元再也不败,不可能。调整贴目就是了。贴目规则到现在已经调整
太多次了。

【在 x**8 的大作中提到】
: 从人类棋手的角度看,近些年超一流之间的对局往往是赌对方也看不清短时间内算不明
: 白,我个人不觉得这是棋道的正路,AI高手的出现可能会让棋手回归到玩棋本身这个
: game上,而不是玩人/人的弱点,这是很好的事情,
: AI和人在围棋这件事情上很可能从此进入类似两强争霸的时期,
: 但是我相信总有一天,围棋这事情会被彻底算清算明白,也许某一天,人们开始发现,
: 电脑执黑第一手总是下到天元,并且再也不败。。。。

O**l
发帖数: 12923
22
最后一句光靠 CNN 能到3D 我不信
MCT又不是纯monte-carlo是UCB tree guided monte-carlo, converge速度比传统
heuristic search高million倍
MCT把go的水平从30K提高到业余5D 绝对最大的突破 远比这次糅合CNN 突破大多了
MCT 后 机器9*9就无敌了 再次之前根本不敢想

almost
of
heuristics

【在 w****i 的大作中提到】
: MCT is basically a sampling method, MCT with random policy performs very
: poorly. The existing MCT approaches before AlphaGO heavily rely on hand
: crafted heuristics in their policies. This is exactly the reason why MCT
: approaches basically stop going forward after reaching KGS 5-6d, for almost
: 5 years, because hand crafted heuristic hits the limit. The key component of
: the new program is the policy/value network to automatically construct
: heuristics through machine learning. The major player here is the heuristics
: , not MCT. Early MCT without good heuristic functions are below kgs 1d,
: while DCNN alone could reach ~kgs 3d.

w****i
发帖数: 964
23

darkfores1 by facebook is kgs 2d, its rating chart is very close to 3d, ~2.
8d. it only started playing on kgs from late Nov 2015.
non-MCT GNUGO is ~ kgs 5~6K, UCB-MCT improved bots level from 5k to ~1-2d,
from 2d to 5~6d mainly rely on customized heuristics. DCNN heuristics
improved bots level from kgs 5~6d to 9d+
standard Go is a 19*19 game.

【在 O**l 的大作中提到】
: 最后一句光靠 CNN 能到3D 我不信
: MCT又不是纯monte-carlo是UCB tree guided monte-carlo, converge速度比传统
: heuristic search高million倍
: MCT把go的水平从30K提高到业余5D 绝对最大的突破 远比这次糅合CNN 突破大多了
: MCT 后 机器9*9就无敌了 再次之前根本不敢想
:
: almost
: of
: heuristics

O**l
发帖数: 12923
24
1 customized heuristics MCT任然是MCT
2 DCNN heuristics提高到9D还不确定
3 有论文关于专门DCNN的介绍吗 纯DCNN不计算能到3D开什么玩笑 DCNN和MCT根本不是
一个层面上的东西 没法代替

【在 w****i 的大作中提到】
:
: darkfores1 by facebook is kgs 2d, its rating chart is very close to 3d, ~2.
: 8d. it only started playing on kgs from late Nov 2015.
: non-MCT GNUGO is ~ kgs 5~6K, UCB-MCT improved bots level from 5k to ~1-2d,
: from 2d to 5~6d mainly rely on customized heuristics. DCNN heuristics
: improved bots level from kgs 5~6d to 9d+
: standard Go is a 19*19 game.

w****i
发帖数: 964
25

word game:
MCT with heuristics is still heuristics, the most successful part of AlphaGo
is that it mimics human learning, which is building heuristics to
prioritize searching.
just go to kgs and look at darkfores1 and its related literature, it plays
instantly, unlike MCT always plays at the last second even no matter how
obvious the move is.

【在 O**l 的大作中提到】
: 1 customized heuristics MCT任然是MCT
: 2 DCNN heuristics提高到9D还不确定
: 3 有论文关于专门DCNN的介绍吗 纯DCNN不计算能到3D开什么玩笑 DCNN和MCT根本不是
: 一个层面上的东西 没法代替

O**l
发帖数: 12923
26
搞笑 MCT以前基于各种knowledge的heuristic search多了去了 谁能达到1d水平
没有UCB你加再多knowledge都没有 所以重要MCT不是heuristic
DCNN下得快当然了 就是过一遍NN DCNN其实就是UCT展开时候prune branch
不用MCT
你这玩意想也能想出来 应该勺子莫名其妙的棋一大把
而且局部对杀 你不计算用DCNN softmax一个最大值??? 开玩笑吧
有paper拿来看看嘛

AlphaGo

【在 w****i 的大作中提到】
:
: word game:
: MCT with heuristics is still heuristics, the most successful part of AlphaGo
: is that it mimics human learning, which is building heuristics to
: prioritize searching.
: just go to kgs and look at darkfores1 and its related literature, it plays
: instantly, unlike MCT always plays at the last second even no matter how
: obvious the move is.

w****i
发帖数: 964
27

Apparently you have no idea about the difference. previous heuristics are
hand-crafted heuristics. It's the DCNN learned heuristics that offers a well
balanced policy in searching. The difference is how to construct the
heuristics, by hand or by machine.
So obviously you do not know the paper and are blind to the fact that a pure
DCNN bot have reached ~KGS 3d level, when you are arguing with bunch of
people with your limited (and outdated) knowledge of computer Go, you are
the one looks really ridiculous.

【在 O**l 的大作中提到】
: 搞笑 MCT以前基于各种knowledge的heuristic search多了去了 谁能达到1d水平
: 没有UCB你加再多knowledge都没有 所以重要MCT不是heuristic
: DCNN下得快当然了 就是过一遍NN DCNN其实就是UCT展开时候prune branch
: 不用MCT
: 你这玩意想也能想出来 应该勺子莫名其妙的棋一大把
: 而且局部对杀 你不计算用DCNN softmax一个最大值??? 开玩笑吧
: 有paper拿来看看嘛
:
: AlphaGo

O**l
发帖数: 12923
28

well
这个我当然知道 我们在讨论heuristic MCT是不是MCT的问题 和DCNN有什么关系, 我是
在强调MCT远远比heuristic重要 没MCT之前不管什么heuristic你1D都上不了 有了MCT
你能
上5D
pure
这是常识 DCNN拟合最多做做planning 你不search 简直开玩笑 你完全不理解DCNN MCT
的本质是啥 会不会下围棋也存疑
这是FB最新的paper里的话 你自己仔细读读再来说
http://arxiv.org/pdf/1511.06410v2.pdf
From the experiments, we clearly show that DCNN is tactically weak due to
the lack of search.
Search is a way to explore the solution space conditioned on the current
board situation, and build
a non-parametric local model for the game. The local model is more flexible
than the global model
learned from massive training data and more adapted to the current situation
. The state-of-the-art
approach in computer Go is Monte-Carlo Tree Search (MCTS). Fig. 4 shows its
basic principle.
Combining DCNN with MCTS requires nontrivial engineering efforts because
each rollout of MCTS
is way much faster than DCNN evaluation. Therefore, these two must run in
parallel with frequent
communications. Our basic implementation of MCTS gives 16k rollouts per
second (for 16 threads
on a machine with Intel Xeon CPU E5-2680 v2 at 2.80GHz) while it typically
takes 0.2s for DCNN
to give board evaluations of a batch size of 128 with 4 GPUs.

【在 w****i 的大作中提到】
:
: Apparently you have no idea about the difference. previous heuristics are
: hand-crafted heuristics. It's the DCNN learned heuristics that offers a well
: balanced policy in searching. The difference is how to construct the
: heuristics, by hand or by machine.
: So obviously you do not know the paper and are blind to the fact that a pure
: DCNN bot have reached ~KGS 3d level, when you are arguing with bunch of
: people with your limited (and outdated) knowledge of computer Go, you are
: the one looks really ridiculous.

w****i
发帖数: 964
29

我是
MCT
NO, DCNN heuristics alone can reach KGS 3d, READ THE PAPER.
MCT
You are talking about darkmcts (DCNN+MCT), but darkfores* is pure DCNN and
reaches kgs 3D, without MCT, READ THE PAPER!

【在 O**l 的大作中提到】
:
: well
: 这个我当然知道 我们在讨论heuristic MCT是不是MCT的问题 和DCNN有什么关系, 我是
: 在强调MCT远远比heuristic重要 没MCT之前不管什么heuristic你1D都上不了 有了MCT
: 你能
: 上5D
: pure
: 这是常识 DCNN拟合最多做做planning 你不search 简直开玩笑 你完全不理解DCNN MCT
: 的本质是啥 会不会下围棋也存疑
: 这是FB最新的paper里的话 你自己仔细读读再来说

O**l
发帖数: 12923
30
好吧 DCNN比我想象的要强
softmax出来结果比我想象的精确
不过我还是不太相信 今晚去kgs找darkforest下几盘看看
纯dcnn太不可思议 局部对杀也靠dcnn...

【在 w****i 的大作中提到】
:
: 我是
: MCT
: NO, DCNN heuristics alone can reach KGS 3d, READ THE PAPER.
: MCT
: You are talking about darkmcts (DCNN+MCT), but darkfores* is pure DCNN and
: reaches kgs 3D, without MCT, READ THE PAPER!

相关主题
阿发狗证明了天才和疯子就一尺之遥原来阿尔法下的是5秒版的ZEN
阿法狗第四局最终并不是输在对妙手的漏算上从第四盘棋看狗狗的弱点
阿法狗生怕人类还不够绝望AlphaGo通俗的解释
进入Go版参与讨论
b*******8
发帖数: 37364
31
这个不一定,不把围棋天文变化整个分支树全算清,结论难说。每一步都是最好,也可
能是满盘不定型,忽然这里下一下,哪里下一下,好多大龙绞杀在一起,最后黑多几目
。或者同样是最后黑多几目,既有铺地板的,也有大砍大杀的,分支树上最优解有很多
个。

【在 D*******r 的大作中提到】
: 这就是我说的:
: 如果围棋每一步都走出上帝之手,那么围棋就是铺地板,所谓强手妙手都是基于对对手
: 应手错误的惩罚,或者对对手后面出勺子的期待。如果计算机是以对方应手也是最佳应
: 手来计算,注定它的招法也会比较平淡。不知道有没有参数可调,让计算机转变棋风,
: 变得更富有攻击性,或者更流水不争先保持均衡。
: 有一点是无疑的,计算机将对现在中韩流行的暴力攻击棋风进行一次革命,因为那些积
: 极主动的犀利攻击,在计算机的计算下,漏洞百出,只不过人看不出来,计算不过来而
: 已。
: 不知道这会不会带来一次日本式围棋的回归?

1 (共1页)
进入Go版参与讨论
相关主题
锵锵请的港大计算机系主任不懂啊技术贴(懂围棋的请进)
我靠 小李凭这盘棋再入史册看大家讨论中比较少提这个 reinforcement learning
阿发狗证明了天才和疯子就一尺之遥田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?
阿法狗第四局最终并不是输在对妙手的漏算上AlphaGo的算法等技术分析
阿法狗生怕人类还不够绝望zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
原来阿尔法下的是5秒版的ZEN我现在敢80%肯定alpha go 搞不定小李的模仿棋
从第四盘棋看狗狗的弱点现在回头再看第4局
AlphaGo通俗的解释猜一下几个AlphaGo崩了的原因
相关话题的讨论汇总
话题: mct话题: dcnn话题: heuristics话题: kgs话题: ucb