w*********g 发帖数: 30882 | 1 【 以下文字转载自 Programming 讨论区 】
发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming
标 题: 围棋人工智能Master只用了一个GPU(转)
发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东)
发信人: nightwizard (JK), 信区: Weiqi
标 题: Master只用了一个GPU
发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
的意思吧)
2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
接近最高的选点概率增加(这个应该是常识吧)
3. Master只用了一个GPU(!)
4. 关于不依赖人类棋谱训练的工作,暂时无可奉告
youtube的视频只有半个小时,并没有提到上面那四点,可能实在Q&A环节说的。
1. adversarial learning现在在图像生成和识别里面很火,也有用在自然语言处理里
面的。图像识别里面就是设置一个generator和一个discriminator,分别训练它们生成
尽可能真实的图像,和区分真实图像和generator生成的图像。对generator来说
discriminator就是一个目标函数,对discriminator来说generator探索真实图像以外
的空间中可能被discriminator误判为真是图像的样本,帮助discriminator更好的区别
真假图像。这里用在AG里的目标类似第二种。
2. 这个温度是指策略网络输出层也就是softmax层的一个参数,网络对每个选点给出一
个跟选点概率相关的数x_i, 然后分别计算exp(x_i/T), 归一化后得到最后的选点概率
。这里T就是温度,T越大不同选点的概率差异越小,这是一个受热力学启发的概念。这
点说明差不多质量的开局比人预想的要多。
3. 测试会比训练用的资源少,但只用1个GPU如果是真的只能说牛逼大发了。。
4. 也许开局变化多也跟没用人类棋谱bootstrap策略网络有关,如果是这样那第二点的
回答其实是避重就轻,因为调温度也是很老的技巧了。我才这点应该是真的,不过
Demis要留个悬念。。 |
l*****i 发帖数: 20533 | 2 说明他不深算,只进行价值判断。按人类的说法,就是‘跟着感觉走’。可是ai的‘感
觉’是无数盘训练出来的,不是天上掉的。
所以那些快棋的本质,相当于爱好者和职业九段下5秒超快棋,或者单方面让爱好者想
20秒一步。职业九段光凭感觉和最基本的心算,恐怕也能打的爱好者找不到北。 |
S******t 发帖数: 378 | 3 还加了一个heat parameter
说是master会有时候选择第四好或者第五好的棋。 这真是完爆人类玩家。 人类一见到
乱走的,下快棋就直接傻了。看来人类才是计算机,根本不懂变通。 |
C**********e 发帖数: 23303 | 4 作者真是弱智 可能是文科生
1. 一个GPU 说的没错 测试和比赛时一个GPU接显示器确实够用了
训练的时候呢? GPU 至少 80 个以上
2. 还TMD的温度温度 温度参数 真是傻逼
阿狗用的经典的CNNs里面用的经典退火算法拟合 只是用了一个参数原理
3. 阿狗和以前计算机象棋最大的不同在于把棋局当成一幅图像 一幅图像 一幅图像 来
处理 由图像来判定占面积多少 和输赢概率 所以经常让人觉得大局观很不错 而不是象
棋的顺序控制过程 |
o*****p 发帖数: 2977 | 5 绝对扯jb蛋。
【在 w*********g 的大作中提到】 : 【 以下文字转载自 Programming 讨论区 】 : 发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming : 标 题: 围棋人工智能Master只用了一个GPU(转) : 发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东) : 发信人: nightwizard (JK), 信区: Weiqi : 标 题: Master只用了一个GPU : 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信 : http://www.lifein19x19.com/viewtopic.php?p=217809#p217809 : 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑 : 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
|
d****o 发帖数: 32610 | 6 就是个SA的原理罢了
【在 S******t 的大作中提到】 : 还加了一个heat parameter : 说是master会有时候选择第四好或者第五好的棋。 这真是完爆人类玩家。 人类一见到 : 乱走的,下快棋就直接傻了。看来人类才是计算机,根本不懂变通。
|
o*****p 发帖数: 2977 | 7 李世石比赛的Alphago用了一万个量级的gpu,告诉我现在用一个,绝对瞎jb扯淡。
https://zhuanlan.zhihu.com/p/24666144
当然,两边资源投入的量级完全不同。在八月份美国围棋大会上,我有幸见到了
AlphaGo的主要贡献者黄士杰(AjaHuang)和樊麾。我问他们,我们用了大概80到90块GPU
来训练模型,我是否可以在演讲时说我们用了AlphaGo百分之一的GPU?
那时Aja神秘地笑了笑说:具体数字不能讲。不过,也许小于百分之一吧。
【在 C**********e 的大作中提到】 : 作者真是弱智 可能是文科生 : 1. 一个GPU 说的没错 测试和比赛时一个GPU接显示器确实够用了 : 训练的时候呢? GPU 至少 80 个以上 : 2. 还TMD的温度温度 温度参数 真是傻逼 : 阿狗用的经典的CNNs里面用的经典退火算法拟合 只是用了一个参数原理 : 3. 阿狗和以前计算机象棋最大的不同在于把棋局当成一幅图像 一幅图像 一幅图像 来 : 处理 由图像来判定占面积多少 和输赢概率 所以经常让人觉得大局观很不错 而不是象 : 棋的顺序控制过程
|
w********g 发帖数: 3780 | |
w***o 发帖数: 1806 | 9 这和说人类进化几百万代一个意思,难道李世石是一个人,不是他祖先几百万代进化的
结果?看来人也是用了几百万了
GPU
【在 o*****p 的大作中提到】 : 李世石比赛的Alphago用了一万个量级的gpu,告诉我现在用一个,绝对瞎jb扯淡。 : https://zhuanlan.zhihu.com/p/24666144 : 当然,两边资源投入的量级完全不同。在八月份美国围棋大会上,我有幸见到了 : AlphaGo的主要贡献者黄士杰(AjaHuang)和樊麾。我问他们,我们用了大概80到90块GPU : 来训练模型,我是否可以在演讲时说我们用了AlphaGo百分之一的GPU? : 那时Aja神秘地笑了笑说:具体数字不能讲。不过,也许小于百分之一吧。
|
o*****p 发帖数: 2977 | 10 胡扯啥。深度学习没有技术进步的情况下,运算数量级降了4个?这么绝对惊天动地的
结果talk里面不讲,回答问题的时候讲出来了 ---- 说明也不是想保密,就是没说,这
符合常识么?
【在 w***o 的大作中提到】 : 这和说人类进化几百万代一个意思,难道李世石是一个人,不是他祖先几百万代进化的 : 结果?看来人也是用了几百万了 : : GPU
|
|
|
t******e 发帖数: 2504 | 11 和小李比赛好像是1700个GPU,但网上60连胜的master只有1个GPU的消息应该有可靠的
, 当时新年aja黄在台湾度假期间上网比赛的, 大过年的, 估计英美也不太可能有什
么人还在上班, 因而也没有机会用分布式, 估计当时就是一个单机。 |
w***o 发帖数: 1806 | 12 学习完的结果由一个GPU用,这和进化和学习是一样的概念。李世石也是进化和向很多
人学习知识来的
学习的结果是可以拷贝给多台机器去单独比赛的。 |
s*****V 发帖数: 21731 | 13 训练的时候需要大量的GPU,台上十分钟,台下十年功 |
y****g 发帖数: 36950 | 14 应该是这样,训练时需要大量计算机取得数据,最后用一个GPU调取这些数据就够了
【在 C**********e 的大作中提到】 : 作者真是弱智 可能是文科生 : 1. 一个GPU 说的没错 测试和比赛时一个GPU接显示器确实够用了 : 训练的时候呢? GPU 至少 80 个以上 : 2. 还TMD的温度温度 温度参数 真是傻逼 : 阿狗用的经典的CNNs里面用的经典退火算法拟合 只是用了一个参数原理 : 3. 阿狗和以前计算机象棋最大的不同在于把棋局当成一幅图像 一幅图像 一幅图像 来 : 处理 由图像来判定占面积多少 和输赢概率 所以经常让人觉得大局观很不错 而不是象 : 棋的顺序控制过程
|
S*E 发帖数: 3662 | 15 GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。
CPU才是传统电脑的智能呀。你知道用了多少CPU吗?
【在 w*********g 的大作中提到】 : 【 以下文字转载自 Programming 讨论区 】 : 发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming : 标 题: 围棋人工智能Master只用了一个GPU(转) : 发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东) : 发信人: nightwizard (JK), 信区: Weiqi : 标 题: Master只用了一个GPU : 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信 : http://www.lifein19x19.com/viewtopic.php?p=217809#p217809 : 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑 : 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
|
n****4 发帖数: 12553 | 16 才一个gpu? 咋不说只一个管子呢
【在 w*********g 的大作中提到】 : 【 以下文字转载自 Programming 讨论区 】 : 发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming : 标 题: 围棋人工智能Master只用了一个GPU(转) : 发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东) : 发信人: nightwizard (JK), 信区: Weiqi : 标 题: Master只用了一个GPU : 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信 : http://www.lifein19x19.com/viewtopic.php?p=217809#p217809 : 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑 : 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
|
t******g 发帖数: 4044 | 17 纠结用几个gpu都没意义,过几十年一个手机手表的计算能力就超过今天的几百个gpu。
总之就是围棋不是什么人工智能的禁区,和任何其他固定规则的游戏一样,人类被计算
机完爆。
【在 t******e 的大作中提到】 : 和小李比赛好像是1700个GPU,但网上60连胜的master只有1个GPU的消息应该有可靠的 : , 当时新年aja黄在台湾度假期间上网比赛的, 大过年的, 估计英美也不太可能有什 : 么人还在上班, 因而也没有机会用分布式, 估计当时就是一个单机。
|
a********i 发帖数: 1611 | 18 GPU的多线程处理早就被搞计算的用了多少年了
【在 S*E 的大作中提到】 : GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。 : CPU才是传统电脑的智能呀。你知道用了多少CPU吗?
|
t******e 发帖数: 2504 | 19 记错了, 不是1700, 是去年和小李比赛时是176个GPU。
master让专业棋手完全信服,如果只有一个GPU,那么人类就更被计算机完爆了。
【在 t******g 的大作中提到】 : 纠结用几个gpu都没意义,过几十年一个手机手表的计算能力就超过今天的几百个gpu。 : 总之就是围棋不是什么人工智能的禁区,和任何其他固定规则的游戏一样,人类被计算 : 机完爆。
|
T*********r 发帖数: 2953 | 20 哈哈哈
菌版的文化就是
屁都不懂,还能说的头头是道。
【在 S*E 的大作中提到】 : GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。 : CPU才是传统电脑的智能呀。你知道用了多少CPU吗?
|
|
|
h*********n 发帖数: 11319 | 21 master重点是背后的神经
要训练这个网络需要上万个GPU
用这个网络没有一毛钱的技术含量。
【在 t******e 的大作中提到】 : 记错了, 不是1700, 是去年和小李比赛时是176个GPU。 : master让专业棋手完全信服,如果只有一个GPU,那么人类就更被计算机完爆了。
|
t******0 发帖数: 3757 | 22 我在椰胡下围棋,正好看了master那里的30场。。
实在是太牛了,绝对的控制力,布局怎么玩都不怕。。围棋就是计算,只要思路正确,
人怎么能算的过没有情绪化的机器呢 |
y****g 发帖数: 36950 | 23 CUDA听说过嘛
【在 S*E 的大作中提到】 : GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。 : CPU才是传统电脑的智能呀。你知道用了多少CPU吗?
|
h******k 发帖数: 13418 | 24 麻痹的,文科生的那张狗嘴,不懂还瞎BB,小了误事,大了误国。 |
h******k 发帖数: 13418 | 25 你是来负责搞笑的吗,还尼玛调取数据。
【在 y****g 的大作中提到】 : 应该是这样,训练时需要大量计算机取得数据,最后用一个GPU调取这些数据就够了
|
y****g 发帖数: 36950 | 26 先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台
机器渲染
动画片,最后只要一台PC找到最MATCH的图像计算一下变化就能播放了嘛!
我本来就是来搞笑的。
【在 h******k 的大作中提到】 : 你是来负责搞笑的吗,还尼玛调取数据。
|
d*****u 发帖数: 17243 | 27 机器学习本来就是训练的时候数据量大,需要用GPU什么的来进行运算
预测的时候模型都是现成的了,很多时候甚至不用GPU都慢不到哪去 |
h******k 发帖数: 13418 | 28 先不说你这种算法多搞笑,从存在无数棋局里找MATCH本身就是计算量巨大的东西,那
是一个GPU能搞定的。在计算机算法中,一旦数据量达到一定的规模,复杂度就必然上
来了。
先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台
【在 y****g 的大作中提到】 : 先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台 : 机器渲染 : 动画片,最后只要一台PC找到最MATCH的图像计算一下变化就能播放了嘛! : 我本来就是来搞笑的。
|
c*******9 发帖数: 9032 | 29 这个不是要精确的MATCH,只要比人脑精确。过两年,手机可以完成这个任务。
【在 h******k 的大作中提到】 : 先不说你这种算法多搞笑,从存在无数棋局里找MATCH本身就是计算量巨大的东西,那 : 是一个GPU能搞定的。在计算机算法中,一旦数据量达到一定的规模,复杂度就必然上 : 来了。 : : 先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台
|