由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 围棋人工智能Master只用了一个GPU(转) (转载)
相关主题
IJCAI 2018所有奖项出炉:AlphaGo获奖,中国研究成果占据半壁AlphaGo的真正可怕之处
奇闻录 | 周末段子荟萃 3-13 (转载)zt AlphaGo可能会发现另外一种围棋美,是我们想象不到的 (转载)
弈城惊现疑似谷歌团队ID 金灿佑:棋谱似人工智能科技部部长万钢回应围棋人机大战 称中国象棋是未来研发方向
人工智能都是扯淡,没有前途,就像三体,人类一个基础认识更新就摧枯拉朽这个如果是真的,岂不是扇了某些人的大嘴巴?
李世石感觉状态不行啊华尔街日报:李世石不适合代表人类出战
阿发狗竟然赢李世石了?完了,我的世界崩溃了!李世石:我再也不想下这样的比赛了。 (转载)
Re: 李世石是不是对alphago的下棋方法了解太少了 (转载)百度也要搞无人车 和围棋机器人了
生命科学角度看AIZT电子科大专家参与研发的“高考机器人”,明年要考一本!
相关话题的讨论汇总
话题: gpu话题: master话题: 图像话题: 选点
进入Military版参与讨论
1 (共1页)
w*********g
发帖数: 30882
1
【 以下文字转载自 Programming 讨论区 】
发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming
标 题: 围棋人工智能Master只用了一个GPU(转)
发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东)
发信人: nightwizard (JK), 信区: Weiqi
标 题: Master只用了一个GPU
发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
的意思吧)
2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
接近最高的选点概率增加(这个应该是常识吧)
3. Master只用了一个GPU(!)
4. 关于不依赖人类棋谱训练的工作,暂时无可奉告
youtube的视频只有半个小时,并没有提到上面那四点,可能实在Q&A环节说的。
1. adversarial learning现在在图像生成和识别里面很火,也有用在自然语言处理里
面的。图像识别里面就是设置一个generator和一个discriminator,分别训练它们生成
尽可能真实的图像,和区分真实图像和generator生成的图像。对generator来说
discriminator就是一个目标函数,对discriminator来说generator探索真实图像以外
的空间中可能被discriminator误判为真是图像的样本,帮助discriminator更好的区别
真假图像。这里用在AG里的目标类似第二种。
2. 这个温度是指策略网络输出层也就是softmax层的一个参数,网络对每个选点给出一
个跟选点概率相关的数x_i, 然后分别计算exp(x_i/T), 归一化后得到最后的选点概率
。这里T就是温度,T越大不同选点的概率差异越小,这是一个受热力学启发的概念。这
点说明差不多质量的开局比人预想的要多。
3. 测试会比训练用的资源少,但只用1个GPU如果是真的只能说牛逼大发了。。
4. 也许开局变化多也跟没用人类棋谱bootstrap策略网络有关,如果是这样那第二点的
回答其实是避重就轻,因为调温度也是很老的技巧了。我才这点应该是真的,不过
Demis要留个悬念。。
l*****i
发帖数: 20533
2
说明他不深算,只进行价值判断。按人类的说法,就是‘跟着感觉走’。可是ai的‘感
觉’是无数盘训练出来的,不是天上掉的。
所以那些快棋的本质,相当于爱好者和职业九段下5秒超快棋,或者单方面让爱好者想
20秒一步。职业九段光凭感觉和最基本的心算,恐怕也能打的爱好者找不到北。
S******t
发帖数: 378
3
还加了一个heat parameter
说是master会有时候选择第四好或者第五好的棋。 这真是完爆人类玩家。 人类一见到
乱走的,下快棋就直接傻了。看来人类才是计算机,根本不懂变通。
C**********e
发帖数: 23303
4
作者真是弱智 可能是文科生
1. 一个GPU 说的没错 测试和比赛时一个GPU接显示器确实够用了
训练的时候呢? GPU 至少 80 个以上
2. 还TMD的温度温度 温度参数 真是傻逼
阿狗用的经典的CNNs里面用的经典退火算法拟合 只是用了一个参数原理
3. 阿狗和以前计算机象棋最大的不同在于把棋局当成一幅图像 一幅图像 一幅图像 来
处理 由图像来判定占面积多少 和输赢概率 所以经常让人觉得大局观很不错 而不是象
棋的顺序控制过程
o*****p
发帖数: 2977
5
绝对扯jb蛋。

【在 w*********g 的大作中提到】
: 【 以下文字转载自 Programming 讨论区 】
: 发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming
: 标 题: 围棋人工智能Master只用了一个GPU(转)
: 发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东)
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招

d****o
发帖数: 32610
6
就是个SA的原理罢了

【在 S******t 的大作中提到】
: 还加了一个heat parameter
: 说是master会有时候选择第四好或者第五好的棋。 这真是完爆人类玩家。 人类一见到
: 乱走的,下快棋就直接傻了。看来人类才是计算机,根本不懂变通。

o*****p
发帖数: 2977
7
李世石比赛的Alphago用了一万个量级的gpu,告诉我现在用一个,绝对瞎jb扯淡。
https://zhuanlan.zhihu.com/p/24666144
当然,两边资源投入的量级完全不同。在八月份美国围棋大会上,我有幸见到了
AlphaGo的主要贡献者黄士杰(AjaHuang)和樊麾。我问他们,我们用了大概80到90块GPU
来训练模型,我是否可以在演讲时说我们用了AlphaGo百分之一的GPU?
那时Aja神秘地笑了笑说:具体数字不能讲。不过,也许小于百分之一吧。

【在 C**********e 的大作中提到】
: 作者真是弱智 可能是文科生
: 1. 一个GPU 说的没错 测试和比赛时一个GPU接显示器确实够用了
: 训练的时候呢? GPU 至少 80 个以上
: 2. 还TMD的温度温度 温度参数 真是傻逼
: 阿狗用的经典的CNNs里面用的经典退火算法拟合 只是用了一个参数原理
: 3. 阿狗和以前计算机象棋最大的不同在于把棋局当成一幅图像 一幅图像 一幅图像 来
: 处理 由图像来判定占面积多少 和输赢概率 所以经常让人觉得大局观很不错 而不是象
: 棋的顺序控制过程

w********g
发帖数: 3780
8
破熊不懂专业,乱转文章
w***o
发帖数: 1806
9
这和说人类进化几百万代一个意思,难道李世石是一个人,不是他祖先几百万代进化的
结果?看来人也是用了几百万了

GPU

【在 o*****p 的大作中提到】
: 李世石比赛的Alphago用了一万个量级的gpu,告诉我现在用一个,绝对瞎jb扯淡。
: https://zhuanlan.zhihu.com/p/24666144
: 当然,两边资源投入的量级完全不同。在八月份美国围棋大会上,我有幸见到了
: AlphaGo的主要贡献者黄士杰(AjaHuang)和樊麾。我问他们,我们用了大概80到90块GPU
: 来训练模型,我是否可以在演讲时说我们用了AlphaGo百分之一的GPU?
: 那时Aja神秘地笑了笑说:具体数字不能讲。不过,也许小于百分之一吧。

o*****p
发帖数: 2977
10
胡扯啥。深度学习没有技术进步的情况下,运算数量级降了4个?这么绝对惊天动地的
结果talk里面不讲,回答问题的时候讲出来了 ---- 说明也不是想保密,就是没说,这
符合常识么?

【在 w***o 的大作中提到】
: 这和说人类进化几百万代一个意思,难道李世石是一个人,不是他祖先几百万代进化的
: 结果?看来人也是用了几百万了
:
: GPU

相关主题
阿发狗竟然赢李世石了?完了,我的世界崩溃了!AlphaGo的真正可怕之处
Re: 李世石是不是对alphago的下棋方法了解太少了 (转载)zt AlphaGo可能会发现另外一种围棋美,是我们想象不到的 (转载)
生命科学角度看AI科技部部长万钢回应围棋人机大战 称中国象棋是未来研发方向
进入Military版参与讨论
t******e
发帖数: 2504
11
和小李比赛好像是1700个GPU,但网上60连胜的master只有1个GPU的消息应该有可靠的
, 当时新年aja黄在台湾度假期间上网比赛的, 大过年的, 估计英美也不太可能有什
么人还在上班, 因而也没有机会用分布式, 估计当时就是一个单机。
w***o
发帖数: 1806
12
学习完的结果由一个GPU用,这和进化和学习是一样的概念。李世石也是进化和向很多
人学习知识来的
学习的结果是可以拷贝给多台机器去单独比赛的。
s*****V
发帖数: 21731
13
训练的时候需要大量的GPU,台上十分钟,台下十年功
y****g
发帖数: 36950
14
应该是这样,训练时需要大量计算机取得数据,最后用一个GPU调取这些数据就够了

【在 C**********e 的大作中提到】
: 作者真是弱智 可能是文科生
: 1. 一个GPU 说的没错 测试和比赛时一个GPU接显示器确实够用了
: 训练的时候呢? GPU 至少 80 个以上
: 2. 还TMD的温度温度 温度参数 真是傻逼
: 阿狗用的经典的CNNs里面用的经典退火算法拟合 只是用了一个参数原理
: 3. 阿狗和以前计算机象棋最大的不同在于把棋局当成一幅图像 一幅图像 一幅图像 来
: 处理 由图像来判定占面积多少 和输赢概率 所以经常让人觉得大局观很不错 而不是象
: 棋的顺序控制过程

S*E
发帖数: 3662
15
GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。
CPU才是传统电脑的智能呀。你知道用了多少CPU吗?

【在 w*********g 的大作中提到】
: 【 以下文字转载自 Programming 讨论区 】
: 发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming
: 标 题: 围棋人工智能Master只用了一个GPU(转)
: 发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东)
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招

n****4
发帖数: 12553
16
才一个gpu? 咋不说只一个管子呢

【在 w*********g 的大作中提到】
: 【 以下文字转载自 Programming 讨论区 】
: 发信人: ananpig (●○ 围棋数学一把抓的安安猪), 信区: Programming
: 标 题: 围棋人工智能Master只用了一个GPU(转)
: 发信站: BBS 未名空间站 (Sun Mar 26 15:24:24 2017, 美东)
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招

t******g
发帖数: 4044
17
纠结用几个gpu都没意义,过几十年一个手机手表的计算能力就超过今天的几百个gpu。
总之就是围棋不是什么人工智能的禁区,和任何其他固定规则的游戏一样,人类被计算
机完爆。

【在 t******e 的大作中提到】
: 和小李比赛好像是1700个GPU,但网上60连胜的master只有1个GPU的消息应该有可靠的
: , 当时新年aja黄在台湾度假期间上网比赛的, 大过年的, 估计英美也不太可能有什
: 么人还在上班, 因而也没有机会用分布式, 估计当时就是一个单机。

a********i
发帖数: 1611
18
GPU的多线程处理早就被搞计算的用了多少年了

【在 S*E 的大作中提到】
: GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。
: CPU才是传统电脑的智能呀。你知道用了多少CPU吗?

t******e
发帖数: 2504
19
记错了, 不是1700, 是去年和小李比赛时是176个GPU。
master让专业棋手完全信服,如果只有一个GPU,那么人类就更被计算机完爆了。

【在 t******g 的大作中提到】
: 纠结用几个gpu都没意义,过几十年一个手机手表的计算能力就超过今天的几百个gpu。
: 总之就是围棋不是什么人工智能的禁区,和任何其他固定规则的游戏一样,人类被计算
: 机完爆。

T*********r
发帖数: 2953
20
哈哈哈
菌版的文化就是
屁都不懂,还能说的头头是道。

【在 S*E 的大作中提到】
: GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。
: CPU才是传统电脑的智能呀。你知道用了多少CPU吗?

相关主题
这个如果是真的,岂不是扇了某些人的大嘴巴?百度也要搞无人车 和围棋机器人了
华尔街日报:李世石不适合代表人类出战ZT电子科大专家参与研发的“高考机器人”,明年要考一本!
李世石:我再也不想下这样的比赛了。 (转载)日本开发的AI机器人连续四度考东大失败
进入Military版参与讨论
h*********n
发帖数: 11319
21
master重点是背后的神经
要训练这个网络需要上万个GPU
用这个网络没有一毛钱的技术含量。

【在 t******e 的大作中提到】
: 记错了, 不是1700, 是去年和小李比赛时是176个GPU。
: master让专业棋手完全信服,如果只有一个GPU,那么人类就更被计算机完爆了。

t******0
发帖数: 3757
22
我在椰胡下围棋,正好看了master那里的30场。。
实在是太牛了,绝对的控制力,布局怎么玩都不怕。。围棋就是计算,只要思路正确,
人怎么能算的过没有情绪化的机器呢
y****g
发帖数: 36950
23
CUDA听说过嘛

【在 S*E 的大作中提到】
: GPU不是图像处理吗?下围棋需要什么图像处理?输入输出都是人帮忙的。
: CPU才是传统电脑的智能呀。你知道用了多少CPU吗?

h******k
发帖数: 13418
24
麻痹的,文科生的那张狗嘴,不懂还瞎BB,小了误事,大了误国。
h******k
发帖数: 13418
25
你是来负责搞笑的吗,还尼玛调取数据。

【在 y****g 的大作中提到】
: 应该是这样,训练时需要大量计算机取得数据,最后用一个GPU调取这些数据就够了
y****g
发帖数: 36950
26
先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台
机器渲染
动画片,最后只要一台PC找到最MATCH的图像计算一下变化就能播放了嘛!
我本来就是来搞笑的。

【在 h******k 的大作中提到】
: 你是来负责搞笑的吗,还尼玛调取数据。
d*****u
发帖数: 17243
27
机器学习本来就是训练的时候数据量大,需要用GPU什么的来进行运算
预测的时候模型都是现成的了,很多时候甚至不用GPU都慢不到哪去
h******k
发帖数: 13418
28
先不说你这种算法多搞笑,从存在无数棋局里找MATCH本身就是计算量巨大的东西,那
是一个GPU能搞定的。在计算机算法中,一旦数据量达到一定的规模,复杂度就必然上
来了。

先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台

【在 y****g 的大作中提到】
: 先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台
: 机器渲染
: 动画片,最后只要一台PC找到最MATCH的图像计算一下变化就能播放了嘛!
: 我本来就是来搞笑的。

c*******9
发帖数: 9032
29
这个不是要精确的MATCH,只要比人脑精确。过两年,手机可以完成这个任务。

【在 h******k 的大作中提到】
: 先不说你这种算法多搞笑,从存在无数棋局里找MATCH本身就是计算量巨大的东西,那
: 是一个GPU能搞定的。在计算机算法中,一旦数据量达到一定的规模,复杂度就必然上
: 来了。
:
: 先几百台机器bake无数棋局的图谱模型,然后读取就是了。就好像渲染农场几百台

1 (共1页)
进入Military版参与讨论
相关主题
ZT电子科大专家参与研发的“高考机器人”,明年要考一本!李世石感觉状态不行啊
日本开发的AI机器人连续四度考东大失败阿发狗竟然赢李世石了?完了,我的世界崩溃了!
人工智能产业各国现状:BAT小打闹 国际巨头做长远Re: 李世石是不是对alphago的下棋方法了解太少了 (转载)
李开复:人工智能会让一半人失业 任正非:中国将空心化生命科学角度看AI
IJCAI 2018所有奖项出炉:AlphaGo获奖,中国研究成果占据半壁AlphaGo的真正可怕之处
奇闻录 | 周末段子荟萃 3-13 (转载)zt AlphaGo可能会发现另外一种围棋美,是我们想象不到的 (转载)
弈城惊现疑似谷歌团队ID 金灿佑:棋谱似人工智能科技部部长万钢回应围棋人机大战 称中国象棋是未来研发方向
人工智能都是扯淡,没有前途,就像三体,人类一个基础认识更新就摧枯拉朽这个如果是真的,岂不是扇了某些人的大嘴巴?
相关话题的讨论汇总
话题: gpu话题: master话题: 图像话题: 选点