由买买提看人间百态

topics

全部话题 - 话题: deepmind
首页 上页 1 2 3 4 5 6 7 8 9 10 (共10页)
D*******r
发帖数: 2323
1
这个最后会公开,不过从上个星期deepmind在一个人工智能研讨会上做的报告看,知道
以下几个事实:
1. 去年10月的阿法狗对去年4月的阿法狗的胜率是100%。
2. 他们清楚知道李世石对樊麾的胜率高达97%。
3. 他们认为今年三月阿法狗和李世石胜率五五开。
我猜测,是因为他们今年三月的阿法狗对去年十月的阿法狗胜率达到了97%以上,才敢
说和李世石五五开。
另外,小道消息说樊麾后来是加入他们团队帮助评测阿法狗的,樊麾被打到让两子完全
没有机会。
a****a
发帖数: 98
2
deepmind co-founder is half chinese (his mom is chinese singaporean)
可以high了吧
a******0
发帖数: 121
3
昨晚看的是 Deepmind 的 youtube 直播。Michael Redmond (9P) 解说。
当 Alphago 右边打入时,Redmond 说在电视屏幕上看到李世石笑了。大概是苦笑吧,
后悔右边没有先手交换掉。
网上评论多认为,李世石输棋的主因是左下攻击不力、落了后手,被白棋打入。
如黑79手在N11先手刺,白棋右边打入就不存在了吧?
c*****d
发帖数: 527
4
樊麾那几盘棋时应该还属于阿狗的测试阶段,各种可能性都让试。
他后来做了deepmind的consultant,又和alpha下了很多盘。
alphago使用蒙特卡罗搜索树,蒙特卡罗算法的局限性就是打劫处理。
比如另一个基于蒙特卡罗算法的机器人ZEN,和它下过棋都知道,
ZEN会打劫,但是它经常打损劫,或者转换出现巨大失误。
这是算法的局限性,也是alphago可能存在禁劫协议的原因。
D*******r
发帖数: 2323
5
因为阿法狗没有对阵过顶尖职业棋手,所以deepmind是这么估算它的胜率的:
根据等级分,李世石对樊麾的胜率是97%;而今年三月的阿法狗对樊麾的胜率是100%,
所以间接推算,阿法狗和李世石棋力相当,胜率五五开。
他们没有指出的是,那是阿法狗的下限,因为还没有人有实力测出阿法狗的上限。
c******i
发帖数: 10
6
来自主题: Go版 - 这只狗是不是最强的狗?
http://www.techweb.com.cn/column/2016-03-08/2291955.shtml
请看这里:
发布会上,DeepMind创始人哈萨比斯解释为何此次会使用单机的AlphaGo,他说:“因
为分布式对单机的胜率只有70%,所以最后还是决定使用单机参赛。”
i***h
发帖数: 12655
7
两年前说很正常
樊麾以后这么说就是闭关锁国了

deepmind
r*g
发帖数: 3159
8
一年前这个BBS有长贴讨论,那可在alphago之前,不少人都并不觉得围棋有什么质的不
同。
发信人: bostontennis (bostontennis), 信区: Military
标 题: 所谓电脑不能赢围棋冠军的思维误区
发信站: BBS 未名空间站 (Thu Feb 26 15:37:07 2015, 美东)
认为电脑不能赢围棋冠军的人,会跟你证明围棋多么复杂,每一步选择这么多,所以这
个问题的难度是象棋的多少个数量级。这就能推论出电脑不能赢围棋冠军了么?
能够严格逻辑思考的人马上就能发现这个推论的逻辑漏洞:他们把赢围棋冠军等同于解
决围棋问题了。围棋本身是个复杂的问题,这个不错。目前人类给出的最优解就是那几
个世界冠军。所以只要电脑比人脑算得更好就可以了,不需要彻底解决这个问题。
类似的逻辑悖论是,老虎来了,你得比老虎跑得快才能脱险。其实不是的,你比同伴快
就够了。

deepmind
H*******1
发帖数: 242
9
引言:
我不知道这篇文章要怎么开头。
没有言语能够形容我现在的心情。
19年前,围棋入门课,用十个棋子在中腹摆出两眼活棋。
4年前,挥别围棋赛场,进了大学。
怎么也想不到,在今天,竟然会为了一张棋谱,我哭了。
哭得很开心。
我不知道这世界上还有几人与我此时有同样的感受。或许有,绝不会多。
我不奢求读到此文的人都能理解我在说什么。
但是,我要把我看到的记下来。
不是纪念,而是感激。
我发现,在情绪中,我只能记录下我的情绪,却无法写出这情绪的由来。虽然我自
认为清楚地知道它的由来。
写一篇抒情的文章很容易,但没有什么太大的价值。我看到的东西,这似乎应该用
“美”来表示的这种东西,难以抽象成语言将它描绘。于是,我只好等到情绪消退,从
理性出发,试着把因果呈现。
这样,会有更多人享受到这种美吗?
我不知道。
或许可以试试。
深夜。终于可以动笔。
2016年3月10日,AlphaGo对阵李世石,人机大战第二局。
对于这盘棋,虽然分歧远小于上一盘,但职业棋手之间仍然有许多互不相同的看法。
或许随着时间的前行,这些看法最终会汇流为一。但在今天,在故事发生的当下,
面对经验以外的事情,人类观点的多元无... 阅读全帖
x**w
发帖数: 7947
10
这应该不是狗家什么其他机器人。就是alphago前身。自学玩atari游戏的。deepmind的
目标是发展通用AI,不针对单一任务。只是现在还没摸到门(大家都没摸到)。
k*******r
发帖数: 355
11
这个不算alphago前身。这是deepmind的不同项目组,追求目的不同,学习算法也就完
全不同。
y****2
发帖数: 1017
12
公司没上市就被Google买了啊
D*******r
发帖数: 2323
13
黄士杰在一月份的时候就发过帖说:柯洁确实很强,但是围棋A I很快会让他胜率达不
到5%。
所以,早在一月份,deepmind内部的测试数据肯定已经证明了阿法狗的elo rating已经
远远高出人类顶尖棋手了。
再看看两次视频直播里,黄士杰气定神闲地,在任何一个人类棋手认为李世石占优的时
候都没有过任何紧张与不安。其实,结果是什么他早知道了,唯一就是想看看过程。
这么想,谷歌确实有点不厚道啊。这一幕,让我想起棋魂里的一幕,连子都不会拿的进
藤光坐在塔矢亮的对面,在棋盘上以下指导棋一样的招法碾压对手,藤原左为默默地俯
视着这孩子。
D*******r
发帖数: 2323
14
黄士杰在一月份的时候就发过帖说:柯洁确实很强,但是围棋A I很快会让他胜率达不
到5%。
所以,早在一月份,deepmind内部的测试数据肯定已经证明了阿法狗的elo rating已经
远远高出人类顶尖棋手了。
再看看两次视频直播里,黄士杰气定神闲地,在任何一个人类棋手认为李世石占优的时
候都没有过任何紧张与不安。其实,结果是什么他早知道了,唯一就是想看看过程。
这么想,谷歌确实有点不厚道啊。这一幕,让我想起棋魂里的一幕,连子都不会拿的进
藤光坐在塔矢亮的对面,在棋盘上以下指导棋一样的招法碾压对手,藤原左为默默地俯
视着这孩子。
c*****t
发帖数: 10738
15
来自主题: Go版 - 现在最爽的是黄aja
作为整个team里唯一的老中,名列第一作者,另外一个一作是老板。以前自己独立写过
很强的围棋程序。博士硕士论文全都是围棋程序。各种线索让我觉得主要idea来自他的
可能性很大,很有可能deepmind take on 这个project都是因为他。
e********9
发帖数: 444
16
来自主题: Go版 - 现在最爽的是黄aja
David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
AlphaGo绝对是很多年的积累。
S*E
发帖数: 3662
17
可能是黄的账号被猜是机器人后干脆弄了个普通软件挂在那里。
j**********r
发帖数: 3798
18
是因为反悔水平跟专业高手还是有差距吧。
e********9
发帖数: 444
19
David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
AlphaGo绝对是很多年的积累。
e********9
发帖数: 444
20
David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
查了一下huang的linkedin
台湾博士毕业后到UofAlberta做博士后,应该是跟Muller做Go
这家伙硕士博士读10多年,也不容易
两位主要研发人员10多年研究经验,AlphaGo绝对是很多年的积累。
M*T
发帖数: 123
21
果然,Redmond 上来二话不说直接就问了第二局那个脱先中国流的布局走法是怎么出来
的。
而据那个deepmind的工程师解释,当时那个位置根据落子建议,是认为人类玩家只有千
分之一的可能会走,因此排在评估队列的末尾,几乎被排挤掉。但是经过计算阵列的推
演,最后居然是那个字综合价值最高,所以就选择了……
L********d
发帖数: 3820
22
来自主题: Go版 - 阿尔法狗为啥是英国狗?
deepmind是英国公司
c**v
发帖数: 1936
23
http://sports.sina.com.cn/go/2016-03-11/doc-ifxqhmve9080655.sht
引言:
我不知道这篇文章要怎么开头。
没有言语能够形容我现在的心情。
19年前,围棋入门课,用十个棋子在中腹摆出两眼活棋。
4年前,挥别围棋赛场,进了大学。
怎么也想不到,在今天,竟然会为了一张棋谱,我哭了。
哭得很开心。
我不知道这世界上还有几人与我此时有同样的感受。或许有,绝不会多。
我不奢求读到此文的人都能理解我在说什么。
但是,我要把我看到的记下来。
不是纪念,而是感激。
我发现,在情绪中,我只能记录下我的情绪,却无法写出这情绪的由来。虽然我自
认为清楚地知道它的由来。
写一篇抒情的文章很容易,但没有什么太大的价值。我看到的东西,这似乎应该用
“美”来表示的这种东西,难以抽象成语言将它描绘。于是,我只好等到情绪消退,从
理性出发,试着把因果呈现。
这样,会有更多人享受到这种美吗?
我不知道。
或许可以试试。
深夜。终于可以动笔。
2016年3月10日,AlphaGo对阵李世石,人机大战第二局。
对于这盘棋,虽然分歧远小于上一盘,但职业棋手之间仍然有许多... 阅读全帖
k*******r
发帖数: 355
24
论文链接https://gogameguru.com/i/2016/03/deepmind-mastering-go.pdf
github源代码链接 https://github.com/Rochester-NRT/AlphaGo
(当然代码是第三方根据论文严格复制的)
论文和源码都有了,呵呵
k*******r
发帖数: 355
25
论文链接https://gogameguru.com/i/2016/03/deepmind-mastering-go.pdf
github源代码链接 https://github.com/Rochester-NRT/AlphaGo
(当然代码是第三方根据论文严格复制的)
论文和源码都有了,呵呵
y***k
发帖数: 9459
26
这个人说的,基本上就是match2之前deepmind研究负责人在YouTube直播上说的那些话
。我记得是他说一般围棋选手偏重于局部得失,而对阿狗而言,如果有两个contingent
plan,一个是领先10目胜算百分之九十,一个是领先一目胜算百分之九十五,会选后者
y***k
发帖数: 9459
27
这个人说的,基本上就是match2之前deepmind研究负责人在YouTube直播上说的那些话
。我记得是他说一般围棋选手偏重于局部得失,而对阿狗而言,如果有两个contingent
plan,一个是领先10目胜算百分之九十,一个是领先一目胜算百分之九十五,会选后者
o***8
发帖数: 46
o***8
发帖数: 46
m**m
发帖数: 5500
30
回复你都嫌降低智商。这个是由deepmind选,选谁是人自己的决定。你想派谁你可以yy
,但没必要上来发大字报。
b***k
发帖数: 622
31
来自主题: Go版 - 最开心最赚的一定是樊麾
看来还是要做鸡头啊,这种掉馅饼的事情可遇不可求。
如果deepmind总部要是在美国,估计就找丰云,江鸣久他们了。
先不说他之前跟alphago下棋拿了多少钱,他后来加入团队做围棋技术咨询,这个工资
就少不了,肯定还是超级轻松的活(对职业棋手来说)。
e*g
发帖数: 4981
32
我是说把deepmind和google分开算
x**w
发帖数: 7947
33
deepmind是子公司。团队全是dm自己的。这个怎么算?
e*g
发帖数: 4981
34
google没有技术支持吗?光出钱?
也可以估计一下如果不是google,比如是中国土豪赞助,deepmind能不能搞成现在这样。
k*******r
发帖数: 355
35
问题是,没有goog出钱出名声,deepmind根本招不到最好的人才。
t********t
发帖数: 1264
36
大部分人都是拿到谷歌的钱后才招的,另外就是品牌,其他倒与谷歌关系不大。假如换
个东家叫什么360deepmind或者京东deepmind,也许招不来matthew lai这种人物了
t******a
发帖数: 1200
37
AlphaGo Nature 文章里有两三个作者是谷歌总部那边的,不是 deepmind 的。
d****o
发帖数: 443
38
中国土豪可能会让deepmind去炒房和炒股。
D*******r
发帖数: 2323
39
人类声称阿法狗是站在人类棋谱的肩膀上学习才达到今天的棋力的。
结果deepmind就说,下一个版本的阿法狗将删除所有人类棋谱的数据,只告诉阿法狗规
则和目标,由阿法狗从零开始自我学习。
看来阿法狗觉得人类的棋谱是被污染了的样本,把纯洁的小狗教坏了。
推测这只从零开始完全自学的狗,才将会下出石破天惊的新布局来。
t******l
发帖数: 10908
40
这个不一定有说的那么玄,绝大部分函数/系统迭代,初始条件的影响很大,有时能导
致结果是收敛还是发散的差别。
而其中不少关键初始条件/初始系数啥的,是设计者调试者经过尝试给出的,俗称
magic number。虽然很多系统设计者调试者可能根本不会下棋,但那些 magic number
是设计者调试者对其后面的数学模型的认知。
从这个角度说,除非 deepmind 能够不仅不用人类棋谱,而且把系统里所有的初始条件
和 magic number 都设在数学上的零点或极点,干干净净的开始狗咬狗进化。这样才够
狠。
当然,也有不排除生出震惊世界的棋局就是了。

:人类声称阿法狗是站在人类棋谱的肩膀上学习才达到今天的棋力的。
D******n
发帖数: 2965
41
倒不是看不起deepmind, 但他们这个目标比现在狗狗要更困难的多,至少理论上没有能
证明这个machine learning的过程一定是会converge的,弄不好会是个循环打圈圈。站
在人类的肩膀上来学习,虽说不能保证最终能收敛到神的水平,但可以保证打败人类。
现在狗狗能打败人,但不能说明能收敛到绝对正确的地步。
O**l
发帖数: 12923
42
不穷尽肯定都是local optima
但是纯MCT只受规则影响 没有任何heuristic
应该数据bias更小 理论上训练效果应该更好
这也是为什么deepmind想这样做的原因
a***m
发帖数: 5037
m*****n
发帖数: 3644
44
刚投了个简历
e*g
发帖数: 4981
45
怎么pay的
g***n
发帖数: 14250
46
去干嘛,当人肉陪练?
h*h
发帖数: 27852
47
实在是对对手了解太少了
我觉得deepmind可能同意。输是一定的,不过会好很多。不过现在这样确实震动更大
t******a
发帖数: 1200
48
关键是之前电脑围棋软件太烂,Zen, CrazyStone 之流才业五业六水平。小李估计即使
deepmind 技术逆天,达到职业五六段水平就不错了。
要知道当年深蓝挑战卡斯帕罗夫之前五六年,就有多次象棋软件战胜国际特级大师的记
录了 (相当于围棋战胜职业八段吧?)当时大家只是不觉得软件能战胜国际象棋第一人
而已。
h*********n
发帖数: 5789
49
人工智能领域学术上面并没有大的发展,真正的发展是在应用上面,说白了就是要投钱
,巨量的投钱。要像Google这样投入大量的资源到Deepmind这样的应用上面。
国内的研究都是散兵游勇的小打小闹,不成规模,跟用大刀长矛对上洋枪阵差不多。真
要Google把自动驾驶和电动汽车的结合搞起来,还有医疗上面的人工智能运用搞出来。
国内才会意识到自己的落后。
n******r
发帖数: 4455
50
狗狗是收购的deepmind公司,黑森林才两三个人的团队,开始做这个也晚很多,没法比的
首页 上页 1 2 3 4 5 6 7 8 9 10 (共10页)