由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 说说human learning吧
相关主题
ALPHAGO输棋分析之二 -- 原理看阿法狗的自战棋谱有彻底崩溃的感觉
当年跟皇军作战,比这绝望多了向李昌镐致敬
阿法狗第二局最令人震惊的地方在于又一个布局请大家点评
仔细想了一下,阿法狗的算法在劫争上完全没有漏洞古狗不马上跃柯姐,估计以后也不会约了
金志锡:让我两个可能是好胜负阿法狗经常把保留的变化走掉
其实李下得并不好master 布局一般 中盘厉害
我看阿法狗右下损失相当有限阿法狗下围棋离人类还差的远
樊麾在欧洲围棋大会上公开了很多阿发狗内幕阿法狗应该如何使用自由时间?
相关话题的讨论汇总
话题: learning话题: human话题: 小李话题: 函数话题: policy
进入Go版参与讨论
1 (共1页)
D******n
发帖数: 2965
1
先搞个阿而发狗拷贝, 然后让小李好好读读Evaluation函数和Policy函数,这样小李
能下过阿而发狗吗?
不能光让机器狗钻人的空子,人也应该有机会学学狗啊
L********d
发帖数: 3820
2
关键人类的计算搜索能力太弱

【在 D******n 的大作中提到】
: 先搞个阿而发狗拷贝, 然后让小李好好读读Evaluation函数和Policy函数,这样小李
: 能下过阿而发狗吗?
: 不能光让机器狗钻人的空子,人也应该有机会学学狗啊

D******n
发帖数: 2965
3
如果Policy函数收敛了,那人死背函数不就成了。就跟大家现在用计算器一样,谁在乎
它怎么算的?

【在 L********d 的大作中提到】
: 关键人类的计算搜索能力太弱
o*****p
发帖数: 2977
4
让谷歌把Alphago对弈的每一步胜率估计表打印出来给小李就可以了。
这个不给相当于下完棋不让小李复盘,对小李是非常不公平的。

【在 D******n 的大作中提到】
: 先搞个阿而发狗拷贝, 然后让小李好好读读Evaluation函数和Policy函数,这样小李
: 能下过阿而发狗吗?
: 不能光让机器狗钻人的空子,人也应该有机会学学狗啊

D*******r
发帖数: 2323
5
应该没戏,它的决策系统牵扯的计算量太大,人类没法handle,依葫芦画瓢似地学招法
没用。
现在能想到的唯一可学习的方法是,让它来分析人类棋手棋谱中的每一个我们本来以为
正确的应手是不是大致正确。比如说,我们以为是本手的应手,或者我们认为是两分的
局面,而在阿法狗看来,是胜率陡降。
然后让它分析一些经典布局,看看是不是真的两分,或者结论和人类以为的一样。这样
可能对人类的围棋理念能有一个质的改变和提升。
至于中盘手法,脱先转换,眼花缭乱的官子收束这些,人就不要学了,计算力达不到,
只会弄巧成拙。

【在 D******n 的大作中提到】
: 先搞个阿而发狗拷贝, 然后让小李好好读读Evaluation函数和Policy函数,这样小李
: 能下过阿而发狗吗?
: 不能光让机器狗钻人的空子,人也应该有机会学学狗啊

D******n
发帖数: 2965
6
如果policy函数真是已经收敛了,那还要计算何用?死背就成了。

【在 D*******r 的大作中提到】
: 应该没戏,它的决策系统牵扯的计算量太大,人类没法handle,依葫芦画瓢似地学招法
: 没用。
: 现在能想到的唯一可学习的方法是,让它来分析人类棋手棋谱中的每一个我们本来以为
: 正确的应手是不是大致正确。比如说,我们以为是本手的应手,或者我们认为是两分的
: 局面,而在阿法狗看来,是胜率陡降。
: 然后让它分析一些经典布局,看看是不是真的两分,或者结论和人类以为的一样。这样
: 可能对人类的围棋理念能有一个质的改变和提升。
: 至于中盘手法,脱先转换,眼花缭乱的官子收束这些,人就不要学了,计算力达不到,
: 只会弄巧成拙。

1 (共1页)
进入Go版参与讨论
相关主题
阿法狗应该如何使用自由时间?金志锡:让我两个可能是好胜负
接下来的李世石,将是痛不欲生的三局对局其实李下得并不好
李世石应该把阿法狗当成活人来下我看阿法狗右下损失相当有限
韩国棋手刘昌赫不认为阿法狗就完美了樊麾在欧洲围棋大会上公开了很多阿发狗内幕
ALPHAGO输棋分析之二 -- 原理看阿法狗的自战棋谱有彻底崩溃的感觉
当年跟皇军作战,比这绝望多了向李昌镐致敬
阿法狗第二局最令人震惊的地方在于又一个布局请大家点评
仔细想了一下,阿法狗的算法在劫争上完全没有漏洞古狗不马上跃柯姐,估计以后也不会约了
相关话题的讨论汇总
话题: learning话题: human话题: 小李话题: 函数话题: policy