由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - MCTS是怎么判断形势的
相关主题
第三局估计也没啥可看了从第四盘棋看狗狗的弱点
第四盘阿法狗为啥要认输呀写过程序的都知道
哈比斯说没用高手期局训练啊看大家讨论中比较少提这个 reinforcement learning
AI对价值的判断69厉害啊
神经网络的结构决定了他的极限归根结底,围棋这游戏超出了人类的物理极限
金明完9段点评AlphaGo: 缺点明显蒙特卡罗是不是有天生缺陷?
原来阿尔法下的是5秒版的ZEN狗程序设计有问题:目数加权太少,胜率权重太大,所以不杀龙
阿法狗生怕人类还不够绝望李世石表情很痛苦
相关话题的讨论汇总
话题: mcts话题: alphago话题: 算棋话题: 局部话题: 走子
进入Go版参与讨论
1 (共1页)
L*********4
发帖数: 883
1
觉得虽然版上科普过但是还是很多人都不知道AlphaGo是怎么算棋的。
MCTS算棋的方法是,根据一个快速的评估函数,加上一定的随机性,直接走子,然后对
方再用同样的评估函数加上随机性直接走子,一直走到棋局结束。注意:是一直走到棋
局结束然后看谁赢!也就是跟那些电视评棋的人一样,都是第一感连着往下摆,但是他
会一直摆到对局结束!他可能会摆上几个变化,但是都是一个子一个子一直摆下去的,
不是像普通码农想象的是什么剪枝搜索的。
他不是局部搜索的。他的局部对杀未必有alpha-beta剪枝算法强,所以AlphaGo另外有
一个policy network来处理局部的情况,这个policy network算路未必很远,而这可能
就是其弱点。由于MCTS的存在,AlphaGo的paper里面说,他搜索的棋局数尚且不如20年
前的深蓝多。所以这就是为啥我说先拿稳实地,然后要不吃大龙要不治孤跑大龙才是跟
AlphaGo对战的窍门。
e*g
发帖数: 4981
2
这要摆多少个终局?
1 (共1页)
进入Go版参与讨论
相关主题
李世石表情很痛苦神经网络的结构决定了他的极限
现在是不是确定alpha狗可以对人类让先了? (转载)金明完9段点评AlphaGo: 缺点明显
围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法原来阿尔法下的是5秒版的ZEN
罗洗河让AlphaGo四子的说法没有什么错阿法狗生怕人类还不够绝望
第三局估计也没啥可看了从第四盘棋看狗狗的弱点
第四盘阿法狗为啥要认输呀写过程序的都知道
哈比斯说没用高手期局训练啊看大家讨论中比较少提这个 reinforcement learning
AI对价值的判断69厉害啊
相关话题的讨论汇总
话题: mcts话题: alphago话题: 算棋话题: 局部话题: 走子