MCTS是怎么判断形势的 - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - MCTS是怎么判断形势的

相关主题
● 第三局估计也没啥可看了	● 从第四盘棋看狗狗的弱点
● 第四盘阿法狗为啥要认输呀	● 写过程序的都知道
● 哈比斯说没用高手期局训练啊	● 看大家讨论中比较少提这个 reinforcement learning
● AI对价值的判断	● 69厉害啊
● 神经网络的结构决定了他的极限	● 归根结底，围棋这游戏超出了人类的物理极限
● 金明完9段点评AlphaGo: 缺点明显	● 蒙特卡罗是不是有天生缺陷？
● 原来阿尔法下的是５秒版的ＺＥＮ	● 狗程序设计有问题：目数加权太少，胜率权重太大，所以不杀龙
● 阿法狗生怕人类还不够绝望	● 李世石表情很痛苦

相关话题的讨论汇总
话题: mcts话题: alphago话题: 算棋话题: 局部话题: 走子

进入Go版参与讨论

(共1页)

L*********4
发帖数: 883

觉得虽然版上科普过但是还是很多人都不知道AlphaGo是怎么算棋的。
MCTS算棋的方法是，根据一个快速的评估函数，加上一定的随机性，直接走子，然后对
方再用同样的评估函数加上随机性直接走子，一直走到棋局结束。注意：是一直走到棋
局结束然后看谁赢！也就是跟那些电视评棋的人一样，都是第一感连着往下摆，但是他
会一直摆到对局结束！他可能会摆上几个变化，但是都是一个子一个子一直摆下去的，
不是像普通码农想象的是什么剪枝搜索的。
他不是局部搜索的。他的局部对杀未必有alpha-beta剪枝算法强，所以AlphaGo另外有
一个policy network来处理局部的情况，这个policy network算路未必很远，而这可能
就是其弱点。由于MCTS的存在，AlphaGo的paper里面说，他搜索的棋局数尚且不如20年
前的深蓝多。所以这就是为啥我说先拿稳实地，然后要不吃大龙要不治孤跑大龙才是跟
AlphaGo对战的窍门。

e*g
发帖数: 4981

这要摆多少个终局？

(共1页)

进入Go版参与讨论

相关主题
● 李世石表情很痛苦	● 神经网络的结构决定了他的极限
● 现在是不是确定alpha狗可以对人类让先了？ (转载)	● 金明完9段点评AlphaGo: 缺点明显
● 围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法	● 原来阿尔法下的是５秒版的ＺＥＮ
● 罗洗河让AlphaGo四子的说法没有什么错	● 阿法狗生怕人类还不够绝望
● 第三局估计也没啥可看了	● 从第四盘棋看狗狗的弱点
● 第四盘阿法狗为啥要认输呀	● 写过程序的都知道
● 哈比斯说没用高手期局训练啊	● 看大家讨论中比较少提这个 reinforcement learning
● AI对价值的判断	● 69厉害啊

相关话题的讨论汇总
话题: mcts话题: alphago话题: 算棋话题: 局部话题: 走子

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天