由买买提看人间百态
登录
首页
论坛
未名存档
话题女王
小圈子
马甲追踪
版面排名
流量曲线
水枪排名
发帖量曲线
发帖版面饼图
发帖时间柱图
关于本站
帮助
boards
本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字
访问原贴
Go版
- MCTS是怎么判断形势的
相关主题
●
第三局估计也没啥可看了
●
从第四盘棋看狗狗的弱点
●
第四盘阿法狗为啥要认输呀
●
写过程序的都知道
●
哈比斯说没用高手期局训练啊
●
看大家讨论中比较少提这个 reinforcement learning
●
AI对价值的判断
●
69厉害啊
●
神经网络的结构决定了他的极限
●
归根结底,围棋这游戏超出了人类的物理极限
●
金明完9段点评AlphaGo: 缺点明显
●
蒙特卡罗是不是有天生缺陷?
●
原来阿尔法下的是5秒版的ZEN
●
狗程序设计有问题:目数加权太少,胜率权重太大,所以不杀龙
●
阿法狗生怕人类还不够绝望
●
李世石表情很痛苦
相关话题的讨论汇总
话题: mcts
话题: alphago
话题: 算棋
话题: 局部
话题: 走子
进入Go版参与讨论
1
(共1页)
L*********4
发帖数: 883
1
觉得虽然版上科普过但是还是很多人都不知道AlphaGo是怎么算棋的。
MCTS算棋的方法是,根据一个快速的评估函数,加上一定的随机性,直接走子,然后对
方再用同样的评估函数加上随机性直接走子,一直走到棋局结束。注意:是一直走到棋
局结束然后看谁赢!也就是跟那些电视评棋的人一样,都是第一感连着往下摆,但是他
会一直摆到对局结束!他可能会摆上几个变化,但是都是一个子一个子一直摆下去的,
不是像普通码农想象的是什么剪枝搜索的。
他不是局部搜索的。他的局部对杀未必有alpha-beta剪枝算法强,所以AlphaGo另外有
一个policy network来处理局部的情况,这个policy network算路未必很远,而这可能
就是其弱点。由于MCTS的存在,AlphaGo的paper里面说,他搜索的棋局数尚且不如20年
前的深蓝多。所以这就是为啥我说先拿稳实地,然后要不吃大龙要不治孤跑大龙才是跟
AlphaGo对战的窍门。
e*g
发帖数: 4981
2
这要摆多少个终局?
1
(共1页)
进入Go版参与讨论
相关主题
●
李世石表情很痛苦
●
神经网络的结构决定了他的极限
●
现在是不是确定alpha狗可以对人类让先了? (转载)
●
金明完9段点评AlphaGo: 缺点明显
●
围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法
●
原来阿尔法下的是5秒版的ZEN
●
罗洗河让AlphaGo四子的说法没有什么错
●
阿法狗生怕人类还不够绝望
●
第三局估计也没啥可看了
●
从第四盘棋看狗狗的弱点
●
第四盘阿法狗为啥要认输呀
●
写过程序的都知道
●
哈比斯说没用高手期局训练啊
●
看大家讨论中比较少提这个 reinforcement learning
●
AI对价值的判断
●
69厉害啊
相关话题的讨论汇总
话题: mcts
话题: alphago
话题: 算棋
话题: 局部
话题: 走子
未名新帖统计
// 7月16日
#
版面
帖数(主题数)
-
全站
4871 (796)
1
Military
3777 (569)
2
Stock
341 (51)
3
Joke
117 (17)
4
History
116 (3)
5
Automobile
100 (9)
6
USANews
55 (9)
7
Midlife
45 (1)
8
Headline
41 (41)
9
Dreamer
33 (13)
10
FleaMarket
32 (20)
11
Living
30 (7)
* 这里只显示发帖超过25的版面,努力灌水吧:-)
历史上的今天
faintcat妹妹看进来~~
发表于12年前.
NSC, PD 1/7/2007, EB2, ...
发表于11年前.
[FBA求购]MJVE2 758 MJVM2 ...
发表于6年前.
老生常谈,归与不归
发表于10年前.
【申请】Seattle西雅图 版版主——申请人...
发表于9年前.
宝宝出生,头骨骨折,求祝福
发表于9年前.
求推荐舒缓优美的古典音乐
发表于11年前.
百分之一的北京人上北大 中国网友愤怒(转载)
发表于10年前.
新人带狗狗Bailey来报道
发表于12年前.
全世界最有价值的运动队
发表于10年前.
请问大切诺基的质量如何
发表于6年前.
TNND,军版全是BKC
发表于15年前.
Inception
发表于12年前.
微软的有些家属可真恶心,为了卖保险脸都不要了
发表于10年前.
每周坐高铁的苦逼来说说感受吧!!
发表于9年前.