由买买提看人间百态

topics

全部话题 - 话题: uct
1 (共1页)
h*h
发帖数: 27852
1
看来电脑围棋压倒人类就在今年了:电脑对人 = 几十万个职业三段 围殴 一个人
发信人: softmagic (魔术师), 信区: Weiqi
标 题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义,那些都是离线做好的,
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在:
1.每个局面下,越有“合理招法”希望的落子,会被更多的“研讨对局”,通常比如当前
局面下,最有希望的落子位置会比,希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法,理论上来说,UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是,在研讨过程中,他们的各个局部的研究结论会以一种
高效的形式彼此沟通,换... 阅读全帖
h*h
发帖数: 27852
2
发信人: softmagic (魔术师), 信区: Weiqi
标 题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义,那些都是离线做好的,
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在:
1.每个局面下,越有“合理招法”希望的落子,会被更多的“研讨对局”,通常比如当前
局面下,最有希望的落子位置会比,希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法,理论上来说,UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是,在研讨过程中,他们的各个局部的研究结论会以一种
高效的形式彼此沟通,换句话说,关于目前局面发现出来的知识是共享的。
这个非常有用是因为研讨的局面非常... 阅读全帖
h*h
发帖数: 27852
3
看来电脑围棋压倒人类就在今年了:电脑对人 = 几十万个职业三段 围殴 一个人
发信人: softmagic (魔术师), 信区: Weiqi
标 题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义,那些都是离线做好的,
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在:
1.每个局面下,越有“合理招法”希望的落子,会被更多的“研讨对局”,通常比如当前
局面下,最有希望的落子位置会比,希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法,理论上来说,UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是,在研讨过程中,他们的各个局部的研究结论会以一种
高效的形式彼此沟通,换... 阅读全帖
h*********n
发帖数: 11319
4
不一样
阿发狗相当于用神经网络来优化搜索。练习的时候相当于训练这个神经网络,昨天是实
际用上这个神经网络
举个网友的解释
发信人: softmagic (魔术师), 信区: Weiqi
标 题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义,那些都是离线做好的,
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在:
1.每个局面下,越有“合理招法”希望的落子,会被更多的“研讨对局”,通常比如当前
局面下,最有希望的落子位置会比,希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法,理论上来说,UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是,在研讨过程中,他们的各个局... 阅读全帖
h*h
发帖数: 27852
5
【 以下文字转载自 Military 讨论区 】
发信人: hsh (三胡), 信区: Military
标 题: 看来电脑围棋压倒人类就在今年了
发信站: BBS 未名空间站 (Wed Mar 9 19:58:43 2016, 美东)
看来电脑围棋压倒人类就在今年了:电脑对人 = 几十万个职业三段 围殴 一个人
发信人: softmagic (魔术师), 信区: Weiqi
标 题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义,那些都是离线做好的,
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在:
1.每个局面下,越有“合理招法”希望的落子,会被更多的“研讨对局”,通常比如当前
局面下,最有希望的... 阅读全帖
c****s
发帖数: 5892
6
温哥华国际机场加油主管和资方的纠纷仍未获解决,但加拿大航空(Air Canada)在19日仅有少数班次因加油作业而延误。
全球地面油料服务公司(Globe Ground Fuel Service)在与加拿大运输工会(UCTE)的谈判破裂后,19日凌晨1时强制其加油主管停工。这是加油主管第一次寻求集体协议。
该公司表示撤换加油主管,並保证没有班机会因而延误。
温哥华国际机场官员劳伦斯(Alana Lawrence)表示,劳资纠纷对於飞航没有影响,也没有班机因為加油而延误。
加拿大航空则表示加油仅有非常小的影响,仅有三个架次產生延误。
但是UCTE地区副会长敦斯摩尔(Stephen Dunsmore)则表示加航有五个架次受到影响,其中一架延误了27分鐘;此外,其他航空公司也有因加油作业而產生延误。
敦斯摩尔表示公司应该有找外面的加油员应急,但他听到一则消息表示有位驾驶员伸出头,告诉加油员哪裡可以找到加油孔。
敦斯摩尔希望能和资方尽快重新恢復谈判。
O**l
发帖数: 12923
7
来自主题: Go版 - 欧洲杯的题外话
Computer Go
这行主要都是游击战 最多也就拿个32core 电脑和人下下
编程的人也多数是业余兴趣爱好 没谁真专注的去优化
没有IBM这样的巨头参与 但是理论上来说 已经没什么吸引人的地方
先优化 再拿台巨型机run UCT(UCT本身就非常适合并行)
快速converge 根本没什么太大问题
a*******g
发帖数: 4872
8
来自主题: Zhejiang版 - [合集] 突然很想很想吃香煎带鱼
☆─────────────────────────────────────☆
mey (玫) 于 (Tue Apr 13 15:38:57 2010, 美东) 提到:
终于吃饭的时候突然想起了香煎带鱼,很想吃。
正在犹豫要不要下班后奔赴中国城买带鱼。。。
☆─────────────────────────────────────☆
idler (还是戒网吧) 于 (Tue Apr 13 15:58:45 2010, 美东) 提到:
买!!!!!!!!偶有一次特想吃红烧带鱼,就让LG买了回来自己做了

☆─────────────────────────────────────☆
idler (还是戒网吧) 于 (Tue Apr 13 16:06:46 2010, 美东) 提到:
我今天去饭馆吃饭准备点个豆花鱼片,很好吃的,朋友过来面试FACULTY职位,正好有
机会腐败一下
☆─────────────────────────────────────☆
rainbowcross (落瑛惊风) 于 (Tue Apr 13 16:27:01 201... 阅读全帖
a***s
发帖数: 616
9
来自主题: Mathematics版 - 恳请帮忙一道概率题 在线等 Thanks!
Let N be the total number of 5-digit integers constructed from 0-9. Then N =
10^5.
How many combinantions are there if 25 different 5-digit integers are constr
ucted?
N*(N-1)*(N-2)* … *(N-24)
How many combinantions are there if 24 different 5-digit integers are constr
ucted? (2 of the 25 are the same and different from the other 23)
N*(N-1)*(N-2)* … *(N-23)

give
o***s
发帖数: 42149
10
万达集团的海外扩张触角或将再下一城。昨日,据香港经济报道,万达集团有意以10亿英镑收购英国电影院线;另据英国《每日电讯邮报》称,以董事长王健林领军的万达集团有意收购英国著名院线Odeon。报道指Odeon已经委任银行家负责出售事宜,目前正处于寻求意向买家初始阶段。随后,记者联系万达集团予以求证,对方不置可否。
据记者了解,该消息并非空穴来风。在今年5月,万达集团董事长王健林在接受记者专访时曾表示,在年内还将有多个海外并购的项目,其中包括院线企业。
早在2013年上半年,继成功收购了美国AMC影院后,万达就将视角瞄准了院线同样成熟的欧洲,当时,万达已经在接触英国的Odeon&UCT影院控股有限公司和Vue娱乐有限公司,两家公司总部都在英国。但由于各种原因,最后的并购并未“修成正果”。
根据万达集团官网资料显示,万达电影院线拥有影城187家,银幕总数1657块,其中IMAX银幕117块,占有全国14.5%的票房份额。2015年1月22日,万达院线在深交所成功上市。目前万达院线的市值超过1000亿元,成为全球市值第一的电影院线。
英国Odeon影院是一个兼有电影院、电玩、餐饮等的娱乐场所,万... 阅读全帖
O**l
发帖数: 12923
11
5毛也就这水平
uct 07年用在围棋上 当年9X9棋盘 人类就赢不了(这在07年以前根本不可想象)
用这个framework 剩下的东西基本就是暴力计算
现在在没有ibm这种超级公司支持 提供超级计算机的情况下
最顶级的程序基本是职业9段让6子水平 而且水平还在迅速提高
比你这5毛智商高多了
O**l
发帖数: 12923
12
来自主题: Military版 - 武宫正树让四子不敌软件
围棋现在最新的UCT+montecarlo
和A*也没啥质的区别
O**l
发帖数: 12923
13
赞这个说到点子上来
Uct一出来 9*9 立即无敌
19*19就是时间问题了
[在 hsh (三胡) 的大作中提到:]
:发信人: softmagic (魔术师), 信区: Weiqi
:标 题: 用一种真正便于棋手理解的方式解释alphago的算法
:...........
t***s
发帖数: 4666
14
来自主题: USANews版 - Trump Tax Calculator
反正最惨的是六七十万的一群人,本来sweet spot 很爽的。州税地产税按35辒uct,
marginal 收入按28% 交税。新税法下要多交几千到一万
d*********2
发帖数: 48111
15
来自主题: USANews版 - Trump Tax Calculator
还是这个贴比较客观
你们agi 六十七十万的也别装中产了,在哪你们也不是中产
我们纽约20,30万的即使在蓝区也是普遍减税的,要加也多不了多少
更不要说十来万的,兰州蓝区十来万default就是不买房的,他们省税省海了


: 反正最惨的是六七十万的一群人,本来sweet spot 很爽的。州税地产税按35辒
uct,

: marginal 收入按28% 交税。新税法下要多交几千到一万

m*r
发帖数: 37612
16
Holiday Return/Exchange Policy
Gift purchases made between November 1, 2010, and December 24, 2010, qualify
for our Holiday Return policy. Qualifying products may be returned through
January 31, 2011. In addition, for items purchased between November 1 and De
cember 24, customers will receive free phone and online support for all prod
ucts through January 31, 2011.
f****g
发帖数: 23666
17
来自主题: ebiz版 - hp开始confirm & cancel了
cancel信:
An item in order xxxxxxxx is not available and we are unable to fulfill yo
ur order as placed. We have cancelled your entire order and credited your se
lected payment method(s).
We sincerely apologize for any inconvenience this has caused.
If you need futher assistance with your order please contact us at 1-800-492
-3341.
An HP Product Specialist will attempt to contact you with a replacement prod
uct recommendation. In the meantime, we invite you to visit www.hpdirect.com
or call our P... 阅读全帖
c**t
发帖数: 2744
18
来自主题: Food版 - 有人用过Flavorwave Oven吗?
I'll be much better than regular microwave. Cookware.com offers similar prod
uct nuwave for $100 with free ground shipping. The official website eithe nu
wave or flavorwave will demostrate a lot "free" stuff, the S&H are expensive
, and they never tell you untill you pay.
H*****h
发帖数: 300
19
来自主题: NextGeneration版 - Enfamil made changes
from Enfamil:
Beginning mid-January, the age recommendation for our Stage 2 Enfagrow produ
cts will change from "1 year and up", to "9 months and up". Our Stage 2 prod
ucts include: Enfagrow Gentlease? Toddler, Enfagrow PREMIUM? Toddler (Unflav
ored) and Enfagrow Soy Toddler.
The Enfagrow PREMIUM Toddler Natural Milk flavor* will soon be replaced by E
nfagrow PREMIUM Toddler Unflavored Infant and Toddler Formula. Now older inf
ants and toddlers 9 months and up can enjoy the benefits of Enfagrow ... 阅读全帖
j******u
发帖数: 41683
20
来自主题: PennySaver版 - amazon能price match吗?
Only product(s) that say that they are eligible for Free Returns on the prod
uct detail page are eligible for Free Returns. Free Returns only applies to
product(s) fulfilled by Amazon. It does not apply to the same product(s) ful
filled by other sellers.要是都free return, amazon不用两月就被搞残了
k****a
发帖数: 7077
21
How would the people pay for the products given that they are paid like iota?

is
Those
people instead. Yes, this will cool off the economy, just like Japan a few
years ago, but the impact to the average Joe in China is not as great as you
expect. Otherwise being an open country, Japanese people would have
flushed to other countries after the exchange rate increase. In reality that
didn't happen. Being a lot denser than China and with few natural
resources, Japan is 100 times more reliant on s... 阅读全帖
m*****n
发帖数: 2152
22
来自主题: Stock版 - 我对AlphaGo的理解
AlphaGo的算法等技术分析
2016-03-10 田渊栋 算法与数据结构
来源:知乎专栏-远东轶事
作者:田渊栋(微博@远东轶事)
链接:http://zhuanlan.zhihu.com/yuandong/20607684
作者简介:田渊栋是卡耐基梅隆大学机器人系博士。曾就职于 Google X 部门,目前是
Facebook 的智能围棋 darkforest 的负责人和第一作者。
最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。
AlphaGo这个系统主要由几个部分组成:
1、走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。/2
2、快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度
要比1快1000倍。
3、估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。
4、蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,
形成一个完整的系统。
我们的DarkForest和AlphaGo同样是用4搭建的系统。Dar... 阅读全帖
t****g
发帖数: 35582
23
来自主题: Boston版 - 房东让我搬走
Rent Withholding
The Massachusetts Supreme Judicial Court ruled that when a landlord fails to
maintain a dwelling in habitable condition, a tenant may properly withhold
a portion of the rent from the date the landlord has notice of this breach o
f warrant of habit-ability. Rent withholding can be a useful tool to force r
epairs, but it is a serious step and should be dealt with carefully. You may
want to get legal advice before withholding your rent since the landlord ma
y try to evict you for n... 阅读全帖
t******u
发帖数: 876
24
你要不要试试DR. KO, 是个华人牙医,在UCT刚开业
具体信息,你问小黑妈,我是听她推荐,才决定试试.
我们上个星期去拔了晃动的乳牙,我觉得不错,蛮耐心,很为小朋友着想.很会哄小朋友.
我们家小朋友是很怕疼的,也是坐不住的,居然能被柯医生拔下了牙.
f***h
发帖数: 10
25
来自主题: SanDiego版 - 卖二手钢琴,UCT附近
带孩子来美访学,即将回国,购买的一架二手KNABE钢琴准备出售,送货上门,家住UTC
附近,感兴趣的可上门看,我电话,8589005285 邮箱:[email protected]
/* */
f***h
发帖数: 10
26
来自主题: SanDiego版 - 卖二手钢琴,UCT附近
带孩子来美访学,即将回国,购买的一架二手KNABE钢琴准备出售,送货上门,家住UTC
附近,感兴趣的可上门看,我电话,8589005285 邮箱:[email protected]
/* */
f***h
发帖数: 10
27
来自主题: SanDiego版 - 卖二手钢琴,UCT附近
自己顶
s**********o
发帖数: 14359
28
来自主题: SanDiego版 - 劳民伤财的MIDCOAST TROLLY
劳民伤财的MIDCOAST TROLLY,据说从UCT坐到OLD TOWN
要一个小时,车速慢,中间又走走停停,劳民伤财的修了
个慢火车.
s******g
发帖数: 755
29
How to Optimize your Conversion Rate without bothering your Tech Team
Danny Wong
POINTER
Con ver sion rate opti miza tion (CRO) is the hot new thing because of the
poten tial it has to dou ble your rev enue
with out dou bling your costs, which also allows you to increase your mar
ket ing bud gets and makes mar ket ing your
busi ness more prof itable.
Most com pa nies neglect CRO though, not because they don’t think it’s
impor tant, but because their tech team is pre
oc cu pied with many, many ot... 阅读全帖
l******n
发帖数: 492
30
In the wake of the CEO ousters at HP, Yahoo and Nokia and the CEO implosions
at Cisco, SAP, RIM and Dell, it’s surprising people are still picking on S
teve Ballmer. Hedge funders are calling for his head. Employees are complain
ing.
I am by no means a big Microsoft fan — during my five-year tenure at Sun Mi
crosystems, Microsoft was a vicious, scorched-earth competitor. But I have t
o give credit where credit is due: Ballmer has done a remarkable job, especi
ally in contrast to the leaders of m... 阅读全帖
z********0
发帖数: 9013
31
来自主题: Fitness版 - [bssd] 奔段视频
贴本书
The Russian Kettlebell Challenge: Xtreme Fitness for Hard Living Comrades
http://ebookbrowse.com/pavel-tsatsouline-russian-kettlebell-cha
4250497
http://ebookbrowse.com/gdoc.php?id=14250497&url=f351f511c250918
bafc
Review比较有意思
“Interesting stuff, but it's essentially just there to brag on how awesome
k-bell training is, and how Russians can, with vodka, cigarettes, and k-bell
s, to anything at all. There are better books out there, by the same author
and others. This one's mostly fluff. ”
“ ... 阅读全帖
z********0
发帖数: 9013
32
来自主题: Fitness版 - [bssd] 奔段视频
贴本书
The Russian Kettlebell Challenge: Xtreme Fitness for Hard Living Comrades
http://ebookbrowse.com/pavel-tsatsouline-russian-kettlebell-cha
4250497
http://ebookbrowse.com/gdoc.php?id=14250497&url=f351f511c250918
bafc
Review比较有意思
“Interesting stuff, but it's essentially just there to brag on how awesome
k-bell training is, and how Russians can, with vodka, cigarettes, and k-bell
s, to anything at all. There are better books out there, by the same author
and others. This one's mostly fluff. ”
“ ... 阅读全帖
w**t
发帖数: 94
33
【搜狐IT消息】两名匈牙利科学家称已经找到合适的算法,将能使围棋程序达到围棋职
业棋手的水平。
在匈牙利科学院计算机实验室Sztaki工作的Levente Kocsis表示:“我们距离达到
职业棋手的水平已经不远了。
”与以前的围棋软件相比,新算法更好地利用了计算机性能的提高。Kocsis说:“如果
采用两个处理器而不是一个,采用这一方法的程序能够立刻得到加强。”
在国际象棋中,程序能够评估棋子的价值,王后九分兵一分,但是这一方法对围棋
不适用,因为所有的子有同样的价值而局面却更复杂,计算机必须评估所有可能的走法
以便找出最好的走法,即使是最强大的计算机在这方面也无能为力。但是Kocsis和同事
Csaba Szepesvari找到了一种把重点放在最有希望的着法上的方法。
一盘棋可能的结果组成了一棵树图,以前的围棋程序无法扫描所有分叉就随机选择
一些样本,希望从中能撞上最好的着法。UCT(Upper Confidence bounds applied to
Trees,树图置信)方法则帮助计算机决定哪些分叉最值得认真考虑。(编译:搜狐IT
Unifytruth)
O**l
发帖数: 12923
34

你屁都不懂就不要扯了
现在就是UCT+montecarlo 暴力搜 ucb保证极快收敛都某几支
提出这个算法的人 围棋屁都不懂 目前做的最好的法国那帮人 也是没个特懂这玩意的
现在基本没人用knowledge 这方面论文从07年开始 一坨一坨的
S*****y
发帖数: 2871
O**l
发帖数: 12923
36
来自主题: Go版 - 好久没关注computer go了
19*19现在到什么程度了 有没有职业1的水平
还是靠暴力uct+monte carlo+heuristic吗
O**l
发帖数: 12923
37
来自主题: Go版 - 好久没关注computer go了
尼玛 用天顶围棋试了一下 memory根本没怎么涨 难道不是用uct做的
O**l
发帖数: 12923
38
来自主题: Go版 - 好久没关注computer go了
19*19现在到什么程度了 有没有职业1的水平
还是靠暴力uct+monte carlo+heuristic吗
O**l
发帖数: 12923
39
来自主题: Go版 - 好久没关注computer go了
尼玛 用天顶围棋试了一下 memory根本没怎么涨 难道不是用uct做的
O**l
发帖数: 12923
40
搞笑 MCT以前基于各种knowledge的heuristic search多了去了 谁能达到1d水平
没有UCB你加再多knowledge都没有 所以重要MCT不是heuristic
DCNN下得快当然了 就是过一遍NN DCNN其实就是UCT展开时候prune branch
不用MCT
你这玩意想也能想出来 应该勺子莫名其妙的棋一大把
而且局部对杀 你不计算用DCNN softmax一个最大值??? 开玩笑吧
有paper拿来看看嘛

AlphaGo
o*****p
发帖数: 2977
41
http://zhuanlan.zhihu.com/yuandong/20607684
原链接有Nature文章中的数据图,我就不转贴了。
最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。
AlphaGo这个系统主要由几个部分组成:
1. 走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。
2. 快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度
要比1快1000倍。
3. 估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。
4. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,
形成一个完整的系统。
我们的DarkForest和AlphaGo同样是用4搭建的系统。DarkForest较AlphaGo而言,在训
练时加强了1,而少了2和3,然后以开源软件Pachi的缺省策略 (default policy)部分
替代了2的功能。以下介绍下各部分。
1. 走棋网络:
走棋网络把当前局面作为输入,预测/采样下一步的走棋... 阅读全帖
M*****s
发帖数: 3436
42
来自主题: Go版 - AlphaGo的算法等技术分析
AlphaGo的算法等技术分析
2016-03-10 田渊栋 算法与数据结构
来源:知乎专栏-远东轶事
作者:田渊栋(微博@远东轶事)
链接:http://zhuanlan.zhihu.com/yuandong/20607684
作者简介:田渊栋是卡耐基梅隆大学机器人系博士。曾就职于 Google X 部门,目前是
Facebook 的智能围棋 darkforest 的负责人和第一作者。
最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。
AlphaGo这个系统主要由几个部分组成:
1、走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。/2
2、快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度
要比1快1000倍。
3、估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。
4、蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,
形成一个完整的系统。
我们的DarkForest和AlphaGo同样是用4搭建的系统。Dar... 阅读全帖
o*****p
发帖数: 2977
43
好了,我说错了,我想正确的说法是:我大体上是知道UCT的。我认为alpha说的胜率
只是它快速走子N盘以后的胜负比。
Alphago真牛到神之一手,那么一步棋下来,胜率立刻接近100%。或者和别人下几手
棋,胜率很快接近100% ---- Alphago的真实能力,可以判断为,它的胜率的收束速率。
它和李世石下,开始的时间,不但胜率没有从50%升高,还下降了,就说明李世石开始
的选择很不错,一直走在让它的胜率不增加的步上。这就界定了它的开局的能力没有我
们想象的那么牛。李世石是站在和它同一个数量级的水平上。
所以,柯洁不是没有一战之力。
o*****p
发帖数: 2977
44
不用管UCT了。我说过这个和我们的讨论其实无关。
你就想象:在4x4棋盘上,肯定能找到一步100%的胜率的棋。如果计算机在4x4棋盘上
,一个子下来,胜率还是50%,肯定是笑话。胜率99%也是笑话。
所以真正的厉害的神之一手的软件,在4x4上胜率必然是100%。
胜率没到100%,就是它还没算到。
然后你演申到19x19。要是它下棋还是50%的胜率,只能说明离神之一手还差很远。
而你在一段时间内能每个落子让它保持在胜率50%左右,这就说明这段时间内你和它的
水平不相上下。
O**l
发帖数: 12923
45
并不一定50%左右是水平差不多
很有可能是盘面变复杂 导致UCT converge减速
或者对手走了一个minmax里面下一个不是他认为最优top几的 搜索树要重新展开
等复杂的局面再走几步 就能迅速converge

alphago。
O**l
发帖数: 12923
46
恩 不可能开局的时候把所以东西都想好了
那成solve围棋了
其实他只要走缓了 基本就是他认为优势了
UCT的特性就是 局势不好的时候 会走的非常的aggressive
局势不好的时候 他会找你出错可能最大的分支下
但是这两盘 还没看到

坑。
O**l
发帖数: 12923
47
来自主题: Go版 - unreproducible bug!!!
也不难复制 就是否一手漏算 这手有事关大局 胜率瞬间狂降
几十亿节点的UCT树瞬间清空 丫就用一分钟随机挑一个 就乱下了
O**l
发帖数: 12923
48
来自主题: Go版 - 阿法狗怎样算气的?
SB完全不懂 又在这胡喷
“”你说算到底,你会下围棋吗?算到两方都pass,棋盘上还是非常tricky,有些地方
放会
减分,有些地方放会死。即使算到底,底有很多个,还是需要value network判断输赢
率来选择path。”
MCT每步只在tree上建一个node
然后用monte-carlo simulation到底根本不需要评估直接返回结果
大量算到底的采样 在树中反馈
UCB1保证1-0的结果快速收敛
蠢猪屁都不懂 你不会认为UCT的算到底的意思是穷极变化吧
“MCTS和UCB1根本做不了围棋AI,这两个不是什么新玩意,已经非常久的历史了”
你是从哪个平行宇宙穿越来的 MCT原理基于UCT 尼玛UCT2007年才提出
“MCTS和UCB1根本做不了围棋AI” 你这傻逼逗我 单独的MCTS可以做到业6
“主要是靠脑神经系统pre trained 的数据库”
老子笑喷了 原来CNN是训练个数据库 做DL的都可以自杀去了
这傻逼讲相声 讲得没救了
明明叫monte-carlo tree search这傻逼估计到现在也没明白啥时候用 monte-carlo
估计这傻逼连大一的复杂度... 阅读全帖
N**D
发帖数: 10322
49
Review from amazon: :D
1 of 1 people found the following review helpful:
3.0 out of 5 stars Made for a man's body, January 12, 2009
By L. J. Walker (Seattle, WA USA) - See all my reviews
(REAL NAME)
This holster accomplishes one goal: to carry my DSLR and a zoom lens without
the encumbrance of a camera bag with a shoulder strap, or of a backpack tha
t I must reach into whenever I need a camera tool. For this, I give the prod
uct an A-.
However, I also have two big complaints.
Lowepro designed t
s***a
发帖数: 4921
50
Running Warehouse has 20% off Gift Cards. Once you purchase the gift cards a
nd use them online, you can use code "CP15" for another 15% off.
A great deal if you know you will be buying running shoes. They carry all br
ands from Asics, Nike, Saucony, Brooks, Newton, Hammer Gel, and just about a
nything else you would want.
They have free 2 day shipping and free returns so if you don't like the prod
uct, you can always send it back.
http://runningwarehouse.com/maili...cards.html
1 (共1页)