关于mct的讨论汇总 - 话题女王

w*******y
发帖数: 60932

来自主题: _DealGroup版 - 【$】Free voucher for Microsoft Certification Exam 70-659: MCTS: Windows Server 2008 R2, Server Virtualization

I searched through the forums and couldn't find this posted anywhere.
Microsoft is still running their Virtualization Challenge:
http://www.microsoft.com/learning/en/us/certification/virtualiz
#tab3" rel="nofollow" target="_blank" onclick="_gaq.push(['_trackEvent', '
thread', 'click', '4127369 - free-voucher-for-microsoft-certification-exam-
70659-mcts-windows-server-2008-r2-server-virtualization']);">Virtualization
Challenge [Virtualization Challenge:
http://www.microsoft.com/learning/en/us/ce... 阅读全帖

L*********4
发帖数: 883

来自主题: Go版 - MCTS是怎么判断形势的

觉得虽然版上科普过但是还是很多人都不知道AlphaGo是怎么算棋的。
MCTS算棋的方法是，根据一个快速的评估函数，加上一定的随机性，直接走子，然后对
方再用同样的评估函数加上随机性直接走子，一直走到棋局结束。注意：是一直走到棋
局结束然后看谁赢！也就是跟那些电视评棋的人一样，都是第一感连着往下摆，但是他
会一直摆到对局结束！他可能会摆上几个变化，但是都是一个子一个子一直摆下去的，
不是像普通码农想象的是什么剪枝搜索的。
他不是局部搜索的。他的局部对杀未必有alpha-beta剪枝算法强，所以AlphaGo另外有
一个policy network来处理局部的情况，这个policy network算路未必很远，而这可能
就是其弱点。由于MCTS的存在，AlphaGo的paper里面说，他搜索的棋局数尚且不如20年
前的深蓝多。所以这就是为啥我说先拿稳实地，然后要不吃大龙要不治孤跑大龙才是跟
AlphaGo对战的窍门。

o****e
发帖数: 916

来自主题: DotNet版 - MCTS考试 (转载)

【以下文字转载自 Programming 讨论区】
发信人: okeoke (okeoke), 信区: Programming
标题: MCTS考试
发信站: BBS 未名空间站 (Fri Mar 23 19:34:18 2012, 美东)
有人参加过mcts的考试么？报了个.net编程的考试，说是考试时间估计要将近4个小时
，不知道是不是夸张了，training kit带的模拟考试才45道题，顶多半个钟头就弄完了
。有经验的说说？谢谢。

M******5
发帖数: 78

来自主题: JobHunting版 - Microsoft SQL Database Developer Certification MCTS 70-433 - SQLSteps 是干什么的？

我不是这方面的，以前同学准备考这个 Microsoft SQL Database Developer
Certification MCTS 70-433 - SQLSteps，好奇问一下，这是干什么用的？

s***y
发帖数: 357

来自主题: Go版 - 模仿棋是MCTS的梦魇

另外，小李还可以走变形模仿棋，就是把对方一个角的小目变成星位(或反过来），另
外两个角不变，然后利用两个角的差异性布局。人类对星位和小目的认识确立布局优势
， DCNN/MCTS 没有机会。

g**2
发帖数: 301

来自主题: Database版 - 求MCTS Training Kit (Exam 70-433 Database Development

MCTS Self-Paced Training Kit (Exam 70-433): Microsoft SQL Server 2008 -
Database Development
这个好像就是要看的书对付 70-433 考试的但是找了很多地方没有下的求助一下
同时问有人说要考试准备 3方面复习：
Training Kit
MOC
题库
这是为了应付考试
但是 moc是什么？题库有但是没有解释答案的
求助一下很着急谢谢了

g**2
发帖数: 301

来自主题: Database版 - 求MCTS Training Kit (Exam 70-433 Database Development

MCTS Self-Paced Training Kit (Exam 70-433): Microsoft SQL Server 2008 -
Database Development

o****e
发帖数: 916

来自主题: Programming版 - MCTS考试

有人参加过mcts的考试么？报了个.net编程的考试，说是考试时间估计要将近4个小时
，不知道是不是夸张了，training kit带的模拟考试才45道题，顶多半个钟头就弄完了
。有经验的说说？谢谢。

m**m
发帖数: 5500

来自主题: Go版 - 技术贴（懂围棋的请进）

陈经：谷歌围棋算法存在缺陷达不到人类最高水平
2016年1月28日，谷歌围棋程序AlphaGo以5：0战胜职业棋手的消息，震动了围棋圈。
这两天有很多的讨论，主要是新闻性的。我也在第一时间进行了常识性的介绍。
本文进一步从围棋和人工智能技术的角度，深入分析AlphaGo棋艺特点，评估其算
法框架的潜能，预测与人类最高水平棋手的胜负。下文中出现的策略网络、价值网络、
蒙特卡洛法请参考前文，理解具体围棋局面也需要一定的棋力，但是与算法推理相关的
内容理解起来并不难。
AlphaGo是如何下棋的
所有人，包括职业棋手，看了AlphaGo战胜樊麾二段的五盘棋，都说这程序下得像
人了，和以前的程序完全不同。柯洁九段（公认目前最强棋手，一年获得三个世界冠军
，对李世石6：2，古力7：0）的看法是：
“完全看不出来。这五盘棋我也仔细地看了一眼，但我没看名字，不知道谁执黑谁
执白，完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃
，该退出的地方也会退出，非常均衡的一个棋风，真是看不出来出自程序之手。因为之
前的ZEN那样的程序，经常会莫名其妙的抽风，突然跑到一个无关紧要的地方... 阅读全帖

m**m
发帖数: 5500

来自主题: Go版 - 技术贴（懂围棋的请进）

r****y
发帖数: 26819

来自主题: Go版 - Facebook’s AI tech mimics how humans learn

不是这个意思，这里的神经网络只是用来tune一些参数的，不能起到不断学习进步的作
用，作者已经用了十四万的对局数据，但是在kgs上的等级分基本固定了，除非人工再t
une参数。
这里比较取巧的就是拿MCTS来做同步，而神经网络只起到打酱油调参数作用。事实上，
绝大多数时候MCTS是不采取神经网络计算结果的。到第300到第400步之间的时候，MCTS
采用神经网络计算结果的比率是30.6%，前面都是23%左右，一般300步早就到官子了，
官子每步棋都只有30%的准头，请问这神经网络不就是个瞎支招打酱油的么？
几个月时间做到1d就算不错，但你怎么判断这1d是MCTS的功劳还是神经网络的功劳呢？
如果作者把MCTS部分拿出来做个纯MCTS的程序，我估计就算没有1d也差不多了。换句话
说，神经网络和学习功能没有足够的说服力，paper自己也承认纯用神经网络的远远比
不上MCTS跟神经网络混搭的，这说明神经网络只是噱头，还是靠MCTS出力，而别人做的
MCTS的程序早就不止1d了，那这篇paper和项目的价值在哪。既然做了跟纯神经网络
程序对比的，干嘛不敢做一个跟自己的纯MCTS算法对比的呢？

O**l
发帖数: 12923

来自主题: Go版 - 神经网络的结构决定了他的极限

well
这个我当然知道我们在讨论heuristic MCT是不是MCT的问题和DCNN有什么关系，我是
在强调MCT远远比heuristic重要没MCT之前不管什么heuristic你1D都上不了有了MCT
你能
上5D
pure
这是常识 DCNN拟合最多做做planning 你不search 简直开玩笑你完全不理解DCNN MCT
的本质是啥会不会下围棋也存疑
这是FB最新的paper里的话你自己仔细读读再来说
http://arxiv.org/pdf/1511.06410v2.pdf
From the experiments, we clearly show that DCNN is tactically weak due to
the lack of search.
Search is a way to explore the solution space conditioned on the current
board situation, and build
a non-parametric local model for the game. The l... 阅读全帖

O**l
发帖数: 12923

来自主题: Go版 - 看大家讨论中比较少提这个 reinforcement learning

我靠太牛逼了拿个1988年的老掉牙的书来否定MCT???!!!!
MCT 2007年才提出
你不会不知道 Google的整套算法里有两个policy function 两个value fuction
一组是DCNN训练出来的
一组是MCT自带
只有在branching factor太大的时候用DCNN的policy function
只有在MCT不能达到terminal node的时候用DCNN的 value function
最终是以MCT的policy value fuction为准
所以你的逻辑DCNN是RL MCT不是？？ lol
MCT这种每个状态节点都有一个policy fuction根据这个fuction层层递进在terminal
node根据value function算出reward 在层层回推update policy function 最终
converge
是标准的RL!!!
整个RL玩了这么多年全是toy model唯一像样的成果可能就是MCT 还被你丫否定了lol
训练两张dcnn就是RL 整个CV+RL界都笑死了

w****i
发帖数: 964

来自主题: Go版 - 神经网络的结构决定了他的极限

MCT is basically a sampling method, MCT with random policy performs very
poorly. The existing MCT approaches before AlphaGO heavily rely on hand
crafted heuristics in their policies. This is exactly the reason why MCT
approaches basically stop going forward after reaching KGS 5-6d, for almost
5 years, because hand crafted heuristic hits the limit. The key component of
the new program is the policy/value network to automatically construct
heuristics through machine learning. The major player here... 阅读全帖

g**2
发帖数: 301

来自主题: Database版 - SQL证书考试求助

最后决定考sql 准备先考mcts 但是有几个不明白的事情：
1 关于考什么
Microsoft SQL Server technologies
MCTS: Microsoft SQL Server 2005 Exam 70-431
MCTS: Microsoft SQL Server 2005 Business Intelligence Exam 70-445
MCTS: SQL Server 2008, Business Intelligence Development and Maintenance
Exam 70-448
MCTS: SQL Server 2008, Database Development Exam 70-433
MCTS: SQL Server 2008, Implementation and Maintenance Exam 70-432
考05 还是08
2 MCIPT 里面的版本问题：
Microsoft SQL Server

MCITP: Database Administrator 2008 Exam 70-432 Exam 70-450

发帖数: 1

来自主题: Military版 - 飞机头等舱旅行和移民火星

你会跟着马斯克移民火星吗？
2016-09-29 安然 MissMoney浮世
点击上方“Miss Money”，每天体验愉快阅读！
本文版权由腾讯财经“公司环球”所有，转载请注明来自微信公号：公司环球（
qqgsstory）并附上微信二维码。或联系我们获取授权。（联系邮箱：lalurawang@
tencent.com）
9月28日凌晨，SpaceX CEO伊隆·马斯克（Elon Musk）在墨西哥瓜达拉哈拉举行的第67
届国际宇航大会（IAC）上做了题为“把人类变成星际公民”的演讲。在演讲中，马斯
克表示打算建造一整套可重复利用的运输设备——“火星运输系统”(MCT)，一次将100
人送到火星基地，耗时80天（最终减少到30天），花费控制在每人20万美元以内（最终
降至10万美元）。这个计划的最终目标是建造一个有100万居民的火星基地，整个计划
可能需要耗时100年才能完成。任何伟大的梦想都值得被尊重，但马斯克“移民火星”
计划可行性有多少？你愿意跟着马斯克去火星吗？
【为了上火星，马斯克筹划了15年了】从2001 年的“火星绿洲”项目开始，马斯克就
将他的登陆火星计划付诸行动了，... 阅读全帖

O**l
发帖数: 12923

来自主题: Go版 - 原来阿尔法下的是５秒版的ＺＥＮ

这是FB论文里自己说的
From the experiments, we clearly show that DCNN is tactically weak due to
the lack of search.
Search is a way to explore the solution space conditioned on the current
board situation, and build
a non-parametric local model for the game. The local model is more flexible
than the global model
learned from massive training data and more adapted to the current situation
. The state-of-the-art
approach in computer Go is Monte-Carlo Tree Search (MCTS). Fig. 4 shows its
basic principle.
Com... 阅读全帖

O**l
发帖数: 12923

来自主题: Go版 - 阿法狗生怕人类还不够绝望

搞笑不用任何heuristic
纯MCT 局部19*19至少就有业余1D的水平 9*9无敌
MCT self play, train CNN
CNN + MCT self play train CNN'
CNN'+ MCT self play train CNN''
....
MCT rollout纯随机没有任何bias
说穷举的都是文科生

O**l
发帖数: 12923

来自主题: Go版 - 阿法狗第四局最终并不是输在对妙手的漏算上

其实这就是dcnn做的事情
dcnn据说不用MCT就能达到kgs 3d
但是dcnn只能predict不能否决MCT
因为MCT毕竟是算出来的
其实只要那一步的MCT时间够长 dcnn就算出盲点 MCT也能补救回来
狗的时间分配算法太糟

K****a
发帖数: 241

来自主题: Pics版 - 【图上谈兵】美军2011年度最佳摄影师参赛作品

这是一个系列三十多张，前面有人贴了一些，我再贴一些不重复飞。
P1.
Baghdad, Iraq, Dec. 14, 2011 - Servicemembers from the Iraq Air Force
security forces and U.S. Air Force security forces show off for each other
on the top of a hardened aircraft shelter at Sather Air Base while doing a
joint patrol of the flight line, December 14, 2011. This photo won honorable
mention, feature in the Military Photographer of the Year photo compeition.
(Joshua L. Demotts/US Air Force/MCT)
P2.
An Army Ranger trainee gets "turtled" while repelli... 阅读全帖

K****a
发帖数: 241

来自主题: Pics版 - 【图上谈兵】美军2011年度最佳摄影师参赛作品

P6.
Newly commissioned Navy and Marine Corps officers toss their hats following
the U.S. Naval Academy Class of 2011 graduation and commissioning ceremony,
May 27, 2011 in Annapolis, Maryland. This photo won honorable mention, news
in the 2011 Military Photographer of the Year competition. (Chad D. Runge/US
Navy/MCT)
P7.
An AC-130U Gunship from the 4th Special Operations Squadron flies a local
training mission on January 27, 2011 at Hurlburt Field, Florida. The AC-130U
"Spooky" gunship is the pr... 阅读全帖

G****r
发帖数: 5579

来自主题: Military版 - 黄振春一案全文在此：（July 02, 2014 旧闻了）

http://www.fbi.gov/baltimore/press-releases/2014/chinese-nation
Chinese National Pleads Guilty in Scheme to Fraudulently Obtain Technology
Products from U.S. Companies
Sought to Fabricate an Infrared Detector for Night Vision, Missile Detection
, and Other Military Applications
U.S. Attorney’s Office July 02, 2014
District of Maryland (410) 209-4800
GREENBELT, MD—Zhenchun Huang, a/k/a Ted Huang, age 51, a Chinese national
and naturalized U.S. citizen, formerly residing in Clarksville, Ma... 阅读全帖

h******n
发帖数: 674

来自主题: Military版 - 南大的黄振春被FBI 以间谍案抓捕

留学美国脱颖而出成为“首席科学家”
黄振春，1963年出生在江苏镇江市扬中的一个农家。他1980年考取南京大学物理系，
1984年获学士学位，1987年获半导体专业硕士学位，继而被分配到北京国家教委科技管
理中心工作。
在美国，黄振春是一位声望极高的风云人物，他担任着华盛顿地区最大的华人社团“华
盛顿中国大陆大专院校校友联合会”会长。1999年，在国家主席江泽民和总理朱鎔基
访美期间，他曾作为杰出学者受到亲切接见。1999年，他以“旅美杰出青年科学家”的
身份应邀回国参加50周年国庆庆典活动。作为侨界领袖，他多才多艺，虽身兼数职却
仍能事事得心应手，在澳门回归、中美撞机事件等重大事件发生时，黄振春身在海外却
始终以拳拳赤子之心与祖国共荣辱。
1996年，他终于等到了机会。他获得了中国国家自然科学基金会杰出青年科学家基金，
并被聘任为南京大学物理系教授，与南京大学开展长期的产学研合作。此时，在他的心
里，已经埋下了随时准备回国创业的种子。
黄振春经常说，20世纪是出国热，本世纪将是回国热。以已所长回报祖国，也因此成了
萦绕在他心头多年的夙愿。
他的很多朋友对他的这个“种子”却不怎么... 阅读全帖

l****z
发帖数: 29846

来自主题: USANews版 - 南大的黄振春被FBI 以间谍案抓捕 (转载)

【以下文字转载自 NJU 讨论区】
发信人: xiaok1981 (VQGM2831,10baozi), 信区: NJU
标题: 南大的黄振春被FBI 以间谍案抓捕 (转载)
发信站: BBS 未名空间站 (Sun Sep 7 01:49:15 2014, 美东)
发信人: horsemen (horseman), 信区: Military
标题: 南大的黄振春被FBI 以间谍案抓捕
发信站: BBS 未名空间站 (Sat Sep 6 23:30:47 2014, 美东)
留学美国脱颖而出成为“首席科学家”
黄振春，1963年出生在江苏镇江市扬中的一个农家。他1980年考取南京大学物理系，
1984年获学士学位，1987年获半导体专业硕士学位，继而被分配到北京国家教委科技管
理中心工作。
在美国，黄振春是一位声望极高的风云人物，他担任着华盛顿地区最大的华人社团“华
盛顿中国大陆大专院校校友联合会”会长。1999年，在国家主席江泽民和总理朱鎔基
访美期间，他曾作为杰出学者受到亲切接见。1999年，他以“旅美杰出青年科学家”的
身份应邀回国参加50周年国庆庆典活动。... 阅读全帖

O**l
发帖数: 12923

来自主题: Go版 - 神经网络的结构决定了他的极限

你知道cnn吗
而且主要还是Mct 不要任何domain knowledge
Mct 9x9 早就无敌
19*19 state space太大单纯Mct没发converge
Train 一个cnn prune一下把每步 branch factor降到9*9的级别
然后Mct暴力求最优解
基本就是神了李世石估计最多赢一盘很有可能0:5
最后直接崩溃
[在 xy18 (家琪) 的大作中提到：]
：他的水平不是可以无限成长的，
：多少年前搞过神经网络，
：...........

w****i
发帖数: 964

来自主题: Go版 - 神经网络的结构决定了他的极限

我是
MCT
NO, DCNN heuristics alone can reach KGS 3d, READ THE PAPER.
MCT
You are talking about darkmcts (DCNN+MCT), but darkfores* is pure DCNN and
reaches kgs 3D, without MCT, READ THE PAPER!

O**l
发帖数: 12923

来自主题: Go版 - 原来阿尔法下的是５秒版的ＺＥＮ

你这即不动围棋又不懂算法的傻货我跟你说了多少遍两个完全不同
FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
GOOG 没有公布具体细节但是他说了他还有一个value CNN
他没有完全依赖monte-carlo simulation的结果来update UCB 来决定tree的生长
两者区别大了去了
传统MCT根本没有评估函数
你如果说fb goog算法类似那zen和它们两的算也类似
zen是heuristic prune+MCT
你这傻货这些有半点明白是怎么回事吗在这扯屁啊赶快泡菌斑去吧
你这智商不适合在这

O**l
发帖数: 12923

来自主题: Go版 - alphago其实根本不用学人的棋谱

就是用CNN+MCT结果去train CNN 然后再迭代吧
cnn主要就是一个cut branching factor, 在MCT没有terminal node时候评估一下
比如最开始先offline CNN+MCT自己跟自己下
每步2Billion simulations 出一堆每步top 40%左右的棋谱
用这些棋谱直接train cnn, 假设cnn大概就能直接得到>40% candidates 然后再用
2billion MCT simulation
新棋谱的质量肯定好于每步top 40%, 用这个新的棋谱继续train cnn 不断迭代下去
其实根本不用学人的棋谱

w*******d
发帖数: 59

来自主题: Go版 - 看大家讨论中比较少提这个 reinforcement learning

有句话叫“半桶水响叮当”……今天终于见识到了……Sutton和barto的书老掉
牙这种话话也真敢说得出口=_=……那大概图灵的paper是不是也可以扔垃圾箱里了。
MCTS作为算法本身和RL是两个独立概念。当RL里的value和policy function固定不变的
情况下，这个数学模型就退化为统计上的Markov decision process。而MDP最优决策是
一个NP-hard问题，所以利用MCTS算法可以近似的给每步搜索最优解。
当value和policy不知道的情况下，你需要通过MDP里不断的数据反馈去学习这两个函数
，这个过程叫做reinforcement learning。换句话说，我可以不用MCTS去在每步寻找最
优决策，而换另一种搜索方法，但是这个过程依然是reinforcement learning……不知
道这样讲清楚了没有……
Google的最大贡献就是用deep belief nets来model这两个函数+MCTS搜索。这个被
Google称为deep reinforcement learning。换言之，我可以用random forest来mode... 阅读全帖

O**l
发帖数: 12923

来自主题: Go版 - 阿狗的局部计算力问题

说了多少遍 Mct不是蒙特卡洛 Mct是迭代收敛听了几个文科报道在这天天吼错误概念
逗比吗看不懂Paper难道连wiki都看不懂吗还随机投票真是搞笑
第四盘怎么回事我已经解释的很清楚了 Dcnn bias 太大导致78漏算（很怀疑第四盘开
始Mct的计算资源减了）这个时候搜索树前面积累的计算全部清空但是Alphago仍然按
照笨拙的一分多钟一步执行导致子节点没有一个能Converge 导致随机下，这个时候
只要时间分配算法智能一点在当前节点算他个20分钟重建个Mct tree 就完全没问题
懂了不

y********n
发帖数: 4452

来自主题: Go版 - 阿法狗怎样算气的？

呵呵呵，首先说每次骂人一大堆，自己一大堆负能量累不累，活的这样也真可怜。
第二从你回复的算尽到底和用UCB1就知道你没有写过AI和MCTS。UCB1只是tree
traverse的一个方法，和算tree上每个node的围棋输赢根本没有关系。是的，value
network产生的围棋输赢率是可以做UCB1的input，告诉MCTS如果走到这里输赢是多少。
可是，没有value network的产生的数据。MCTS和UCB1根本做不了围棋AI，这两个不是
什么新玩意，已经非常久的历史了，是generic AI的一种方法。
你说算到底，你会下围棋吗？算到两方都pass，棋盘上还是非常tricky，有些地方放会
减分，有些地方放会死。即使算到底，底有很多个，还是需要value network判断输赢
率来选择path。
说到细节，就知道你是只看不练，只知道表皮一点点的水平。mcts的围棋软件外面非常
多, 也很多年了，水平都是业余段位。要达到阿法狗那么厉害，主要是靠脑神经系统
pre trained 的数据库: policy and value network.

O**l
发帖数: 12923

来自主题: Go版 - 阿法狗怎样算气的？

SB完全不懂又在这胡喷
“”你说算到底，你会下围棋吗？算到两方都pass，棋盘上还是非常tricky，有些地方
放会
减分，有些地方放会死。即使算到底，底有很多个，还是需要value network判断输赢
率来选择path。”
MCT每步只在tree上建一个node
然后用monte-carlo simulation到底根本不需要评估直接返回结果
大量算到底的采样　在树中反馈
UCB1保证1-0的结果快速收敛
蠢猪屁都不懂　你不会认为ＵＣＴ的算到底的意思是穷极变化吧
“MCTS和UCB1根本做不了围棋AI，这两个不是什么新玩意，已经非常久的历史了”
你是从哪个平行宇宙穿越来的 MCT原理基于UCT 尼玛ＵＣＴ２００７年才提出
“MCTS和UCB1根本做不了围棋AI”　你这傻逼逗我　单独的ＭＣＴＳ可以做到业６
“主要是靠脑神经系统pre trained 的数据库”
老子笑喷了　原来ＣＮＮ是训练个数据库　做ＤＬ的都可以自杀去了
这傻逼讲相声　讲得没救了
明明叫monte-carlo tree search这傻逼估计到现在也没明白啥时候用 monte-carlo
估计这傻逼连大一的复杂度... 阅读全帖

x*******1
发帖数: 28835

来自主题: NJU版 - 南大的黄振春被FBI 以间谍案抓捕 (转载)

【以下文字转载自 Military 讨论区】
发信人: horsemen (horseman), 信区: Military
标题: 南大的黄振春被FBI 以间谍案抓捕
发信站: BBS 未名空间站 (Sat Sep 6 23:30:47 2014, 美东)
留学美国脱颖而出成为“首席科学家”
黄振春，1963年出生在江苏镇江市扬中的一个农家。他1980年考取南京大学物理系，
1984年获学士学位，1987年获半导体专业硕士学位，继而被分配到北京国家教委科技管
理中心工作。
在美国，黄振春是一位声望极高的风云人物，他担任着华盛顿地区最大的华人社团“华
盛顿中国大陆大专院校校友联合会”会长。1999年，在国家主席江泽民和总理朱鎔基
访美期间，他曾作为杰出学者受到亲切接见。1999年，他以“旅美杰出青年科学家”的
身份应邀回国参加50周年国庆庆典活动。作为侨界领袖，他多才多艺，虽身兼数职却
仍能事事得心应手，在澳门回归、中美撞机事件等重大事件发生时，黄振春身在海外却
始终以拳拳赤子之心与祖国共荣辱。
1996年，他终于等到了机会。他获得了中国国家自然科学基金会杰出青年科学家... 阅读全帖

x*******1
发帖数: 28835

来自主题: SEU版 - 南大的黄振春被FBI 以间谍案抓捕 (转载)

x*******1
发帖数: 28835

来自主题: SEU版 - 南大的黄振春被FBI 以间谍案抓捕 (转载)

g**2
发帖数: 301

来自主题: Database版 - 需要弄明白考什么database的证书

MCTS与MCITP 有什么区别要是只考mcts 有用吗是不是相当于 ccna ccnp这样那个
mcts是高级的？而且如果就考 mcts其中的一个是不是也给证书例如考
development? 如果3个都考从现在开始到年底有可能考完都过吗因为马上要毕业
了最后那个 Business Intelligence Development and Maintenance 完全不知道考
了是为什么？ tks

O**l
发帖数: 12923

来自主题: Military版 - 看看下面ＦＢ田的进展吧

蠢货你懂个屁
两个实现有区别
FB 就是CNN+MCT cnn 做policy predict 减branch factor 再MCT暴力求最优
GOOG 没有公布具体细节但是他说了他还有一个value CNN
这个非常奇怪谁都不知道具体怎么运行因为MCT本身不需要评估函数两家实现可以说
完全不同
这种饭都吃不饱的玩意围棋算法都不懂就在这放屁真是蠢的没边了浪费粮食

h*h
发帖数: 27852

来自主题: Military版 - 计算机在无概率的棋类完胜人类只是时间上的问题

看来电脑围棋压倒人类就在今年了：电脑对人 = 几十万个职业三段围殴一个人
发信人: softmagic (魔术师), 信区: Weiqi
标题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义，那些都是离线做好的，
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手，经过合理的组织，在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在：
1.每个局面下，越有“合理招法”希望的落子，会被更多的“研讨对局”，通常比如当前
局面下，最有希望的落子位置会比，希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法，理论上来说，UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是，在研讨过程中，他们的各个局部的研究结论会以一种
高效的形式彼此沟通，换... 阅读全帖

h*h
发帖数: 27852

来自主题: Military版 - 用一种真正便于棋手理解的方式解释alphago的算法

发信人: softmagic (魔术师), 信区: Weiqi
标题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义，那些都是离线做好的，
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手，经过合理的组织，在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在：
1.每个局面下，越有“合理招法”希望的落子，会被更多的“研讨对局”，通常比如当前
局面下，最有希望的落子位置会比，希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法，理论上来说，UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是，在研讨过程中，他们的各个局部的研究结论会以一种
高效的形式彼此沟通，换句话说，关于目前局面发现出来的知识是共享的。
这个非常有用是因为研讨的局面非常... 阅读全帖

h*h
发帖数: 27852

来自主题: Military版 - 看来电脑围棋压倒人类就在今年了

s****d
发帖数: 1830

来自主题: Stock版 - google太牛了，

都差不多只要序盘不落后人类很难
MCT在局部计算方面超强出错的可能性几乎为0
9X9 用MCT在个laptop上人类根本没法下
靠力量中后盘硬凹肯定搞不过MCT

m*****n
发帖数: 2152

来自主题: Stock版 - 我对AlphaGo的理解

AlphaGo的算法等技术分析
2016-03-10 田渊栋算法与数据结构
来源：知乎专栏-远东轶事
作者：田渊栋（微博@远东轶事）
链接：http://zhuanlan.zhihu.com/yuandong/20607684
作者简介：田渊栋是卡耐基梅隆大学机器人系博士。曾就职于 Google X 部门，目前是
Facebook 的智能围棋 darkforest 的负责人和第一作者。
最近我仔细看了下AlphaGo在《自然》杂志上发表的文章，写一些分析给大家分享。
AlphaGo这个系统主要由几个部分组成：
1、走棋网络（Policy Network），给定当前局面，预测/采样下一步的走棋。/2
2、快速走子（Fast rollout），目标和1一样，但在适当牺牲走棋质量的条件下，速度
要比1快1000倍。
3、估值网络（Value Network），给定当前局面，估计是白胜还是黑胜。
4、蒙特卡罗树搜索（Monte Carlo Tree Search，MCTS)，把以上这三个部分连起来，
形成一个完整的系统。
我们的DarkForest和AlphaGo同样是用4搭建的系统。Dar... 阅读全帖

O**l
发帖数: 12923

来自主题: Go版 - 神经网络的结构决定了他的极限

最后一句光靠 CNN 能到3D 我不信
MCT又不是纯monte-carlo是UCB tree guided monte-carlo, converge速度比传统
heuristic search高million倍
MCT把go的水平从30K提高到业余5D 绝对最大的突破远比这次糅合CNN 突破大多了
MCT 后机器9*9就无敌了再次之前根本不敢想

almost
of
heuristics

O**l
发帖数: 12923

来自主题: Go版 - 神经网络的结构决定了他的极限

1 customized heuristics MCT任然是MCT
2 DCNN heuristics提高到9D还不确定
3 有论文关于专门DCNN的介绍吗纯DCNN不计算能到3D开什么玩笑 DCNN和MCT根本不是
一个层面上的东西没法代替

O**l
发帖数: 12923

来自主题: Go版 - 神经网络的结构决定了他的极限

搞笑 MCT以前基于各种knowledge的heuristic search多了去了谁能达到1d水平
没有UCB你加再多knowledge都没有所以重要MCT不是heuristic
DCNN下得快当然了就是过一遍NN DCNN其实就是UCT展开时候prune branch
不用MCT
你这玩意想也能想出来应该勺子莫名其妙的棋一大把
而且局部对杀你不计算用DCNN softmax一个最大值？？？开玩笑吧
有paper拿来看看嘛

AlphaGo

O**l
发帖数: 12923

来自主题: Go版 - 原来阿尔法下的是５秒版的ＺＥＮ

傻粪一点干货都没有开始抠字眼了
我是说细节不清楚
但是策略是policy cnn + value cnn + MCT 是人家白纸黑字写着的
fb的策略是policy cnn + MCT这是他家自己爆的
对了你能跟我说说这算法有啥时间优势不扎克伯格一句话笑死？
就是FB新算法最后怎么走不是一样用MCT？
alphago人家常长考版赢了职业二段然后用机器对战成绩证明一下快棋能力有什么不
妥？
什么不懂得傻粪还喜欢瞎喷才是真疯狗不过你还是个弱智版疯狗

w****i
发帖数: 964

来自主题: Go版 - 原来阿尔法下的是５秒版的ＺＥＮ

You apparently didn't look at the paper carefully. I can imagine that when
you just heard of this paper maybe 10 minutes ago. darkforest/darkfores1/
darkfores2 is pure DCNN bot, and darkfores2 reaches stable kgs 3d, DCNN+MCT
is darkfmcts3
Their Abstract:
"""
Darkforest substantially improves the win rate for patternmatching
approaches against MCTS-based approaches, even with looser search
budgets. Against human players, the newest versions, darkfores2, achieve a
stable
3d level on KGS Go Serve... 阅读全帖

a******0
发帖数: 121

来自主题: Go版 - 罗洗河让AlphaGo四子的说法没有什么错

看了罗洗河9路棋赢计算机的下法，觉得有些失望。原希望看到以高深的算路，用复杂
的对杀、打劫来蹂躏计算机，如当年弃3劫循环的风采。结果看到的是靠反复悔棋，等
待计算机走出一步弱手(MCTS有不少随机的因素)。
Hideki Kato （Zen 的作者之一）说过，即使9路棋 MCTS 还解决不了双劫和复杂的攻
杀，但只有高手才能攻击 MCTS 的这些弱点。
至于让9子，当然就是炒作。围棋TV上，Zen（黑棋）的一些招法只有3K的水平。

h*********n
发帖数: 11319

来自主题: Go版 - 阿法狗怎么做到每天练习几十万盘棋？

不一样
阿发狗相当于用神经网络来优化搜索。练习的时候相当于训练这个神经网络，昨天是实
际用上这个神经网络
举个网友的解释
发信人: softmagic (魔术师), 信区: Weiqi
标题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义，那些都是离线做好的，
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手，经过合理的组织，在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在：
1.每个局面下，越有“合理招法”希望的落子，会被更多的“研讨对局”，通常比如当前
局面下，最有希望的落子位置会比，希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法，理论上来说，UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是，在研讨过程中，他们的各个局... 阅读全帖

h*h
发帖数: 27852

来自主题: Go版 - 看来电脑围棋压倒人类就在今年了 (转载)

【以下文字转载自 Military 讨论区】
发信人: hsh (三胡), 信区: Military
标题: 看来电脑围棋压倒人类就在今年了
发信站: BBS 未名空间站 (Wed Mar 9 19:58:43 2016, 美东)
看来电脑围棋压倒人类就在今年了：电脑对人 = 几十万个职业三段围殴一个人
发信人: softmagic (魔术师), 信区: Weiqi
标题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义，那些都是离线做好的，
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手，经过合理的组织，在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在：
1.每个局面下，越有“合理招法”希望的落子，会被更多的“研讨对局”，通常比如当前
局面下，最有希望的... 阅读全帖

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天