由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Nate silver和Nassim Taleb骂战
相关主题
help understanding code (random number)顶这锅盖总结:Java/C#萨克斯,只有C/C++才是真正的low latency
Randomization of an arrayDoxygen怎么产生C++ Aggregation关系的UML图呢
Random Switch Between Two Different URLsScala Clojure 难以抉择
C/C++里面求normal distribution的cdf有可直接调用的函数吗?MVCS
请教一个microarray问题Scala又被吐槽了
non-aggregate type问题抢火车票跟Amazon每年的lightning deal差不多吧
aggregation vs. compostion. vs. association出个题目:二手版前十位神医是谁?
C++ Q06: POD versus Aggregate-type请教一个python(pandas)的效率问题
相关话题的讨论汇总
话题: taleb话题: nate话题: silver话题: 概率话题: trump
进入Programming版参与讨论
1 (共1页)
g****t
发帖数: 31659
1
最近Silver和Taleb在twitter公开骂战。
前者是最有影响力的预测,民意测验之类网站的founder,
一书的作者。
后者是<黑天鹅>一书的作者。08金融危机后我记得他还去国会回答过问题什么的。
现在双方发twitter互相指责对方不懂数学和概率。
这二位不是写垃圾文章的理论家。
实战成绩都很是顶尖的。Taleb靠投资获得巨富。silver本科毕业后据说靠在线赌博
谋生,成名在于预测竞选。各种竞选准确率极高。(但是错了trump这次)
由此可见,数据科学的结果的解释绝非易事。
我十几年前以前花过很多日夜考虑概率的解释问题。读过所有能找到的概率哲学的书。
也弄过一个解释概率问题的模版。后来发现,只要沿着爱因斯坦,吉布斯…
g****t
发帖数: 31659
2
Btw Taleb的书很有道理。现在fat tail,
黑天鹅这名词大家都理解了。但是在当年,二阶矩不可积所以标准差不存在的情况是小
众中的小众。然而实际上数值计算中经常会碰到。
如果有fat tail,因为标准差不存在。
那么chebyshev 不等式就没有了。会出现很多问题。现如今的VAE等深
学算法是以两参数分布,也就是mean, std为基础的。一样有和08金融危机那样的系统
性问题。
我个人认为决定论的深学很好。最好不要用概率语言。可以用热力学语言。温度,能量
,压力这些都可以用。这样省事。
w********m
发帖数: 1137
3
Nate Silver 搞的那次总统预测是砸了招牌。
他的poll aggregation只能降低variance,不能搞定bias。
所以他应该重新研究一下randomness,改善一下data质量.
要不然一直被人当作坏典型。哈哈
g****t
发帖数: 31659
4
我觉得这还是个解释问题。variance 本身是个积分它
对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別
的東西。
Trump 当选的概率为30%,这是什么意思?
这句话绝对不是Trump选上之后就可以说是错的。
30%胜率的赌博,结果你赢了,很正常。对吧?
Trump 当选的概率为30%这句话的解释很难。
既然不可能让Trump选一万次,统计其当选次数。
那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作
的事件。
这些底层事件类似于撒骰子。其解释没有问题。并和概率空间中的点对应。这样可以形
成一个间接的解释。这是我理解的Einstein 和Gibbs的办法。
但如果这样追求概率统计陈述的严格性。那经济学家以及08之前推杠杆的财务明星们首
先会集体失业。(其实我觉得他们应该失业。绝大多数都是半懂不懂。)


: Nate Silver 搞的那次总统预测是砸了招牌。

: 他的poll aggregation只能降低variance,不能搞定bias。

: 所以他应该重新研究一下randomness,改善一下data质量.

: 要不然一直被人当作坏典型。哈哈



【在 w********m 的大作中提到】
: Nate Silver 搞的那次总统预测是砸了招牌。
: 他的poll aggregation只能降低variance,不能搞定bias。
: 所以他应该重新研究一下randomness,改善一下data质量.
: 要不然一直被人当作坏典型。哈哈

T********i
发帖数: 2416
5
Poll的结果没有错。bias在人心。poll有个屁用?
就像人大代表表决,每次都99%以上赞成票。说明啥?
比如你在bloomberg工作,敢公开说你支持川普么?老美精明多了,嘴上不说,最后投
票时捅你一刀。
说别的都没用。现在华尔街和硅谷,积分一下都是总能量为负能量。换句话说都是祸害
人的。一下子都死绝了对美国人民是利好。理解了这个,就知道为啥川普能被选上了。


: 我觉得这还是个解释问题。variance 本身是个积分它

: 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off
其實說
的是別

: 的東西。

: Trump 当选的概率为30%,这是什么意思?

: 这句话绝对不是Trump选上之后就可以说是错的。

: 30%胜率的赌博,结果你赢了,很正常。对吧?

: Trump 当选的概率为30%这句话的解释很难。

: 既然不可能让Trump选一万次,统计其当选次数。

: 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频
率抽样
来操作

: 的事件。



【在 g****t 的大作中提到】
: 我觉得这还是个解释问题。variance 本身是个积分它
: 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別
: 的東西。
: Trump 当选的概率为30%,这是什么意思?
: 这句话绝对不是Trump选上之后就可以说是错的。
: 30%胜率的赌博,结果你赢了,很正常。对吧?
: Trump 当选的概率为30%这句话的解释很难。
: 既然不可能让Trump选一万次,统计其当选次数。
: 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作
: 的事件。

r*g
发帖数: 3159
6
对。大部分理论是variance based.我觉得基于quantile/order statistics的语言和理
论有很大潜力。

【在 g****t 的大作中提到】
: 我觉得这还是个解释问题。variance 本身是个积分它
: 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別
: 的東西。
: Trump 当选的概率为30%,这是什么意思?
: 这句话绝对不是Trump选上之后就可以说是错的。
: 30%胜率的赌博,结果你赢了,很正常。对吧?
: Trump 当选的概率为30%这句话的解释很难。
: 既然不可能让Trump选一万次,统计其当选次数。
: 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作
: 的事件。

x****u
发帖数: 44466
7
美国老百姓一亿票不如普京一票管用

off

【在 T********i 的大作中提到】
: Poll的结果没有错。bias在人心。poll有个屁用?
: 就像人大代表表决,每次都99%以上赞成票。说明啥?
: 比如你在bloomberg工作,敢公开说你支持川普么?老美精明多了,嘴上不说,最后投
: 票时捅你一刀。
: 说别的都没用。现在华尔街和硅谷,积分一下都是总能量为负能量。换句话说都是祸害
: 人的。一下子都死绝了对美国人民是利好。理解了这个,就知道为啥川普能被选上了。
:
:
: 我觉得这还是个解释问题。variance 本身是个积分它
:
: 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off
: 其實說

w********m
发帖数: 1137
8
统计的基础就是random。
只有random下,sample可以代表population。
实验室环境下,data是最好的。
poll这些sampling,环境不是可控的。
要增加样本数量N,于是Nate silver加了更多奇形怪状的poll。
结果乘weight的情况下,加入了他自己的bias。
哈哈。
Nassim Taleb搞的这些 Markov chain Monte Carlo,说不定效果更好。
可惜99%的时间都去搞avascript,做图表了,哪还有时间研究数学。

【在 g****t 的大作中提到】
: 我觉得这还是个解释问题。variance 本身是个积分它
: 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別
: 的東西。
: Trump 当选的概率为30%,这是什么意思?
: 这句话绝对不是Trump选上之后就可以说是错的。
: 30%胜率的赌博,结果你赢了,很正常。对吧?
: Trump 当选的概率为30%这句话的解释很难。
: 既然不可能让Trump选一万次,统计其当选次数。
: 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作
: 的事件。

g****t
发帖数: 31659
9
什么是random?这可不是个小问题。
在物理领域我们可以问:
万有引力常数是不是random number?薛定谔猫?麦克斯韦幽灵?stochastic heating...
在数学领域:
有无穷多非常复杂的概率论悖论,难度堪比最难的数学题。
在现实生活,有无穷多金融骗局,总有一款适合你。

【在 w********m 的大作中提到】
: 统计的基础就是random。
: 只有random下,sample可以代表population。
: 实验室环境下,data是最好的。
: poll这些sampling,环境不是可控的。
: 要增加样本数量N,于是Nate silver加了更多奇形怪状的poll。
: 结果乘weight的情况下,加入了他自己的bias。
: 哈哈。
: Nassim Taleb搞的这些 Markov chain Monte Carlo,说不定效果更好。
: 可惜99%的时间都去搞avascript,做图表了,哪还有时间研究数学。

n******t
发帖数: 4406
10
一般人並不知道uncertainty和randomness的區別。
概率並不能解決uncertainty的問題,其實引入概率的時刻起就產生了巨大的假設。

的。

【在 g****t 的大作中提到】
: 最近Silver和Taleb在twitter公开骂战。
: 前者是最有影响力的预测,民意测验之类网站的founder,
: 一书的作者。
: 后者是<黑天鹅>一书的作者。08金融危机后我记得他还去国会回答过问题什么的。
: 现在双方发twitter互相指责对方不懂数学和概率。
: 这二位不是写垃圾文章的理论家。
: 实战成绩都很是顶尖的。Taleb靠投资获得巨富。silver本科毕业后据说靠在线赌博
: 谋生,成名在于预测竞选。各种竞选准确率极高。(但是错了trump这次)
: 由此可见,数据科学的结果的解释绝非易事。
: 我十几年前以前花过很多日夜考虑概率的解释问题。读过所有能找到的概率哲学的书。

T*******x
发帖数: 8565
11
关于quantile/order statistics的语言和理论,能不能再多说几句?

【在 r*g 的大作中提到】
: 对。大部分理论是variance based.我觉得基于quantile/order statistics的语言和理
: 论有很大潜力。

1 (共1页)
进入Programming版参与讨论
相关主题
Re: 请教一个pca的问题 (转载)请教一个microarray问题
有人用es做nosql吗non-aggregate type问题
大牛们, 怎么加速向量查询vsm数据啊aggregation vs. compostion. vs. association
scala的type system太复杂了C++ Q06: POD versus Aggregate-type
help understanding code (random number)顶这锅盖总结:Java/C#萨克斯,只有C/C++才是真正的low latency
Randomization of an arrayDoxygen怎么产生C++ Aggregation关系的UML图呢
Random Switch Between Two Different URLsScala Clojure 难以抉择
C/C++里面求normal distribution的cdf有可直接调用的函数吗?MVCS
相关话题的讨论汇总
话题: taleb话题: nate话题: silver话题: 概率话题: trump