g****t 发帖数: 31659 | 1 最近Silver和Taleb在twitter公开骂战。
前者是最有影响力的预测,民意测验之类网站的founder,
一书的作者。
后者是<黑天鹅>一书的作者。08金融危机后我记得他还去国会回答过问题什么的。
现在双方发twitter互相指责对方不懂数学和概率。
这二位不是写垃圾文章的理论家。
实战成绩都很是顶尖的。Taleb靠投资获得巨富。silver本科毕业后据说靠在线赌博
谋生,成名在于预测竞选。各种竞选准确率极高。(但是错了trump这次)
由此可见,数据科学的结果的解释绝非易事。
我十几年前以前花过很多日夜考虑概率的解释问题。读过所有能找到的概率哲学的书。
也弄过一个解释概率问题的模版。后来发现,只要沿着爱因斯坦,吉布斯… |
g****t 发帖数: 31659 | 2 Btw Taleb的书很有道理。现在fat tail,
黑天鹅这名词大家都理解了。但是在当年,二阶矩不可积所以标准差不存在的情况是小
众中的小众。然而实际上数值计算中经常会碰到。
如果有fat tail,因为标准差不存在。
那么chebyshev 不等式就没有了。会出现很多问题。现如今的VAE等深
学算法是以两参数分布,也就是mean, std为基础的。一样有和08金融危机那样的系统
性问题。
我个人认为决定论的深学很好。最好不要用概率语言。可以用热力学语言。温度,能量
,压力这些都可以用。这样省事。 |
w********m 发帖数: 1137 | 3 Nate Silver 搞的那次总统预测是砸了招牌。
他的poll aggregation只能降低variance,不能搞定bias。
所以他应该重新研究一下randomness,改善一下data质量.
要不然一直被人当作坏典型。哈哈 |
g****t 发帖数: 31659 | 4 我觉得这还是个解释问题。variance 本身是个积分它
对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別
的東西。
Trump 当选的概率为30%,这是什么意思?
这句话绝对不是Trump选上之后就可以说是错的。
30%胜率的赌博,结果你赢了,很正常。对吧?
Trump 当选的概率为30%这句话的解释很难。
既然不可能让Trump选一万次,统计其当选次数。
那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作
的事件。
这些底层事件类似于撒骰子。其解释没有问题。并和概率空间中的点对应。这样可以形
成一个间接的解释。这是我理解的Einstein 和Gibbs的办法。
但如果这样追求概率统计陈述的严格性。那经济学家以及08之前推杠杆的财务明星们首
先会集体失业。(其实我觉得他们应该失业。绝大多数都是半懂不懂。)
: Nate Silver 搞的那次总统预测是砸了招牌。
: 他的poll aggregation只能降低variance,不能搞定bias。
: 所以他应该重新研究一下randomness,改善一下data质量.
: 要不然一直被人当作坏典型。哈哈
【在 w********m 的大作中提到】 : Nate Silver 搞的那次总统预测是砸了招牌。 : 他的poll aggregation只能降低variance,不能搞定bias。 : 所以他应该重新研究一下randomness,改善一下data质量. : 要不然一直被人当作坏典型。哈哈
|
T********i 发帖数: 2416 | 5 Poll的结果没有错。bias在人心。poll有个屁用?
就像人大代表表决,每次都99%以上赞成票。说明啥?
比如你在bloomberg工作,敢公开说你支持川普么?老美精明多了,嘴上不说,最后投
票时捅你一刀。
说别的都没用。现在华尔街和硅谷,积分一下都是总能量为负能量。换句话说都是祸害
人的。一下子都死绝了对美国人民是利好。理解了这个,就知道为啥川普能被选上了。
: 我觉得这还是个解释问题。variance 本身是个积分它
: 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off
其實說
的是別
: 的東西。
: Trump 当选的概率为30%,这是什么意思?
: 这句话绝对不是Trump选上之后就可以说是错的。
: 30%胜率的赌博,结果你赢了,很正常。对吧?
: Trump 当选的概率为30%这句话的解释很难。
: 既然不可能让Trump选一万次,统计其当选次数。
: 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频
率抽样
来操作
: 的事件。
【在 g****t 的大作中提到】 : 我觉得这还是个解释问题。variance 本身是个积分它 : 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別 : 的東西。 : Trump 当选的概率为30%,这是什么意思? : 这句话绝对不是Trump选上之后就可以说是错的。 : 30%胜率的赌博,结果你赢了,很正常。对吧? : Trump 当选的概率为30%这句话的解释很难。 : 既然不可能让Trump选一万次,统计其当选次数。 : 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作 : 的事件。
|
r*g 发帖数: 3159 | 6 对。大部分理论是variance based.我觉得基于quantile/order statistics的语言和理
论有很大潜力。
【在 g****t 的大作中提到】 : 我觉得这还是个解释问题。variance 本身是个积分它 : 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別 : 的東西。 : Trump 当选的概率为30%,这是什么意思? : 这句话绝对不是Trump选上之后就可以说是错的。 : 30%胜率的赌博,结果你赢了,很正常。对吧? : Trump 当选的概率为30%这句话的解释很难。 : 既然不可能让Trump选一万次,统计其当选次数。 : 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作 : 的事件。
|
x****u 发帖数: 44466 | 7 美国老百姓一亿票不如普京一票管用
off
【在 T********i 的大作中提到】 : Poll的结果没有错。bias在人心。poll有个屁用? : 就像人大代表表决,每次都99%以上赞成票。说明啥? : 比如你在bloomberg工作,敢公开说你支持川普么?老美精明多了,嘴上不说,最后投 : 票时捅你一刀。 : 说别的都没用。现在华尔街和硅谷,积分一下都是总能量为负能量。换句话说都是祸害 : 人的。一下子都死绝了对美国人民是利好。理解了这个,就知道为啥川普能被选上了。 : : : 我觉得这还是个解释问题。variance 本身是个积分它 : : 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off : 其實說
|
w********m 发帖数: 1137 | 8 统计的基础就是random。
只有random下,sample可以代表population。
实验室环境下,data是最好的。
poll这些sampling,环境不是可控的。
要增加样本数量N,于是Nate silver加了更多奇形怪状的poll。
结果乘weight的情况下,加入了他自己的bias。
哈哈。
Nassim Taleb搞的这些 Markov chain Monte Carlo,说不定效果更好。
可惜99%的时间都去搞avascript,做图表了,哪还有时间研究数学。
【在 g****t 的大作中提到】 : 我觉得这还是个解释问题。variance 本身是个积分它 : 对很多分布都是不存在的。所以傳統考慮的variance, bias的trade off其實說的是別 : 的東西。 : Trump 当选的概率为30%,这是什么意思? : 这句话绝对不是Trump选上之后就可以说是错的。 : 30%胜率的赌博,结果你赢了,很正常。对吧? : Trump 当选的概率为30%这句话的解释很难。 : 既然不可能让Trump选一万次,统计其当选次数。 : 那么就需要把选举这件事进行下一层子事件展开,一直推到最后可以用频率抽样来操作 : 的事件。
|
g****t 发帖数: 31659 | 9 什么是random?这可不是个小问题。
在物理领域我们可以问:
万有引力常数是不是random number?薛定谔猫?麦克斯韦幽灵?stochastic heating...
在数学领域:
有无穷多非常复杂的概率论悖论,难度堪比最难的数学题。
在现实生活,有无穷多金融骗局,总有一款适合你。
【在 w********m 的大作中提到】 : 统计的基础就是random。 : 只有random下,sample可以代表population。 : 实验室环境下,data是最好的。 : poll这些sampling,环境不是可控的。 : 要增加样本数量N,于是Nate silver加了更多奇形怪状的poll。 : 结果乘weight的情况下,加入了他自己的bias。 : 哈哈。 : Nassim Taleb搞的这些 Markov chain Monte Carlo,说不定效果更好。 : 可惜99%的时间都去搞avascript,做图表了,哪还有时间研究数学。
|
n******t 发帖数: 4406 | 10 一般人並不知道uncertainty和randomness的區別。
概率並不能解決uncertainty的問題,其實引入概率的時刻起就產生了巨大的假設。
的。
【在 g****t 的大作中提到】 : 最近Silver和Taleb在twitter公开骂战。 : 前者是最有影响力的预测,民意测验之类网站的founder, : 一书的作者。 : 后者是<黑天鹅>一书的作者。08金融危机后我记得他还去国会回答过问题什么的。 : 现在双方发twitter互相指责对方不懂数学和概率。 : 这二位不是写垃圾文章的理论家。 : 实战成绩都很是顶尖的。Taleb靠投资获得巨富。silver本科毕业后据说靠在线赌博 : 谋生,成名在于预测竞选。各种竞选准确率极高。(但是错了trump这次) : 由此可见,数据科学的结果的解释绝非易事。 : 我十几年前以前花过很多日夜考虑概率的解释问题。读过所有能找到的概率哲学的书。
|
T*******x 发帖数: 8565 | 11 关于quantile/order statistics的语言和理论,能不能再多说几句?
【在 r*g 的大作中提到】 : 对。大部分理论是variance based.我觉得基于quantile/order statistics的语言和理 : 论有很大潜力。
|