由买买提看人间百态

topics

全部话题 - 话题: 贝叶斯
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
M******f
发帖数: 859
1
作者:静听弦吟
此文资料来自于亦明先生文章和网络搜索整理而成。这是一件往事,如果你认为韩寒案
中方舟子确实不对,但是仍然认为方舟子以往的打假是有价值的,且期望他未来继续打
假的,请务必认真看一看此文。
方舟子以前一直在学术性很强的专业领域“打假”,而专业领域的专业术语是外行人很
难懂的。当两个人争论专业问题的时候,外行对他们的语言其实会像火星语一样完全听
不懂。这导致的后果就是,两个人在用火星语吵架,你其实完全不知道他们在吵什么,
而这时你究竟依靠什么来判断谁说的是对的?
以下言归正传,我们来看一场专业领域的打假案:方舟子打魏于全案。(以下蓝字部分
为来自亦明先生《方舟子恶斗肖传国始末》,黑字部分来自博主网络资料搜索整理,红
字为欢乐部分,绿字为博主吐槽。)
2006年3月26日,新语丝发表了司履生的举报信,举报魏于全院士论文造假。(全文见
http://bbs.ebiotrade.com/showtopic-12290.aspx )方舟子在登出这封举报信时,加了按语,表示认为司履生举报成立,魏于全的论文确实造假。按语全文如下:
【方舟子按:司履生教授信中提到的给Nature Med... 阅读全帖
i********t
发帖数: 261
2
来自主题: Literature版 - [合集] 《三体》读后感
☆─────────────────────────────────────☆
aixiaoke (流浪者的乡愁) 于 (Mon Oct 24 07:54:02 2011, 美东) 提到:
用“宇宙史诗”来形容刘慈欣的《三体》系列我想并不过分——它对宇宙的起源
、生命与环境间的相互作用、文明的演变、人类的整合,甚至宇宙的终极走向,都给出
了自圆其说的明确猜想及推论;这一庞大的体系通过一些相关而分离的片段如冰山一角
般呈现出了一个具有高度美感的思维体系,描述了永恒之初直至宇宙尽头的维度之旅;
它确立了微观与宏观彼此渗透交错的依存关系,而贯穿其中的则是人类的情感,有激情
的壮丽澎湃,有爱情的温柔微妙,也有绝情的冷酷黑暗。这一切的丰富片段、结构、内
涵极其跨越的时间广度,我觉得也只能用“史诗”来进行总结,否则便不足以准确表达
《三体》的气魄。
1 游戏

这么庞大的史诗故事起点却很微妙。文革中叶文洁目睹理论物理学家的父亲被红卫
兵小将们打死在批斗台上,而母亲为了自保不惜出卖人格丑态毕露。这个从时代泥沼中
成长起来的姑娘经历了一次又一次人间最险恶的政治斗争、最丑恶的灵魂背叛,终于... 阅读全帖
g*****l
发帖数: 424
3
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
w***g
发帖数: 5958
4
来自主题: Programming版 - 被docker气死了
就我的理解,深度学习一般不太追求对问题的建模。
贝叶斯学习则比较注重对问题建模。贝叶斯方法和
函数式编程在有一点上非常像,就是极度追求
理论的完美性,当和现实世界的不完美性产生
冲突时,会把不完美的那部分排除在理论之外。
比如Haskel用IO monad包装整个现实世界,从而
实现形式上的纯函数式。贝叶斯方法则严重依赖
prior probability。至于prior probability
怎么选则不予讨论。而且prior distribution
的形式完全是由数学上的和谐性决定的,说不出
什么物理依据。比如multinomial分布的prior
是dirichilet分布,完全是由数学形式上的
可行性决定的,没啥道理可讲。因为有这些理论
上优美性的条条框框制约,所以这两个东西在
实战上总是输人一截成不了主流。这次神经网络
兴起之前最流行的graphical model就是贝叶斯
方法,图像分类的实战上一直干不过SVM。
本来这两个是独立的概念没法比,但因为都在
图像分类上有应用,所以勉为其难从效果上
比一下。希望专家路过指正。
o****o
发帖数: 8077
5
我操,这也太强了吧
从数值计算到随机微分,从贝叶斯到元胞自动机(英文是啥?),啥叫空间统计呀?
1门课讲这么多,我看学生学下来真的是啥也学不到,叫万精油不错,可以接受报纸采
访的时候卖弄一下专业名词。这个老师也就是看看网上的tutorial再加点code就能上课
了。
一个贝叶斯统计入门就够学个1学期了,要学贝叶斯,先要学学蒙特卡罗方法,那里面
那些随机数生成方法又够学个1学期
U*****e
发帖数: 2882
6
你这第一个理解属于频率论(Frequentist Statistical Theory),第二个理解属于贝叶
斯论(Bayesian Statistical Theory)。统计理论这两派打架打了几百年了。
简单说,频率论的观点是,如果甲的混合策略的分布是50-50,那么乙和旁观者观察到
的结果应该大致是50-50。贝叶斯论的观点是,不管观察到的结果是什么,只要乙的
best response和50-50的预期一致,对于旁观者来说,甲用50-50混合策略的可能性就
不能排斥。换句话说,贝叶斯论的观点只在乎agent的best response。这需要额外的理
性agent的假设。如果你能接受这个假设,理解第二个说法应该不是难事。
举个有点凑合的例子,不记得在那里看到的。据说马拉多纳(或者另一个球星)射点球
往往只往门的固定一边打,但是守门员们在扑他的球的时候倒向两边的情况都不少。
m*******u
发帖数: 25
7

哦。。。我理解的思路一直和这个相反
我能问问什么叫 min/max?
我想我问的问题就是在确定fusion算法时所用到的统计算法的问题
我还想问问 为什么很多文章提到贝叶斯网络 我对贝叶斯理论的理解怎么都无法和data
fusion联系在一起 到底是个什么思路 抓球里的先验概率然后给出一个假设 通过贝叶
斯理论得到后验概率 或者说得到一个我们期望的假设到底有多可信 可是用在网络传输
里 这是哪儿跟哪儿啊 和data fusion算法之间又是什么关系呢
g*****l
发帖数: 424
8
来自主题: Mathematics版 - 数据科学之江湖兵器谱 (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
d******h
发帖数: 39
9
来自主题: Statistics版 - Frequentist and Bayesian
有人学了多年统计说不清楚频率学派与贝叶斯学派的区别,什么主观对客观啦,什么似然
函数对后验概率啦,那些都是现象,不是本质。两者本质上的区别是:频率学派把未知参
数看作普通变量,把样本看作随机变量;而贝叶斯学派把一切变量看作随机变量。
数学与统计学最大的区别在于数学研究的是变量,而统计学研究的是随机变量。对统计学
家来说,把一切变量看作随机变量是更自然的事。
如果说贝叶斯学派是纯粹的统计学家,那么频率学派就是数学统计学家,尚处在从数学向
统计学过渡的中间阶段,好比蝌蚪。既然你已经从鱼变成了青蛙,为什么还要保留尾巴呢

如果一切变量都是随机变量的话,那么频率学派的很多概念就失去了意义。比如无偏估计

若E(T)=t则说统计量T是未知参数t的unbiased estimator。如果参数t是随机变量,那个
等号就毫无意义,因为统计量T的期望E(T)是一个数量,它不可能等于一个随机变量,除
了trivial的情况下。
另外,在对置信区间的含义作解释时,也不用像频率学派那样费劲。什么未知参数是未知
而固定的值,而区间是随机区间,因为区间的端点是统计量,因而也是随机变量,每次随
着观测样本的不
e*******r
发帖数: 29
10
来自主题: Statistics版 - 评论陈立功其人其事
我刚在另一个主题回了个帖子,也猜陈老师的意思接近贝叶斯观点。
http://www.mitbbs.com/article_t1/Statistics/31282275_0_3.html
发信人: estimator (longlongago), 信区: Statistics
标 题: Re: 陈大师的意思我终于有点领会了
发信站: BBS 未名空间站 (Fri May 20 00:54:00 2011, 美东)
我猜你大致的意思是根据数据估计断点位置可能的分布,并且考虑断点个数的不确定性
。频率学派把断点位置作为未知常数来估计,而估计量将是一个依赖数据的随机变量;
贝叶斯学派把未知参数作为随机变量来处理,这可能接近你所说的"随机常量"的
意思。另外,断点个数的不确定性也可以用后验概率来估计。建议你查阅相关文献。
如果以上猜测没错的话,我想所谓的哲学问题、新地平线就可以理解了。从频率学派到
贝叶斯学派观点的转换,用这些词不为过,当然这里不涉及哪个学派更优的争论。
n****t
发帖数: 182
11
交流要有个“名言共许”的前提,否则就说不清楚了。
用概率来描述估计值的方法当然是存在的,贝叶斯就是--这也是贝叶斯学派坚持用条件
概率分布来描述统计结果的原因之一:无论是FISHER的p值,还是N-P的验证区间,都很
容易引起误解。贝叶斯条件概率就很直观--起码表面如此。
T*******I
发帖数: 5138
12
来自主题: Statistics版 - 数学好的人一般统计都好吗?
你确定你理解了上文中Dr. Huber的言论和我的言论?
关于贝叶斯派和频率派, 我个人对贝叶斯派从哲学的认识论角度持完全否定的立场。准
确地说, 贝叶斯派是数学家而非统计学家, 他们是靠玩假设和先验导出自己的结论, 是
十足的数学思维。
g*****l
发帖数: 424
13
来自主题: Statistics版 - 数据科学之江湖兵器谱 (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
m***r
发帖数: 359
14
来自主题: DataSciences版 - 机器学习日报2015年2月楼
机器学习日报 2015-02-02
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-02/short.html
1) 【GloVe算法(另一种词向量训练算法)相关资源】 by @爱可可-爱生活
关键词:算法, 自然语言处理, 教育网站, 可视化
[开源]《GloVe: Global Vectors for Word Representation》 [1] GloVe算法(另一种
词向量训练算法)相关资源:论文、源码、数据集及训练好的模型文件、相关脚本、相
似词向量和线性子结构等代表性结果、训练方法、模型概述以及可视化等,可以和
word2vec对比看看 云: [2]
[1] http://nlp.stanford.edu/projects/glove/
[2] http://pan.baidu.com/s/1mgqUFxe
2) 【Large-scale L-B... 阅读全帖
a****t
发帖数: 7049
15
没觉得贝叶斯“必须”引入任何信息,对待数据的态度完全可以和频率主义一致。但是,
如果你想引入,贝叶斯确实还给你留一条路,这是缺点吗?说白了,有时候欲引入领域
专家的判断时,也不会是与数据无关和独立的信息,只是为了取得另一种意义上的数据,
测量的是专家的脑瓜。火候当然要把握好,不过作为一种可测试的产品,结果可以说明
一切。如果不信任专家判断,就要求不用好了,这都和贝叶斯本身没关系。

Bayesian
g*****o
发帖数: 812
16
现在只有纯应统不学贝叶斯了吧,感觉我有好多课没说是贝叶斯方向的,也掺杂了贝叶
斯的内容

是有
b*********c
发帖数: 1058
17
http://tinyurl.com/lcwxbyf
马来西亚航空公司MH370航班失踪后,机上百余名同胞的行踪牵动着全国人民的心。我
国积极参加这场数十个国家共同进行的搜寻行动,付出了巨大的人力、物力。然而,失
踪客机却好像化为幽灵,消失在海天之间。在各国投入数十颗卫星、数十架飞机和许多
舰船,在多个马航飞机可能坠落的海区来回搜寻近一个月后,仍未找到任何可以确认为
飞机残骸的物体。直到5号中国“海巡01”船接收到黑匣子发出的音频信号,才似乎终
于为搜索工作打开了突破口。
然而,关于黑匣子音频信号的说法却令人大感疑惑:照理说飞机黑匣子在水下会不断发
出声脉冲信号,为何“海巡01”却只是间断性地接收到两次且每次持续时间都极短的信
号?为何载有更先进声呐设备和拖曳式黑匣子搜寻装置的澳大利亚“海盾”号,在距离
“海巡01”船有相当距离的另一片海域听到了信号?为什么不能立刻循着信号找到黑匣
子?
搜到黑匣子,只是开始
侦听到疑似黑匣子脉冲信号的“海巡01”轮(资料图)
黑匣子声信号与大海的“戏法”
从现有的情况分析,这很可能是大海变的“戏法”。本文将试着从水声学的一些基础知
识来探寻“戏法”背... 阅读全帖
M**S
发帖数: 3483
18
一个大高楼里没有一个人认识到“知不知道女儿的次序”是一个极为重要的信息,知道
和不知道这个女儿的次序(也即头胎或者二胎)差别很大,决定了答案是1/2还是2/3:
http://www.mitbbs.com/article_t/Military/44810819.html
我老几句话就说清楚的事情,六十多个楼盖上去了滴答还在用自己文科生想象力解题呢
,真是服了。
看回帖里还有贝叶斯phd,也没说清问题的关键,真是还不如我老这个当年就自学了一
学期贝叶斯的二把刀,唉。
t******l
发帖数: 10908
19
我觉得是我高中时的贝叶斯定理没真正理解,只是套公式把考试给对付了。。。这个是
我自己高中数学没学好的问题,我得先给自己补课高中贝叶斯定理的真正意义,回头再
想其他的。


: "a random matrix (sometimes stochastic matrix) is a matrix-valued
random

: variable—that is, a matrix some or all of whose elements are random

: variables. Many important properties of physical systems can be
represented

: mathematically as matrix problems. For example, the thermal
conductivity of

: a lattice can be computed from the dynamical matrix of the particle-
particle

: interac... 阅读全帖
t******l
发帖数: 10908
20
我觉得是我高中时只理解了好比 probability by sampling,没能真正理解
probability by degree of belief。。。需要补课。


: 我觉得是我高中时的贝叶斯定理没真正理解,只是套公式把考试给对付了
。。。
这个是

: 我自己高中数学没学好的问题,我得先给自己补课高中贝叶斯定理的真正
意义,
回头再

: 想其他的。

: random

: represented

: conductivity of

: particle

t******l
发帖数: 10908
21
来自主题: Military版 - 我好像走火入魔了
我刚才吃了三颗草莓,都觉得很甜。
我把第四颗草莓放在嘴里的时候,正在想这第四颗草莓,是应该甜,还是不应该甜?。
。。是应该走高中低端概率论,还是应该走高端贝叶斯分布?。。。走高端贝叶斯分布
的话,我应该走增加整盒草莓都是甜草莓的概率呢?。。。还是应该走吃了越多的甜草
莓,剩下吃到不甜的草莓的概率就会不断增加?
。。。
还是说,我应该看一下这颗草莓是红还是青?
。。。
D***n
发帖数: 6804
22
如果西雅图儿童医院的急诊医生,看到与某种罕见病的基因检测,酶活性阳性结果,他
就推断这个病人有很大概率得了这个罕见病,立刻采取行动。
对不起,这样做会有很大的概率做的是错的。就算酶活性高,家庭兄弟也有这个病,很
有可能完全不能证实必然产生这个病,不仅不是必然,甚至可能有一大半都是假的结果。
大一的概率课本上就有这个例子:
P(病|基因检测和酶活性阳性) =
P(基因检测和酶活性阳性|病) P(病) / normalize(P(基因检测和酶活性阳性))
如果P(病) 这个概率很低,P(基因检测和酶活性阳性|病)的概率再高,也就是这个病会
导致基因变异酶活性的概率再高也没鸟用啊。
------------
wiki上有具体的例子:https://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%
AF%E5%AE%9A%E7%90%86
假设一个常规的检测结果的敏感度与可靠度均为99%,即吸毒者每次检测呈阳性(+)的
概率为99%。而不吸毒者每次检测呈阴性(-)的概率为99%。从检测结果的概率来看,
检测结果是比较准确的,但是贝叶斯定理卻可以揭示... 阅读全帖
l****z
发帖数: 29846
23
没用, 中国从来就是工匠级的水平, 当初贝叶斯在修道院搞出那么牛比的贝叶斯定律来
的时候, 中国是乾隆年间?
Q*******1
发帖数: 91
24
你好,时隔一年多,我已经到美帝一个ds专业读了半年多,现在回看我当初发的帖子发
现,你建议我要学学贝叶斯统计。我现在正好在纠结是否要选这门课了。贝叶斯统计的
话,会很难。另外一门是software system design(软件工程主要用java)。所以不知
道你推荐我上这两门课的哪一门呢?
E*******F
发帖数: 2165
25
来自主题: JobHunting版 - 想当数据科学家如何选课
东西当然是会得越多越好
不过如果你想当data scientist的话,software design没太大用,面试也不会考
你如果以前对贝叶斯不太了解的,应该学一下
这个名字下有很多不同的内容,比如有的只是在回归的基础上加上prior
有的则是搞出贝叶斯网络,马科夫网络啥的,跟传统统计差别很大
Q*******1
发帖数: 91
26
来自主题: JobHunting版 - 想当数据科学家如何选课
贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
识呀。
E*******F
发帖数: 2165
27
来自主题: JobHunting版 - 想当数据科学家如何选课
东西当然是会得越多越好
不过如果你想当data scientist的话,software design没太大用,面试也不会考
你如果以前对贝叶斯不太了解的,应该学一下
这个名字下有很多不同的内容,比如有的只是在回归的基础上加上prior
有的则是搞出贝叶斯网络,马科夫网络啥的,跟传统统计差别很大
Q*******1
发帖数: 91
28
来自主题: JobHunting版 - 想当数据科学家如何选课
贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
识呀。

发帖数: 1
29
来自主题: JobHunting版 - 无人驾驶-自动驾驶研究 = base国内
"1.研究专家/工程师,深度学习
基于算法和软件模块为自动驾驶车辆开发,集成和测试先进的机器学习。
博士/硕士在计算机科学,电气工程,机器人,统计或相关领域
深入洞察机器学习的成长
应用机器学习方法的经验,如深卷积神经网络,循环神经网络,实例感知语义
分割等。
至少使用以下工具之一的经验:Caffe,TensorFlow,Theano等。
具有C / C ++和Python的经验
具有图像处理和计算机视觉的经验
好奇,主动,有兴趣学习新的工具和技术
具有适应于团队环境工作的强大的口头,书面和人际沟通能力
2.研究专家/工程师,车辆智能
为不确定性下的概率规划和决策进行算法的研究,开发和实现。
博士/硕士在计算机科学,电气工程,机器人,统计或相关领域
具有规划应用于机器人的在不确定性的和概率方法的专业知识(如贝叶斯推理)
知道最近的机器学习算法(例如贝叶斯网络,增强学习,深卷积和/或循环神
经网络)以及优化技术
&... 阅读全帖
f*****c
发帖数: 3257
30
来自主题: WashingtonDC版 - 小弟预测一下大选哈,欢迎捧场。
奥巴马和罗姆尼这会正在纠缠,貌似摇摆州势均力敌。
问题出在民调上,奥巴马的ex ante获胜概率貌似要高一点点,现在媒体的汇报结果是
奥巴马可能是微弱优势获胜。
根据贝叶斯概率,民调之后投票概率会受到民调结果的影响。很多摇摆不定的居民可能
有两个策略:投靠强者以从大众,以及投给弱者以显示自己的独特影响。
俺对摇摆州的居民没啥了解,ohio, nh等都不熟悉;不过作为大选日尚在犹豫的选民,
可能更加倾向于投给能影响默认结果(或者status quo)的一方,最后可能占微弱优势
的奥巴马反而有很大的贝叶斯修正败选概率。
参考当年布什和克里的大选前民调,走浪漫文艺男路线的克里一路以微弱优势领先小布
什,在大选前的几个民调,克里依然只是有微弱优势;摇摆选民依据ex post民调结果
调整自己策略,小布什的获胜概率反而上升了。
n****1
发帖数: 1136
31
来自主题: Soccer版 - 概率问题
你不懂啥叫贝叶斯吧,我没看出贝叶斯定律和我的问题有啥冲突
P(A|B)=P(A && B) /P(B)
r*******a
发帖数: 27
32
你不是号称学应用统计的么,怎么会连条件概率都不了解?
简单举个例子:
假设一个学校里有60%男生和40%女生。女生穿裤子的人数和穿裙子的人数相等,
所有男生穿裤子。一个人在远处随机看到了一个穿裤子的学生。
那么这个学生是女生的概率是多少?
使用贝叶斯定理,事件A是看到女生,事件B是看到一个穿裤子的学生。
我们所要计算的是P(A|B)。
P(A)是忽略其它因素,看到女生的概率,在这里是40%
P(A')是忽略其它因素,看到不是女生(即看到男生)的概率,在这里是60%
P(B|A)是女生穿裤子的概率,在这里是50%
P(B|A')是男生穿裤子的概率,在这里是100%
P(B)是忽略其它因素,学生穿裤子的概率,P(B) = P(B|A)P(A) + P(B|A')P(A'),在这
里是0.5×0.4 + 1×0.6 = 0.8.
根据贝叶斯定理,我们计算出后验概率P(A|B)
可见,后验概率实际上就是条件概率。
有了看到的这个学生是穿裤子的这个信息之后,那个人是女生的概率就不再是原来的40%
而是降低到25%了。
d****a
发帖数: 655
33
来自主题: TrustInJesus版 - 某评论家对读后感作家的评论
☆─────────────────────────────────────☆
justbbzhu (CANGSISALK) 于 (Sat May 11 18:15:53 2013) 在
【某评论家对读后感作家的评论】 的大作中提到:
香港有一位神学家也曾经在网上逐条反驳我。但是我认为他们的回应并没有消除圣
经的矛盾,不过是一厢情愿的强词夺理。他们惯用的思路,就是当圣经的两处说法
有矛盾时,就说其中的一种说法不能按字面的意义理解,而是有别的、迂回曲折的
解释。在他们看来,圣经明明白白的说法不对,他们的迂回曲折的解释才是其本来
意思。这是以神自居强暴圣经,乃是“亵渎神灵”的。
☆─────────────────────────────────────☆
songlinjian (大音希声) 于 (Sat May 11 18:21:34 2013) 在
【Re: 某评论家对读后感作家的评论】 的大作中提到:
如果却是存在一条曲径通幽,一条坦途大道呢?最后两条殊途同归,有没有可能?1%有
么?10%了
而你直接否定了这种可能性,拒绝一切可能的这类认真思考。你觉得合适么?你怀... 阅读全帖
d********g
发帖数: 10550
34
来自主题: Programming版 - Delphi这个语言是不是已经死了?
贝叶斯放desktop就是前台,放你们“backend”就是高贵的后端,这道理懂吧?你要懂
了贝叶斯,去Gmail做dev都有戏。我看好你
m***r
发帖数: 359
35
来自主题: Programming版 - Python日报 2015年2月楼
Python日报 2015-02-25
@好东西传送门 出品, 过刊见
http://py.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅Python日报
更好看的HTML版
http://py.memect.com/archive/2015-02-25/short.html
1) 【Python代码优化】 by @爱可可-爱生活
关键词:工具, 库, 数据科学, IPython, 博客, 计算
[文章]《Optimizing Python in the Real World: NumPy, Numba, and the NUFFT》 [
1] 以非均匀快速傅立叶变换(NUFFT)为例介绍面向实战的Python代码优化 ipn: [2]
[1] https://jakevdp.github.io/blog/2015/02/24/optimizing-python-with-numpy-
and-numba/
[2] http://nbviewer.ipython.org/url/jakevdp.github.io/d... 阅读全帖
m***r
发帖数: 359
36
来自主题: Programming版 - Python日报 2015年3月楼
Python日报 2015-03-14
@好东西传送门 出品, 过刊见
http://py.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅Python日报
更好看的HTML版
http://py.memect.com/archive/2015-03-14/short.html
1) 【用Python解决蒙提霍尔问题(Monty Hall problem)】 by @Python传送门
关键词:Monty Hall, 蒙提
用Python解决蒙提霍尔问题(Monty Hall problem) [1]
[1] http://trevorappleton.blogspot.co.uk/2015/03/solving-monty-hall-problem-with-python.html?utm_content=buffer28355&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer
2) 【利用Python和OpenCV将URL直接转换成OpenCV... 阅读全帖
w***g
发帖数: 5958
37
虽然不是从中国来的,不过一大半publication都有华人的名字吧。
余凯技术很牛,他说应该搞贝叶斯网络,那贝叶斯网络可能还真有
戏。

发帖数: 1
38
来自主题: Programming版 - 我出的面试题是不是太难了
搞啊三太容易了 上来问贝叶斯 贝叶斯问完了问clt 强大数定律弱大数定律区别 问的
细一点 然后三大分布的应用
对方要真能都答得挺好 我也就招了


: 这几年我面了n多DS了,n好几百,啥奇葩都有,这里谈谈体会。

: 先说点技术的吧,问这个题,相当于在高考数学里问:请证明勾股定理。

: 这玩意人人都会用,但是没几个能证出来。

: 你还别不信,我国高考历史上真有这题。。。

: 再说点非技术的:

: 1. 这题最大的用处在于,刷掉那个我们都很讨厌的群体,说的谁,你懂的。我
还考过

: 丫们一元一次方程。想干掉他们,有一万种方法。

: 2. 招人的原则:不在于他能不能答上来,关键是表现如何。在面试官引导下,
能不能

: 一步步思考接近答案。很多知识点临时不会没关系,之后态度好智力正常,招进
来慢慢

: 学都没问题。关键是看态度,看交流能力,看思维方式。这个只能靠面试官自己
体会。

t**********t
发帖数: 12071
39
来自主题: Biology版 - 搞CS的过来挺一下中医吧
搞机器学习的人老老实实承认自己并不清楚学习机的直观解释,如果哪个搞机器学习的
人说我搞的贝叶斯网络是基于阴阳调和理论运行的我的网络是利用输入的阴气来调和输
出的阳气而贝叶斯的输入输出有经脉相连打通任都二脉就可以保证训练好,那估计会贝
任笑死的。
所以,如果中医只是老实地记录药物(输入),药效(输出),病人情况(参数)以积
累经验并且建立起输入输出的唯象联系的话,那是没有什么问题的。但是问题是中医宣
称自己理解了内部的机理,问题在于这里。

10
a****t
发帖数: 7049
40
没觉得贝叶斯就更主观了,只是留下了代入领域专家主观信息的余地和灵活性。这是
option不是necessity,岂不是一件好事?事实上,你做任何推断时,如果涉及一个模
型,本身已经引入数据外的主观信息了,所以频率论其实也没客观到哪里去,只不过把
世界武断地分成“模型”和“参数”,然后只考虑参数的客观,不考虑模型哪来的。相
反地,贝叶斯用信息传递来诠释推断,近年来做得非常漂亮,结合信息论和图模型直接
从数据中把模型和参数一道整出来,这不是更客观?
再进一步,世界上任何的“未知”归根结底是一个概率分布,决定值不过是特例,甚至
是宏观假象。所以随机世界也没怎么不好假定,说它是常态也不算错。
n********s
发帖数: 144
41
坚决不是传说
贝叶斯尤其贝叶斯公式什么的避不开,什么时候都有,但是解释就不一样了。你问问那
个时候是不是用所谓先验概率的概念,用的话又怎么解释的。
e*******r
发帖数: 29
42
来自主题: Statistics版 - 陈大师的意思我终于有点领会了
我猜你大致的意思是根据数据估计断点位置可能的分布,并且考虑断点个数的不确定性
。频率学派把断点位置作为未知常数来估计,而估计量将是一个依赖数据的随机变量;
贝叶斯学派把未知参数作为随机变量来处理,这可能接近你所说的"随机常量"的
意思。另外,断点个数的不确定性也可以用后验概率来估计。建议你查阅相关文献。
如果以上猜测没错的话,我想所谓的哲学问题、新地平线就可以理解了。从频率学派到
贝叶斯学派观点的转换,用这些词不为过,当然这里不涉及哪个学派更优的争论。
F******n
发帖数: 160
43
不是高手,只是对kalman filter熟悉,略微了解一些Bayesian DLM的基本概念,所以
也许可以讨论一下。我的讨论见下面。

对于正态的噪声,标准“卡尔曼滤波”和标准、简单的“贝叶斯线性动力模型”应该就
是一回事吧。而且对整个系统有封闭的解析结果。
:而且hessian of log likelihood function就是这个mle estimator的
sa
么?
不太确定我理解了你这个问题,就我所理解和知道的说说。
标准“卡尔曼滤波”针对的主要问题不是预测,而是实时滤波和估计。比如说,对于一
个线性动力系统,你观察到一系列数据,想估算某些动力状态量,最简单的像定位跟踪
系统,你知道动力模型,观测到目标在每一个时刻的位置坐标,想算出速度,加速度,
角速度等等。当然你不能用简单的两个时刻的位置一减除以时间间隔来做。这些速度,
加速度,角速度就是上面模型里的theta_t(不可直接观测的“隐含”动力态)。所以
“卡尔曼滤波”(或者正态噪声的“贝叶斯线性动力模型”)问题就是这样一个构造:
1. 估计问题:当观测到一个新数据y_t(位置),借助y_t = F * theta... 阅读全帖
k*****u
发帖数: 1688
44
原作者为 爱萌@人大经济论坛,本文是我转载过来的。
文本挖掘是新时期人们对数据的更加深入的需求的,文本挖掘的原材料是各种文本格式
的文本,文字,图片,通过这些来分析相似,关键性,内部蕴涵的逻辑结构等等.
文本数据多是半结构化的数据,(结构化数据是有一定规律的数据,半结构化,是这些文本
有标题,作者,出版日期,类别等结构的东西,同时也有非结构的成分:内容)
文本挖掘有很多方法,基于关键字的方法,标记方法,信息提取方法.
web挖掘是对网页的挖掘,这是因为随着www的发展,
越来越多的信息在网络中,这些数据不仅对商业,对经济,
而且对政治,文化有很深远的影响. web挖掘可以分为web内容挖掘,web结构挖掘,web使
用挖掘,
可以根据html语言对web进行文本挖掘从而达到web挖掘,
但是很多网页并不遵守W3C html规范.
如何通过SAS进行编程对文本,web进行挖掘
为什么我一直在说SAS的文本挖掘和web挖掘,因为这些程序我还不知道如何编写,
其他程序我都知道了,也编写过了.
这是与算法相关的了!
文本挖掘是数据挖掘的一种,有时也看成是质性研究的一种方法。大致的... 阅读全帖
T*******I
发帖数: 5138
45
拜托,不要把统计搞成了数学。在数学范畴里,一些概念和定义何许是永恒不变的,但
在统计学里,一些概念和定义则有可能被不断更新。否则,我们的思想就会被僵化,就
不会有新思想的诞生和新算法的形成。
一个说法是否正确,并不取决于它是否符合现有的概念和定义系统,而是是否符合它本
身所表达的现实世界。为此,我们更多的是需要一种缜密的哲学式的思考,而不是在既
有的概念系统里进行考证。所以,在统计学里,“名言共许”是不必要的。
你借用贝叶斯理论来解释概率和统计量之间的关系,表明你没有准确地理解我所说的检
验概率和统计量之间的关系。建议你回头看看我是如何解释回归系数的检验的。在我的
解释里面有两个极其重要的概念:系统误差和随机误差,它们构成了b-0的全部。我的
这个解释与贝叶斯理论完全无关,而可能是对Fisher检验原理的重新阐述,如果以前没
有人这样做过的话。
c*********4
发帖数: 8
46
来自主题: Statistics版 - 一个probability的问题,关于flip coin
问得好.
楼主的问题是个很典型的贝叶斯问题,知道数据,求参数的概率,用贝叶斯定理.如果
谁还不明白的话,建议回头复习一下统计基础课.没准下次面试还真碰到类似问题.:)
f*********2
发帖数: 48
47
老大,做ML的这些都是入门要求,您所提到的这些俺都能手推。
还能顺着 Fisher information 侃一点 information geometry;吹吹 MCMC 的几个经
典算法,包括 reversible jump MCMC;大谈主观贝叶斯和客观贝叶斯,以及和频率派
的那些恩恩怨怨;解常微方程不敢,聊一聊它的定性与稳定性理论,像 Lyapunov的几
个定理还是可以的;耍矩阵是一方面,另外还懂点张量分析;微分几何和微分拓扑都学
过,捡捡还能继续;从 Newton 法、梯度下降法、Lagrange 乘子法(包括对偶问题、
二次规划)到 Levenberg-Marquardt 法、BFGS 法等非线性最优化算法都能手推。
以我个人的经验,懂这些有个屁用!
手推更是变态!!又不是作发考题。就是当教书匠,大牛 Ng 讲课还拿着稿呢。
所以,我尊重你的学识,鄙视你的几乎致人内伤的考题!!!
老子花了很长时间总结失败的面试,基本与智商无关。最关键的是情商,得会幽默着侃
晕你的考官,得有一个阳光健康的外型。
至于工业界里的数学,计算机系或物理系本科的就够了。我们组的一个白人老油条,虽
... 阅读全帖
f*********2
发帖数: 48
48
老大,做ML的这些都是入门要求,您所提到的这些俺都能手推。
还能顺着 Fisher information 侃一点 information geometry;吹吹 MCMC 的几个经
典算法,包括 reversible jump MCMC;大谈主观贝叶斯和客观贝叶斯,以及和频率派
的那些恩恩怨怨;解常微方程不敢,聊一聊它的定性与稳定性理论,像 Lyapunov的几
个定理还是可以的;耍矩阵是一方面,另外还懂点张量分析;微分几何和微分拓扑都学
过,捡捡还能继续;从 Newton 法、梯度下降法、Lagrange 乘子法(包括对偶问题、
二次规划)到 Levenberg-Marquardt 法、BFGS 法等非线性最优化算法都能手推。
以我个人的经验,懂这些有个屁用!
手推更是变态!!又不是作发考题。就是当教书匠,大牛 Ng 讲课还拿着稿呢。
所以,我尊重你的学识,鄙视你的几乎致人内伤的考题!!!
老子花了很长时间总结失败的面试,基本与智商无关。最关键的是情商,得会幽默着侃
晕你的考官,得有一个阳光健康的外型。
至于工业界里的数学,计算机系或物理系本科的就够了。我们组的一个白人老油条,虽
... 阅读全帖
e*g
发帖数: 4981
49
4月10日,“人机大战”的消息再次传出,关于人类和AI的对抗再次牵动世界的神经。
“我会抱必胜心态、必死信念。我一定要击败阿尔法狗!”对于5月23日至27日与围棋
人工智能程序AlphaGo(阿尔法狗)的对弈,目前世界排名第一的中国职业九段柯洁放
出豪言。
然而,AlphaGo(阿尔法狗)之父却说,“我们发明阿尔法狗,并不是为了赢取围棋比
赛。”
据澎湃新闻4月13日报道,近日,AlphaGo之父杰米斯·哈萨比斯(Demis Hassabis)在
母校英国剑桥大学做了一场题为“超越人类认知的极限”的演讲,解答了世人对于人工
智能,对于阿尔法狗的诸多疑问——过去3000年里人类低估了棋局哪个区域的重要性?
阿尔法狗去年赢了韩国职业九段李世石靠哪几个绝招?今年年初拿下数位国际大师的神
秘棋手Master究竟是不是阿尔法狗?为什么围棋是人工智能难解之谜?
杰米斯·哈萨比斯,Deep Mind创始人, AlphaGo之父
杰米斯·哈萨比斯,Deep Mind创始人,AlphaGo(阿尔法狗)之父, 4岁开始下象棋,
8岁时在棋盘上的成功促使他开始思考两个至今令他困扰的问题:第一,人脑是如何学
... 阅读全帖
n****4
发帖数: 12553
50
【 以下文字转载自 Military 讨论区 】
发信人: wsn2017 (萎缩男2017), 信区: Military
标 题: 迈克尔·乔丹来中国签约 出任蚂蚁金服的技术顾问
发信站: BBS 未名空间站 (Sun May 28 13:41:25 2017, 美东)
5月27日,蚂蚁金服在杭州举办技术日大会,期间CEO井贤栋宣布成立科学智囊团,在全
球范围内招揽各领域的世界级学者加盟。
让人兴奋的是,会上蚂蚁金服同时宣布,人工智能领域的世界级泰斗迈克尔·欧文·乔
丹(Michael I.Jordan)正式受聘成为蚂蚁金服新成立的科学智囊团(Scientific
Advisory Board)的主席,也是蚂蚁金服首位技术顾问。除了蚂蚁金服,百度、腾讯在
内的中国其他科技公司同样在引入学术界顶尖专家投入巨大,助力中国跨越“基础学科
”领域的巍巍大山。
迈克尔·乔丹,知名的计算机科学和统计学者,主要研究人工智能和机器学习。
根据公开资料,他的主要贡献包括:指出了机器学习与统计学之间的联系,让学界认识
到了贝叶基网络的重要性;他还发展了Jordan网络,是递归神经网络的一种。
乔丹目前... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)