由买买提看人间百态

topics

全部话题 - 话题: 参数估计
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
s********1
发帖数: 235
1
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=923635
就是在上面那篇文章的第四页有两个模型,一个是non-adaptive regression model,
一个是adaptive regression model。 non-adaptive regression model,是用least
squares 估计参数的,那adaptive regression model 呢?是用的什么方法估计参数的
?这两个模型形式相似,参数估计方法的差别在哪里?像这种adaptive regression
model,写成这种形式的,r 里面有什么package 可以分析这种adaptive regression
model?灵活一点,加些别的predictors 在里面,更复杂一些,r 能分析吗?多谢!
i*********m
发帖数: 10
2
来自主题: Mathematics版 - Hidden Markov 参数估计
有人做过Hidden Markov 参数估计吗?用什么方法比较好?如果有人写过这方面的代码
,能不能发给我参照一下。多谢了!
我的邮件i*********[email protected]
i*********m
发帖数: 10
3
来自主题: Quant版 - Hidden Markov 参数估计
有人做过Hidden Markov 参数估计吗?用什么方法比较好?如果有人写过这方面的代码
,能不能发给我参照一下。多谢了!
我的邮件i*********[email protected]
l*******s
发帖数: 1258
4
来自主题: Quant版 - Hidden Markov 参数估计
用CRF不比HMM靠谱多了吗?
结构类似于HMM,但是accuracy高很多。
没有independence的假设,可以很方便的定义feature function,有现成的L-BFGS参数
估计方法。
i*********m
发帖数: 10
5
来自主题: Statistics版 - Hidden Markov 参数估计
有人做过Hidden Markov 参数估计吗?用什么方法比较好?如果有人写过这方面的代码
,能不能发给我参照一下。多谢了!
我的邮件i*********[email protected]
s********1
发帖数: 235
6
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=923635
大家有谁懂adaptive regression参数估计的?我有个问题想问问。多谢。在上面那篇
文章的第四页,有一个adaptive regression model,我想问一下诸位,有谁懂adaptive
regression model parameter estimation的,该方法怎样运用到上面链接里的文章的
第四页的那样的adaptive regression model 里?r 里有什么好的相应package ?code
大致怎样?多谢!
m******2
发帖数: 564
7
来自主题: Statistics版 - 关于Structural Change的参数估计问题
我知道有个Chow Test看看样本中的两部分是否模型参数发生了根本性的改变
或者通过整体和大部分看看剩下的小部分样本的模型参数是否发生了根本性的改变
但是如果我想估算这小部分的参数,怎么办呢?
比如
2 7
3 8
5 17
-1 -2
4 12
3 9
1 4
3 12
可以作个线形回归
但是我认为最后两组数据的模型参数和以上数据发生了根本改变
我能通过先回归一次总体 再回归一次前6组,然后通过某种推测,估算最后这两组的线
性模型吗?
e*****m
发帖数: 320
8
时不变系统,假定有一组输入x(t)和输出y(t)已知。系统的传递函数未知。
通过一些其他知识和方法,可以估计系统的传递函数为:
h(t)=Aexp(-t/B) 其中A B为待定参数。
估计出来的h(t)与x(t)卷积,产生的y_estimate(t)必然与y(t)有一些误差。
按照一定的评判标准,必然可以得到一个最优值,获得A_estimate和B_estimate
这里面的问题是:有没有办法获得A_estimate和B_estimate这两个估计值的置信区间?
谢谢!
x********3
发帖数: 566
9
我的分布多数是3-parameter的lognormal或者gamma分布,以前都是用minitab估计参数
,现在想用matlab求,但是发现gamfit等命令似乎只适用于2-parameter的情况,不知
大家能否指点一二。谢谢。
n**l
发帖数: 17
10
来自主题: Quant版 - Hidden Markov 参数估计
给我refer一个,我就告诉你
kidding...
monte carlo可以估计一些参数
你考虑考虑
m******2
发帖数: 564
11
来自主题: Statistics版 - 关于Structural Change的参数估计问题
或者没有根本改变
但我感兴趣的就是最后两组数据的beta参数
能通过总体-大样本来推测剩下的参数吗?
h*********o
发帖数: 151
12
来自主题: Statistics版 - 请教一个关于非参数估计的问题
比如说模型: y_t = m(t)+e_t,如果用 local linear 来估计的话,e_t的assumption
是什么啊?我印象中,如果只是估计m(t)的话,e_t可以是iid的,可以是AR model,也
可以是alpha-mixing process吧?
顺便问一下,AR process和alpha-mixing process有什么关系么?比如说谁包含谁什么
的?
谢谢啦!
E**********l
发帖数: 264
13
来自主题: Statistics版 - 请教一个参数估计的问题
假如有一组数据 X_1,X_2,...,X_N, 源于一个mixture,PDF是 f(x)=(f_1(x)+f_2(x)
)/2,其中两个component PDF f_1(x)和f_2(x)符合以下条件:
1.) f_1(x) = f_2(-x)
2.) f_1(x) = f_2(x)exp(x/A)
能够从 X_1,X_2,...,X_N 估计出 A 吗?
c*********d
发帖数: 9770
14
【 以下文字转载自 Soccer 讨论区 】
发信人: chinabbsdad (张果老他爹), 信区: Soccer
标 题: 德国就是比墨西哥菜?“极大似然估计法”骗过了全世界的赌徒和球迷
发信站: BBS 未名空间站 (Mon Jul 2 20:34:35 2018, 美东)
原创:超模君 超级数学建模 微信号 supermodeling
功能介绍
超级数学建模,分享有用的数学知识、有趣的数学故事、传奇的数学人物。我们传播数
学文化,为你激发学习数学的兴趣,培养数学逻辑思维。该平台由多名数学博士维护,
敬请关注!
概率与似然
一对好伙伴
世界杯已经进行了半个多月了,早已经有黑眼圈了。
这届世界杯真是冷门频发,转折不断,可谓精彩纷呈,有人欢喜有人忧。有人中大彩,
有人上天台。
(你个几百块钱的就不要挤上来了)
世界杯球赛的结果是如此错综复杂,以致于很少有人能够准确地预测出每一场球赛的结
果。
在这种变幻莫测的运动赛事中,当然离不开概率。今天,超模君就从世界杯球赛的角度
来简单介绍下概率以及他的好基友——似然。
那么先来说大家是如何判断一场比赛的结果呢?
一般大家会通过各种信息,... 阅读全帖
M***D
发帖数: 117
15
此人对科尔很不满,从新计算,给的数字是2158万
——————————————————————————————
“大跃进”引起的人口变动
李成瑞
[新观察]·文库版·大饥荒档案 www.ChinaFamine.org 转载时请注明作(译)者及出处
提 要
关于“大跃进”引起的非正常死亡人口究竟有多少,由于当时的
户口登记数中有不少遗漏,而且其中包括正常死亡人口,故而难以作
出回答。 1982年全国人口普查资料和同年国家计划生育委员会的1‰
生育率抽样调查资料公布后,美国著名人口学家科尔教授利用这些资
料进行了反复研究,在1984年出版了《从1952年到1982年中国人口的
急剧变化》一书,其中估算我国1958至1963年超线性死亡 (非正常死
亡) 人口约为2700万(2680万)。我国西安交通大学人口研究所所长蒋
正华教授经过反复研究,在1986年撰写的《中国人口动态估计的方法
与结果》的专论和有关著作中,估算1958至1963年建国非正常死亡人
口约为1700万(1697万)。本文着重对以上两位学者的研究结果作了较
为详细的介绍和比较研究。笔者在研究中发现科尔计算的个别重要数
字与... 阅读全帖
g*******0
发帖数: 3240
16
北京《中共党史研究》1997年第2期第1-14页
http://www.yhcw.net/famine/Research/r060704a.html
李成瑞
(国家统计局原局长)
关于“大跃进”引起的非正常死亡人口究竟有多少,由于当时的户口登记数中有不少遗
漏,而且其中包括正常死亡人口,故而难以作出回答。1982年全国人口普查资料和同年
国家计划生育委员会的1‰生育率抽样调查资料公布后,美国著名人口学家科尔教授利
用这些资料进行了反复研究,在1984年出版了《从1952年到1982年中国人口的急剧变化
》一书,其中估算我国1958至1963年超线性死亡 (非正常死亡) 人口约为2700万(2680
万)。我国西安交通大学人口研究所所长蒋正华教授经过反复研究,在1986年撰写的《
中国人口动态估计的方法与结果》的专论和有关著作中,估算1958至1963年建国非正常
死亡人口约为1700万(1697万)。本文着重对以上两位学者的研究结果作了较为详细的介
绍和比较研究。笔者在研究中发现科尔计算的个别重要数字与有关数字间存在着难以理
解的矛盾,在针对这一矛盾对个别数字作技术性修订后,认为按科尔... 阅读全帖

发帖数: 1
17
李成瑞
关于“大跃进”引起的非正常死亡人口究竟有多少,由于当时的户口登记数中有不少遗
漏,而且其中包括正常死亡人口,故而难以作出回答。1982年全国人口普查资料和同年
国家计划生育委员会的1‰生育率抽样调查资料公布后,美国著名人口学家科尔教授利
用这些资料进行了反复研究,在1984年出版了《从1952年到1982年中国人口的急剧变化
》一书,其中估算我国1958至1963年超线性死亡 (非正常死亡) 人口约为2700万(2680
万)。我国西安交通大学人口研究所所长蒋正华教授经过反复研究,在1986年撰写的《
中国人口动态估计的方法与结果》的专论和有关著作中,估算1958至1963年建国非正常
死亡人口约为1700万(1697万)。本文着重对以上两位学者的研究结果作了较为详细的介
绍和比较研究。笔者在研究中发现科尔计算的个别重要数字与有关数字间存在着难以理
解的矛盾,在针对这一矛盾对个别数字作技术性修订后,认为按科尔的线性公式计算,
超线性死亡人口应约为2200万(2158万)。本文认为,科尔和蒋正华所依据的资料都具有
高度的可靠性,两人所采用的方法也各有其科学依据,但蒋正华所采用的以... 阅读全帖
l***y
发帖数: 4671
18
呵呵,这就是我为什么说你的数学公式都是对的。但是统计思想和统计概念更重要。这
里涉及到的,一个是假设检验的思想,另一个是 model and sample 的概念。
假设检验的目的是帮助决策。所谓决策,就是 decision。比如说,下个结论,说有显
著区别,这个产生结论的过程就是一个决策。 我们时时刻刻都在做决策,小到一个标
点符号的选择,都算决策。而假设检验是为了给理性决策提供依据,却并不能代替决策
本身。这就是我提到的,假设检验本身并不能证明任何事情。
具体到 t-test 上。在统计意义上,我可以比较安全地认为,在所有情况下,只要 n
足够大,对任意两个分布采样后用 t-test 都可以计算出其均值有显著差异。做这样的
判断的错误概率相当小,尤其是在你说的这种群体数目有限的情况下。但这有意义么?
再进一步讲,一个判断的意义,在于其信息的含量。我做的上述判断,有信息含量么?
会对决策有贡献么?如果没有,那么这样的假设检验,有意义么?
而大部分人不会故意在 paper 里放上没有意义的工作。那这种没有意义的假设检验的
实际意义何在呢?为发 paper 为自己的结论做个包装而已。
所... 阅读全帖
l***y
发帖数: 4671
19
呵呵,这就是我为什么说你的数学公式都是对的。但是统计思想和统计概念更重要。这
里涉及到的,一个是假设检验的思想,另一个是 model and sample 的概念。
假设检验的目的是帮助决策。所谓决策,就是 decision。比如说,下个结论,说有显
著区别,这个产生结论的过程就是一个决策。 我们时时刻刻都在做决策,小到一个标
点符号的选择,都算决策。而假设检验是为了给理性决策提供依据,却并不能代替决策
本身。这就是我提到的,假设检验本身并不能证明任何事情。
具体到 t-test 上。在统计意义上,我可以比较安全地认为,在所有情况下,只要 n
足够大,对任意两个分布采样后用 t-test 都可以计算出其均值有显著差异。做这样的
判断的错误概率相当小,尤其是在你说的这种群体数目有限的情况下。但这有意义么?
再进一步讲,一个判断的意义,在于其信息的含量。我做的上述判断,有信息含量么?
会对决策有贡献么?如果没有,那么这样的假设检验,有意义么?
而大部分人不会故意在 paper 里放上没有意义的工作。那这种没有意义的假设检验的
实际意义何在呢?为发 paper 为自己的结论做个包装而已。
所... 阅读全帖
C********g
发帖数: 9656
20
【 以下文字转载自 THU 讨论区 】
发信人: Communipig (共产猪), 信区: THU
标 题: 清华硕士及其导师被指抄袭 学校称构成学术不端
发信站: BBS 未名空间站 (Sun Jun 12 10:17:33 2011, 美东)
http://news.sohu.com/20110612/n309943569.shtml
来源:新民晚报·新民网
2011年06月12日04:18
潘晓春勾画出的论文核心公式被抄袭的地方 实习生 朱云辰 摄
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主
要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大
学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无
奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,
表示将会做出处理。
日前,快报记者就此事展开了... 阅读全帖
o***s
发帖数: 42149
21
潘晓春勾画出的论文核心公式被抄袭的地方
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,表示将会做出处理。
日前,快报记者就此事展开了调查。清华校方也向本报答复:初步构成学术不端,6月底将会作出最终的调查和处理结果。
无意中发现
论文被抄
最近这几年,潘晓春每年都有一篇学术论文发表,而这完全是兴趣使然。
“可能像我们这样工作多年的人,发表论文也就是评职称的需要,我当初也不排除这种想法,但后来发论文则与别人不同了,我确实很有兴趣研究些自己领域内的学术问题。”
潘晓春是江苏泰州人,1995年毕业于河海大学陆地水文专业,后进入东南大学攻读硕士,此后进入江苏省电力设计... 阅读全帖
C********g
发帖数: 9656
22
http://news.sohu.com/20110612/n309943569.shtml
来源:新民晚报·新民网
2011年06月12日04:18
潘晓春勾画出的论文核心公式被抄袭的地方 实习生 朱云辰 摄
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主
要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大
学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无
奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,
表示将会做出处理。
日前,快报记者就此事展开了调查。清华校方也向本报答复:初步构成学术不端,
6月底将会作出最终的调查和处理结果。
快报记者 张瑜 王凡
无意中发现
论文被抄
最近这几年,潘晓春每年都有一篇学术论文发表,而这完全是兴趣使然。
“可能像我们这样工作多年的人,发表论文也就是评职称的需要... 阅读全帖
p********a
发帖数: 5352
23
☆─────────────────────────────────────☆
cici (full house) 于 (Mon Nov 7 08:33:47 2011, 美东) 提到:
对于logistic regression
log(pi/1-pi)=b0+b1x1+b2x2
我现在已知independent variables和response variable{log(pi/1-pi)}
我要怎么做才能把参数b0,b1,b2 fit出来?非常感谢
☆─────────────────────────────────────☆
sleephare (I+don't+know.) 于 (Mon Nov 7 14:16:38 2011, 美东) 提到:
SAS, R?

☆─────────────────────────────────────☆
cici (full house) 于 (Mon Nov 7 16:19:05 2011, 美东) 提到:
R,thanks
☆────────────────────────────────────... 阅读全帖
T*******I
发帖数: 5138
24
或许,我们在统计学里需要把“等于”的概念与数学中的“等于”相区分。
统计学里的一个统计量“等于”某个数值不同于数学里的“x=3”这样的概念,因为任
何一个统计量都伴随着抽样误差或抽样变异性。由一个样本所估计出来的统计量不是一
个常量,而是一个随机的变量,因为样本是随机得到的。但一个样本本身的一切信息又
都是固定不变的,因此,由样本我们可以得到一个确定的估计结果。这个“确定性”仅
对样本本身成立,但对于总体则是随机而不确定的。所以,不能把由样本估计的统计量
看成是总体参数不可变的结果。
这种理解已经超出了经典数学里关于“同一性”或“相等”等概念的内涵。
因此,当检验一个回归系数b是否等于0时,我们通过检验b-0这个绝对差值中抽样误差
发生的概率大小而得到关于b本身的精确程度的估计。这是不容置疑的。又由于我们仅
有关于某个样本的回归系数可用,因此,这个回归系数便成为唯一可接受的关于总体相
应参数的估计结果的一个期望值,当然,还有关于它的抽样标准误。而由这个期望值和
相应的标准误,我们就可以得到关于总体参数估计的一个随机分布。没有其它。
我和你所使用的语言略有不同,这并不妨碍我们使用相同的方... 阅读全帖
s****h
发帖数: 3979
25
这里牛人多,有个旧车配件估计问题请教一下。
大概有1000辆不同model车的信息,大概10个model左右吧。
每辆车有旧车售出价格,年份,mileage,color,还有所有安装的配件,诸如moonroof
,navigation,upgraded engine, ungraded trim, 等等几十项。
需要估计每种旧配件的价格,比如说moonroof,2年新,3万mile,价格是400, 1年新
,1万mile,价格是600。
该怎么做呢?
我的想法是:
A。 简单点的
干脆就来个linear (option都是1 / 0, color) +logistic (year, mileage)
mix regression
问题是,park的折旧应该是车原价,年份,mileage的函数。

B。 更复杂的
1 不考虑配件,某车型base model的折旧价应该是Original Price X F(age,
mileage),F是折旧function
折旧function可以用age,mileage的简单函数近似(例如 1 - a × age - b x
sqr... 阅读全帖
l*******o
发帖数: 12469
26
来自主题: CS版 - EM 算法

俺觉得EM作为一种参数估计的渐进方法需要事先假设数据分布的嘛,否则你从什么地方
可以开始猜那些参数呢?如果你已经知道了数据分布,你可以两个分布的参数都用EM算
法得到,在比较那个分布的误差小点。但似乎这两种分布可以用更直接的方法估计参数
吧?
w*****5
发帖数: 515
27
理论的角度就不说了,我不是统计PHD,GLM就是学过而已..
陈老师的模型从工程上,在某些特殊的应用应该是有一定意义的..
从大多数情况来说:
首先,如果数据符合线性关系,那么直接的线性回归在工程应该是最好的选择..因为需要
的参数少,精确度高..一般不会考虑分段回归,因为这样的话,参数太多,而且陈老师并没
有给出case study,告诉我们他可以在准确度上有多大的提高..
其次,如果是非线性关系,那么最好的方法是利用经验建立非线性的模型...这样的好处
是可以用最简洁的方式来建模..如果用分段的方法,假设对每一段进行线性回归,为了能
够拟合曲线,必须要尽可能细分,这样的话,还是那个问题, 就是参数太多..光参数估计
就够工程人员搞半天了,不用说别的分析了.
陈老师的方法,我觉得可以用在某些特殊的工程应用中,比如某种材料的特性,在一些临
界点以后,性质明显不同.但是准确确定临界点又比较困难, 这时候可能用分段的模型,
通过一些方法来确定临界点,预测效果会提高一些. 但是谈不上对统计学有啥重要的突
破. 如果陈老师想弄这个,那应该要把这个topic变小,才有实际价值.
建议陈老师找几个... 阅读全帖
w*******9
发帖数: 1433
28
来自主题: Statistics版 - 问一个R问题
我要循环地generate random data然后估计参数,估计参数的时候会极其偶尔地遇到收
敛很慢的情,我想如果这次估计参数超过一分钟的话就跳过这次运算,进入下一次
iteration。有没有类似tryCatch的东西能处理这种情况?
for(i in 1:100000){
# generate data
# Estimate Parameter <-- 我想做的是 if(time)>1min, then quit and goto i=
i+1.
}

发帖数: 1
29
昨天下午楼主受到了一千点真实精神伤害,说出来让大家开心一下。
首先多谢jumpknife版友的refer,jobhunting版是个温暖的大家庭~><~
约好电话面试后,recruiter说会问SQL的问题,楼主说不算太熟用R行不行?回答说很
简单的题目,会merge俩table就行,然后反复强调要看amazon的leadership principal
,behavior问题的时候要表现得很fit culture才好。楼主抓紧临阵磨枪听了coursera
上SQL课,又添油加醋编好许多小故事体现自己多么勤劳聪明友爱还有创造力,把自己
感动得不要不要的,简直是被埋没的钻石。
到时间了,interviewer晚了十多分钟,终于打电话过来,确定楼主就是本人后,没有
寒暄“不好意思晚了点儿”“请介绍下你自己”什么的,直接“接下来请听题:”,楼
主心里一颤,看来遇到了耿直boy。
之后接着是几个统计基础问题,没有SQL也没有behavior。我举几个栗子,大家感受下:
1. 说有个硬币不知道是不是fair的,打算扔几次,数有几个头,测试下。请问
hypothesis是怎么样。
楼主说null ... 阅读全帖
n****4
发帖数: 12553
30
【 以下文字转载自 JobHunting 讨论区 】
发信人: kellykgr (袋鼠姐姐), 信区: JobHunting
标 题: 昨天心塞的电话面试经历 amazon供应链DS职位
发信站: BBS 未名空间站 (Wed Nov 16 19:04:47 2016, 美东)
昨天下午楼主受到了一千点真实精神伤害,说出来让大家开心一下。
首先多谢jumpknife版友的refer,jobhunting版是个温暖的大家庭~><~
约好电话面试后,recruiter说会问SQL的问题,楼主说不算太熟用R行不行?回答说很
简单的题目,会merge俩table就行,然后反复强调要看amazon的leadership principal
,behavior问题的时候要表现得很fit culture才好。楼主抓紧临阵磨枪听了coursera
上SQL课,又添油加醋编好许多小故事体现自己多么勤劳聪明友爱还有创造力,把自己
感动得不要不要的,简直是被埋没的钻石。
到时间了,interviewer晚了十多分钟,终于打电话过来,确定楼主就是本人后,没有
寒暄“不好意思晚了点儿”“请介绍下你自己”什么... 阅读全帖

发帖数: 1
31
【 以下文字转载自 JobHunting 讨论区 】
发信人: kellykgr (袋鼠姐姐), 信区: JobHunting
标 题: 昨天心塞的电话面试经历 amazon供应链DS职位
发信站: BBS 未名空间站 (Wed Nov 16 19:04:47 2016, 美东)
昨天下午楼主受到了一千点真实精神伤害,说出来让大家开心一下。
首先多谢jumpknife版友的refer,jobhunting版是个温暖的大家庭~><~
约好电话面试后,recruiter说会问SQL的问题,楼主说不算太熟用R行不行?回答说很
简单的题目,会merge俩table就行,然后反复强调要看amazon的leadership principal
,behavior问题的时候要表现得很fit culture才好。楼主抓紧临阵磨枪听了coursera
上SQL课,又添油加醋编好许多小故事体现自己多么勤劳聪明友爱还有创造力,把自己
感动得不要不要的,简直是被埋没的钻石。
到时间了,interviewer晚了十多分钟,终于打电话过来,确定楼主就是本人后,没有
寒暄“不好意思晚了点儿”“请介绍下你自己”什么... 阅读全帖
w*******9
发帖数: 1433
32
来自主题: Statistics版 - 求助:Bayesian入门
其实google一下就会有很多信息。我这给一个茶馆闲聊级别的解释。
Bayesian: 在经典的参数估计里,参数(比如A)被当成一个固定的数,一般用极大似然
来估计;Bayesian的起源是想利用已有的信息(prior information)结合观察到的数据
得到"更“准确的信息。比如在你观察数据前就知道A大概位于3-4之间,那么有理由相
信这个prior information会使得你的估计更精确。具体到实现上,就是你得假设A是个
随机变量并且服从某个分布,比如[3,4]上的均匀分布,在结合数据的conditional
likelihood, 可以算出A的posterior分布。从统计上来讲,你知道了A的分布,你就知
道了A的一切信息。比如可以用posterior distribution的mode or mean作为A的点估计
,也可进一步根据quantile得到credible interval。
Non-parametric Bayesian: 我的理解是在A是个函数时(比如A就是个未知的分布函数),
这时我们要指定这个函数是怎么分布的(比如我提出这个随机函数可能取值于某个大... 阅读全帖
i*******e
发帖数: 349
33
RBC很多大牛批过,比如output dynamics的propogation非常弱等等,其对真实世界的
近似程度,似乎和开普勒的三大定律相去甚远。
央行搞的那套用Bayesian方法估计新凯恩斯主义DSGE模型,表面上“有坚实的统计理论
所支持”,实际操作的时候非常ad hoc,比如我见过一个prior mean为0.95的变量的
prior standard error只有0.001还是0.0001,这和simultion已经没有什么差别。问题
的根源很简单,五六个highly persistent的、200个季度的宏观变量时间序列所包含的
信息实在是不够用来估计几十个参数用的,不大力使用prior得出的参数估计和标准差完全拿不出手。我非常怀疑这样的
方法可以算作solid statistical practice。
货币和汇率政策方面的CGE模型,大家simulate不同的政策的福利影响,不知道有几个
人发现不同政策对应的consumption equivalence变化超过0.1%的?有谁能够真正反驳
卢卡斯前几年在AER上说经济周期对福利影响太小的文章?虽然卢卡斯这个观点不一
y******r
发帖数: 2986
34
来自主题: ME版 - 请教PVC材料参数
需要估计一下PVC在高温时的弹性模量,可是我不知道time-temperature
superposition的相关系数,只能猜测。从网上看到常温下的PVC弹性模量是3GPa,考虑
到材料会使用多年,我估计徐变以后的弹性模量应该有1GPa.尽管PVC在60C以后就很软
(变质),我还是想估计一下弹性模量。不知道版上是否有人做过相关的分析,请分享
一下材料参数,谢谢!
c*********r
发帖数: 19468
35
来自主题: _Auto_Fans版 - 关于引擎参数的几点看法
1)升功率是否重要?
重要,不过它是几个重要参数之一,不能上升为一个绝对的唯一的标准。为什么升功率
重要?首先,它可以作为功率密度的一种估计。最最根本的衡量功率密度的方法还是功
率重量比和功率体积比,因为在有限的体积用尽可能小的重量代价实现尽可能高的功率
,这才是功率密度这个概念要衡量的事情。但是现实是功率体积比不是很容易量化的事
情(除非是坦克引擎那种,整个package差不多就是个方盒子,才会直接参用这个量)
,功率重量比也不容易获得(厂家很少公布引擎重量数据,即便公布也往往未指明测量
标准)。这种情况下,汽车业内习惯用升功率作为功率密度的一种标识。
不过这种估计有它很多局限,比方说,不同的引擎设计之间比较升功率意义不大。以前
常举的例子就是Corvette引擎。由于两气门OHV的构造,它的高转填充效率较差,升功
率不高,但是同时也是因为这种构造,它的缸盖异常简洁,所以最终它在相同的最大功
率的前提下,体积比绝大多数DOHC引擎都小得多,重量也轻得多。升功率在这个场合下
作为功率密度的估计就产生了不可接受的误差。
升功率的另一重意义在于它是对引擎技术含量的一种评价。技术含量自然是指... 阅读全帖
S******r
发帖数: 4421
36
您还是仔细看看我的考证贴 再拍脑袋吧
自以为聪明 倒头来 不过徒增笑料
以下亲历的tg领导和研究专家我嚼着可能比你可靠
薄一波说:“据统计,1960年全国总人口减少1000多万。”[7]万里回忆道:“三年困
难时期,到处浮肿病,饿死人。据了解,光安徽省的所谓非正常死亡人口就三四百万。
”[8] 胡乔木在给毛泽东的信中写道:“去湘乡楠香大队、七星大队、水底大队、石江
大队看了一下,情况也很严重。楠香和石江大队,三年来死亡率都在20%左右。据县委
说,全县三年来死亡三万人,去年死亡二万人”。[9]田纪云指出:“回顾三年困难时
期,到处闹浮肿,饿死人,非正常死亡人口达数千万,比整个民主革命时期死的人还要
多。” [10]廖盖隆认为,“非正常死亡的人数达到4000万人”。[11]
原重庆市委书记、四川省政协主席廖伯康回忆,在三年困难时期,四川省非正常死
亡人口数“有文件可查的是一千万”,考虑到文件没有完全反映的非正常死亡人口数,
还要“再加二百五十万”。[12]卢跃刚据来源于原四川省委第一书记兼成都军区第一政
委张国华的说法,认为四川省在三年困难时期饿死800万人[13]。原安徽省亳县人大、
... 阅读全帖
j***w
发帖数: 938
37
参数噱头多,每次都让人眼昏缭乱,什么f2.8,什么双十字,一到实际用的时候几乎参
数都要打折。拿D3S和ID4来说,D3S就是朴实的51+15十字,而1D4多少十字啥的,多
少F2.8, F4,F5.6,整一堆技术参数,瞎忽悠呗,结果和D3S一比较,还是歇菜。
这次的5D3估计对焦系统比D800不会强,最多相当。而且测光系统还是被阉割了,实际
用起来的效果我不看好5D3能干的过D800. 大家拭目以待吧。

发帖数: 1
38
来自主题: Programming版 - 感觉版上大都搞ML, DL
就是扯淡罢了,神经网络无非是一个非线性系统。线性系统,分析它的稳定性,可观性
,可控性都很困难,非线性系统更没边了。一个不知道可控,可观的系统,那些参数有
什么意义,在什么条件下有什么响应,没有人知道。
调参和控制论中的参数估计其实一回事,去找本现代估计理论看看,就知道深度学习是
个什么玩意
a*****8
发帖数: 77
39
来自主题: CivilEngineering版 - 高手指教
哪位统计高手指教一下, 两个相互独立的标准正态分布的随机变量的乘积是什么分布?
能不能推导出收敛的密度函数, 期望和方差值?
我是在以下问题中遇到这个问题的.
同一个模型中有两个不同的参数, 都是用极大似然法得到的, 因此参数估计是逼近正态
分布. 由于他们之间存在的相关性, 因此更确切得说应该是两元正态分布.
我需要根据这两个参数计算他们的乘积, 对乘积进行假设检验, 看是不是显著不等于0
(这个可能可以通过仿真来解决).
但是另外一个问题就有点棘手. 就是我还要计算他们的平方和, 检验平方和是不是显著
不等于0. 因为无论原来draw的两个random seeds正负与否, 平方和恒为正值, 所以就
无法通过count随机数里的正负频率来检验显著性了.
请问哪位高手有idea可以帮忙解决这个问题, 不甚感激!
r****h
发帖数: 140
40
来自主题: Computation版 - 请教:求最值问题
问题请教:
在参数估计问题中,运用DFP(David-fletcher-powell numerical algorithm).每步对于
给定的参数值,可得到每个参数的一阶导数值,即确定了方向,现需要找一个使该函数达
到最小值的向量长度(是一个数,设为a)。
头疼的是此函数很复杂,无法知道形状,很难直接计算一阶或多阶导数,并且对a的取值有
范围限制,如a>0。俺是外行,感觉找最值的优化方法很多,如Golden Section 两点法或三
点法等,(感觉三点法在函数单调情况下无用)。
不知道有何适用的方法,请指点,急用,谢谢!
q**j
发帖数: 10612
41
假设 beta is normal(0, sigma_beta^2 I) 分布。这个是prior。
假设 beta_i is normal(beta, sigma_beta_i^2 I)分布,这个是一个intermediate 的
参数。
假设 Y_i is normal(X_i beta_i, sigma_i^2 I)分布。
假设所有的sigma我都知道。请问如何估计beta_i和beta。
注:这里的beta好像是一个higher level的参数似的。不经常碰到有关有bayes和
hierachical parameter的问题,头疼了。能帮忙指点一下看那本书,第几页也非常欢
迎。多谢了。
H*H
发帖数: 472
42
来自主题: Environmental版 - 多无回归,小参数如何处理
大家好,最近在做排污方面的多元线性回归时遇到了一个问题,特来请教一下。
先简单说一下我的例子:
在工厂中,一年的时间内,他们会采取一到三种方法去测量排污量(例如200天用A设备
测,150天用B设备测,15天用C设备测);x1, x2, x3 就是在一年时间内分别用这三种
方法测的排污量,排污总量就是 Y = x1 + x2 + x3。然后工厂还会在年底根据其他方
法估算一年的排污量 Ye. Y 与 Ye这间就必然存在差别,这差别是由A,B, C三种设备
引起的;所以我就利用Y 与 Ye 之间的差别(△y)作为因变量,三种方法实测的量作
为自变量,构建了以下回归方程:
△y = a+ b1*x1 + b2*x2 + b3*x3
利用1000个工厂的数据进行回归, 结果是x1, x2, x3都是与△y 显著相关的;
b1 = -0.08; b2= 0.11; 而 b3 = 3.54
方法A会引起-8%的误差,方法B引起的误差是11%,这都在我们的估计范围内。但是方法
C 引起的误差 354%就远远超出了可能值。
我认为这是由于x3比较小引起的,利用ols方法作回归分析时,x3远小于x1跟... 阅读全帖
O********9
发帖数: 59
43
来自主题: Mathematics版 - 这两天可真发愁阿.....
没弄明白你模型是什么。你说你的mean是Gaussian分布的,variance是Gamma分布的,
然后又说mean和variance是Normal-Inv-X^2分布。什么意思?
不过你的问题听上去是参数估计。一般有这么几种解法:
1. 设数据是y,待求参数是a。计算marginal likelihood function: f(y|a)。然后用
最大似然求a。当然marginal likelihood function不一定好求。
2. 如果模型复杂,有中间变量,可以试试expectation maximization (EM)。
3. 还可以用Gibbs sampling。特别你都是用conjugate prior的结构,那应该很容易推
导出Gibbs sampler。
4. 还可以试试variational method求参数的后验概率。
你可以看看这本书: Pattern Recognition and Machine Learning。很经典的参考书
。大部分篇幅是介绍Bayesian inference及其在machine learning 里面的应用。
u*********0
发帖数: 57
44
请问,如果已知一点的温度和材料的导热参数,以及该点到热源的距离,能从信息估计
出或者反算出热源的温度吗? 多谢!
i*****r
发帖数: 1302
45
有数据,也有公式,就是要估计公式中的参数,用什么方法?
MLE?
w*********r
发帖数: 488
46
来自主题: Quant版 - p-value 分享几个面试题吧
1.252个数据点duplicate的那个,我认为什么都不变。参数估计值,和估计值的标准方
差不变,p-value肯定不变。这就好比一个matrix 是singular,计算的时候自动把
perfectly linear correlated的rows消掉了一样。公式上来说,相当于参数估计值的
分子分母同乘以2,最后的值不会受影响,我用matlab生成了simulated的2个series的
数据回归了一下,确实是这样。
2.丢了10个数据点,这种情况肯定变,而且啥都变。
3.不知道顺序那个。我的做法会是,找些参照series,比如S&P500之类的,知道这只股
票历史上和这个参照series相关,是正是负 (实际上跟指数走势一直负相关的股票我
真没见过),对照一下就知道它是什么顺序了。
4.回归做反了的那个。首先要是想看2个序列相不相关,最原始可以看correlation
coefficient,这个不需要regression,无所谓把谁放dependent variable的位置。第
二,放反了,参数估计出来肯定不一样啊。
c**i
发帖数: 234
47
感谢楼上的,看来我没说清楚。我的问题是现在已经有log(pi/1-pi),并且是一个连
续分布的变量,看图形比较像gamma distribution的样子,我想问我有了log(pi/1-pi
),并且知道x1和x2,现在想要估计参数b0,b1,b2,该如何估计?是直接用linear
regression么?如果是的话glm()里面那个family是不是要设置成gamma?谢谢
M***e
发帖数: 531
48
现在有个项目,需要估计一个函数里的参数,但是这个函数是customize的函数,不知
道需要用什么函数呢?
多谢
n*********e
发帖数: 318
49
来自主题: Statistics版 - 分享两个data scientist职位的面经
--------FORWARDED --------------
发信人: MPQ (小天), 信区: DataSciences
标 题: 分享两个data scientist职位的面经
发信站: BBS 未名空间站 (Mon Mar 17 14:55:40 2014, 美东)
最近面了两个data scientist的职位,title虽然是data scientist,
但是从感觉上面来说很像是data analyst,分别是Netflix和YouTube。我个人是应用数
学的,做一些运筹优化和learning的东西。
第一轮都是和recruiter谈一谈,Netflix比较强调他们的culture,特别
嘱咐了要看他们的slides,聊的过程中也提到了很多这方面的内容。Youtube
相对随意的多,主要就是讲讲简历上面的东西。
第二轮,netflix问了会不会hadoop, hive,是否熟悉hadoop streaming interface,
我个人了解一些,但是在学校用的这个机会没有,所以就没追问下去。再就是问了
一些python和R,平时用哪个,为什么用这个不用那个。另外... 阅读全帖
M*Q
发帖数: 54
50
来自主题: DataSciences版 - 分享两个data scientist职位的面经
最近面了两个data scientist的职位,title虽然是data scientist,
但是从感觉上面来说很像是data analyst,分别是Netflix和YouTube。我个人是应用数
学的,做一些运筹优化和learning的东西。
第一轮都是和recruiter谈一谈,Netflix比较强调他们的culture,特别
嘱咐了要看他们的slides,聊的过程中也提到了很多这方面的内容。Youtube
相对随意的多,主要就是讲讲简历上面的东西。
第二轮,netflix问了会不会hadoop, hive,是否熟悉hadoop streaming interface,
我个人了解一些,但是在学校用的这个机会没有,所以就没追问下去。再就是问了
一些python和R,平时用哪个,为什么用这个不用那个。另外的问题实质上就是假设
检验方面的东西,熟悉常用的test就可以了。
youtube的第二轮上来问你有什么analysis的经验,我就讲了个project,问了很多
project里面的细节。后来问了一个问题,假设engineer有1000个同样的硬件,6个月之
后一个也没有坏,问这... 阅读全帖
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)