d*********u 发帖数: 8521 | 1 非统计专业问一个有关回归自变量的问题,见笑了。
问题如下:
在一个多元线性回归方程中,如果自变量X1和X2是高度相关(相关系数接近0.9),而
X1和Y(因变量)的简单相关系数与X2和Y的简单相关系数相比,更高一些;请问,在一
个以Y为自变量的多元线性回归方程中,是否可以只用X1而放弃X2,理由是1:X1和X2本
身就已经高度相关了,且X1本身对Y有更高的解释性或者预测性(不知对否?),因此
可以用X1来简化代表X1和X2对Y的影响;2:避免X1和X2的自相关对最后的拟合方程可能
造成的负面影响 (X1和X2只是最后方程中某一组变量,并非整个方程的自变量只有X1
和X2);3: 个人认为该拟合方程的目的在于简洁和有力的解释某一现象(Y),而非
要包含所有与Y相关的各种因子,且当X1和X2共同进入方程时,最终的R square与只有X1
进入方程的R square相比,并没有显著提高,近似相同。
注:该模型方程是用于社会科学中某一现象的解释,并非严格的(物理、化学)实验方
程,因此才有上面的疑问3.
不知道我的理解对不对,请大家指教,谢谢!! |
|
f*******9 发帖数: 74 | 2 为什么文献里的线性回归方程,比如方程y - 1 + x1 + x2 + x1*x2,表示两个因素(x1
, x2)的相互作用形式都是x1 * x2?没有其他形式了吗,例如x1/(1+x2)? |
|
b********n 发帖数: 38600 | 3 决了。 叔做了个回归方程发现,中国领导人的guts跟在陕北窑洞呆的天数成正比。
越是早年吃苦受罪的后来越有guts。 |
|
c******a 发帖数: 6951 | 4 【 以下文字转载自 Business 讨论区 】
发信人: caniggia (Juiceman), 信区: Business
标 题: Re: 谁知道回归方程这个词怎么来的?
发信站: BBS 未名空间站 (Sun Jul 17 06:47:01 2005), 转信
应该叫衰退分析
最早的典故是如下统计结果:
Predictor(x): Height of the father;
Response(y): Height of the son;
Tall fathers trend to have tall sons, but not as tall as their fathers;
Short fathers trend to have shrot sons, but not as short as their fathers.
So "regression" it is called. (Galton, F. (1886)) |
|
H*H 发帖数: 472 | 5 大家好,最近在做排污方面的多元线性回归时遇到了一个问题,特来请教一下。
先简单说一下我的例子:
在工厂中,一年的时间内,他们会采取一到三种方法去测量排污量(例如200天用A设备
测,150天用B设备测,15天用C设备测);x1, x2, x3 就是在一年时间内分别用这三种
方法测的排污量,排污总量就是 Y = x1 + x2 + x3。然后工厂还会在年底根据其他方
法估算一年的排污量 Ye. Y 与 Ye这间就必然存在差别,这差别是由A,B, C三种设备
引起的;所以我就利用Y 与 Ye 之间的差别(△y)作为因变量,三种方法实测的量作
为自变量,构建了以下回归方程:
△y = a+ b1*x1 + b2*x2 + b3*x3
利用1000个工厂的数据进行回归, 结果是x1, x2, x3都是与△y 显著相关的;
b1 = -0.08; b2= 0.11; 而 b3 = 3.54
方法A会引起-8%的误差,方法B引起的误差是11%,这都在我们的估计范围内。但是方法
C 引起的误差 354%就远远超出了可能值。
我认为这是由于x3比较小引起的,利用ols方法作回归分析时,x3远小于x1跟... 阅读全帖 |
|
H*H 发帖数: 472 | 6 大家好,最近在做多元线性回归时遇到了一个问题,特来请教一下。
先简单说一下我的例子:
在工厂中,一年的时间内,他们会采取一到三种方法去测量排污量(例如200天用A设备
测,150天用B设备测,15天用C设备测);x1, x2, x3 就是在一年时间内分别用这三种
方法测的排污量,排污总量就是 Y = x1 + x2 + x3。然后工厂还会在年底根据其他方
法估算一年的排污量 Ye. Y 与 Ye这间就必然存在差别,这差别是由A,B, C三种设备
引起的;所以我就利用Y 与 Ye 之间的差别(△y)作为因变量,三种方法实测的量作
为自变量,构建了以下回归方程:
△y = a+ b1*x1 + b2*x2 + b3*x3
利用1000个工厂的数据进行回归, 结果是x1, x2, x3都是与△y 显著相关的;
b1 = -0.08; b2= 0.11; 而 b3 = 3.54
方法A会引起-8%的误差,方法B引起的误差是11%,这都在我们的估计范围内。但是方法
C 引起的误差 354%就远远超出了可能值。
我认为这是由于x3比较小引起的,利用ols方法作回归分析时,x3远小于x1跟x2的话是... 阅读全帖 |
|
R******d 发帖数: 1436 | 7 1,请问如何指定回归方程里考虑到所有的2-way interaction。自变量比较多,手写太
麻烦了。
model response=f1 | f2 | f3 | f4 这种写法会把高于2-way的也包括进去。
2,想建一个multivariate multiple regression模型来比较一些自变量对不同回归方
程的贡献。请问怎么得到标准化回归系数的Ratio的置信区间?
这种情况是否只能通过multivariate multiple regression来做?如果建立两个单独的
回归方程,能做到么?
3,这个和sas code无关。RandomForest回归是否会好于SVM回归?似乎tree
regression会考虑到interaction的情况,而且对于每个自变量的贡献也好解释。
多谢了。 |
|
b*******n 发帖数: 1267 | 8 什么是回归分析法、时间序列法、投入产出法、数学归纳法和马尔科夫链预测法?
悬赏分:0 - 解决时间:2008-6-4 21:00
什么是回归分析法、时间序列法、投入产出法、数学归纳法和马尔科夫链预测法?
什么是等维灰数递补动态预测?
提问者: 不叶秋 - 秀才 三级 最佳答案所谓回归分析法,是在掌握大量观察数据的基
础上,利用烽理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程
式)。
时间序列法, 利用按时间顺序排列的数据预测未来的方法,是一种常用的。事物的发展
变化趋势会延续到未来,反映在随机过程理论中就是时间序列的平稳性或准平稳性。
投入产出法,作为一种科学的方法来说,是研究经济体系(国民经济、地区经济、部门
经济、公司或企业经济单位)中各个部分之间投入与产出的相互依存关系的数量分析方
法。
数学归纳法是一种数学证明方法,典型地用于确定一个表达式在所有自然数范围内是成
立的或者用于确定一个其他的形式在一个无穷序列是成立的。有一种用于数理逻辑和计
算机科学广义的形式的观点指出能被求出值的表达式是等价表达式;这就是著名的结构
归纳法。 |
|
q********n 发帖数: 355 | 9 多元回归中response的范围是在0~4之间,但是回归方程的预测值超出这个0~4的范围
了。
可以通过什么方法来限定target的取值呢?比如用一个什么样的转换函数?
非常感谢! |
|
g*****o 发帖数: 812 | 10 都可以吧,二次三次也是有的,只不过你举的这个很少见
反正本来回归也不是绝对靠谱
x1 |
|
Z*****l 发帖数: 14069 | 11 《法医秦明1:尸语者》作者:秦明
作品推荐:
因为专业,所以真实;因为悲悯,所以感动。
公*安厅从未公开的绝密法医禁忌档案,残忍、变态、惊悚、刺激、真实、生猛、
劲爆、震撼……
比《CSI》《犯罪心理》更接地气的本土犯罪档案,比《鉴证实录》《法证先锋》
更刺激的罪案现场,人性、兽性,惨案背后的人间悲剧令人惊叹唏嘘……
法医首度以“尸语者”身份登场,替深渊中的万千亡灵伸张正义,发出最后的哀鸣
与呐喊!
作者简介:
秦明,主检法医师,入行较早,经验颇丰,绰号“老秦”。阅尸无数,明察秋毫,
无愧“尸语者”之名。一双鬼手,只为沉冤得雪,满怀佛心,惟愿人间太平。
内容简介:
尸语者
高速公路上抛下9袋尸块,被割下的膀胱里居然藏有冰碴,2000辆飞驰而过的车里
,谁才是真正的凶手?
垃圾场里被捆绑的女尸,全身器官都已经蜡化,要如何下手,才能验出她死亡的真
相?
电话打到一半,话筒里却传来沉闷的挣扎声,潜伏在校园当中的魅影,真的吞噬了
那些女孩?
资深法医老秦亲自捉刀,首度披露惊悚案发细节,创下悬疑小说从未到达的震撼尺
度!
荒山残尸、灭门惨案、校园禁地、公路游魂、水上浮骸、天外飞尸……
20个挑战... 阅读全帖 |
|
b****r 发帖数: 17995 | 12 我也来讲讲我眼中 数学家对生物现象的理解,不一定对。
我觉得生物现象确实是可以用数学描述的,打个比方用个回归方程归纳已有现象,并预
测一个实验结果。生物学家根据自己的以往经验认为,如果希望预测准确程度达到95%
以上,可能需要100个项,每个项的系数都不小,都有可能对最终结果产生黑白颠倒的
影响,当然也有可能其中一些项是无关紧要的,但是现在未知的东西太多,只好都放在
回归方程里面。现在数学家来了,对于这100项里的95项都既看不懂也觉得太麻烦,然
后强行要剔除其中95个项来做一个漂亮好算的回归方程,然后觉得生物学家总是关注细
枝末节,连自己都说不清楚的东西放进去干嘛。什么东西还搞不清楚,就来个
assumption不就解决了嘛!
最后的结果呢,确实修正来修正去搞出来一个回归方程,只有5个项,看起来简洁漂亮
,算法也极其fancy,关键是确实可以完美拟合现有的数据,发表了高分的文章。但是
。。。接下来其他生物学家再照着套新数据就歇菜了,根本就预测不准现实生活中的生
物现象,这个方程也就进了垃圾堆。或者也有可能,那一堆assumption实际上在生物体
中根本就不成立,局限性大得已经无法接... 阅读全帖 |
|
n*********4 发帖数: 99 | 13 我也来讲讲我眼中 数学家对生物现象的理解,不一定对。
我觉得生物现象确实是可以用数学描述的,打个比方用个回归方程归纳已有现象,并预
测一个实验结果。生物学家根据自己的以往经验认为,如果希望预测准确程度达到95%
以上,可能需要100个项,每个项的系数都不小,都有可能对最终结果产生黑白颠倒的
影响,当然也有可能其中一些项是无关紧要的,但是现在未知的东西太多,只好都放在
回归方程里面。现在数学家来了,对于这100项里的95项都既看不懂也觉得太麻烦,然
后强行要剔除其中95个项来做一个漂亮好算的回归方程,然后觉得生物学家总是关注细
枝末节,连自己都说不清楚的东西放进去干嘛。什么东西还搞不清楚,就来个
assumption不就解决了嘛!
最后的结果呢,确实修正来修正去搞出来一个回归方程,只有5个项,看起来简洁漂亮
,算法也极其fancy,关键是确实可以完美拟合现有的数据,发表了高分的文章。但是
。。。接下来其他生物学家再照着套新数据就歇菜了,根本就预测不准现实生活中的生
物现象,这个方程也就进了垃圾堆。或者也有可能,那一堆assumption实际上在生物体
中根本就不成立,局限性大得已经无法接... 阅读全帖 |
|
r*******a 发帖数: 268 | 14 要用SAS做线性回归。比如说,现在有两个变量,Y和X,要用X表达Y。
现在X,Y都是140天的数据,每天有1500个公司给出数据。
所以有两个excel文件,140列,1500行。
我们要做的是对于每天,都给出相应的Y和X的回归方程。
然后我们实际上应该有140个方程。
现在最不知道怎么办的是怎么写SAS的语句,让它一次把这140次回归一下做完。。。。
问了统计系同学也没搞清楚。请大牛指点一下,如果写出全部语句比较麻烦,请指点一
下应该用什么思路或者什么函数之类的。。。
另外,还想问一下如何控制SAS输出结果的格式?因为我们还想对求出的140个回归方程
做分析。而SAS一般输出结果的格式显然不适合做进一步分析..
如果用其他统计软件方便做上面的操作,也请指教指教。
谢谢!:) |
|
r*******a 发帖数: 268 | 15 【 以下文字转载自 Mathematics 讨论区 】
发信人: risingsea (123), 信区: Mathematics
标 题: 求助:SAS使用问题(读数据)
发信站: BBS 未名空间站 (Thu Apr 9 13:28:37 2009), 转信
要用SAS做线性回归。比如说,现在有两个变量,Y和X,要用X表达Y。
现在X,Y都是140天的数据,每天有1500个公司给出数据。
所以有两个excel文件,140列,1500行。
我们要做的是对于每天,都给出相应的Y和X的回归方程。
然后我们实际上应该有140个方程。
现在最不知道怎么办的是怎么写SAS的语句,让它一次把这140次回归一下做完。。。。
问了统计系同学也没搞清楚。请大牛指点一下,如果写出全部语句比较麻烦,请指点一
下应该用什么思路或者什么函数之类的。。。
另外,还想问一下如何控制SAS输出结果的格式?因为我们还想对求出的140个回归方程
做分析。而SAS一般输出结果的格式显然不适合做进一步分析..
如果用其他统计软件方便做上面的操作,也请指教指教。
谢谢!:) |
|
w****a 发帖数: 1623 | 16 谢谢你的回复,我在网上查了spurious correlation的例子,我能明白这些例子。我也
查了一些材料,包括网上的一些书等。大多数给的例子是C-> A, C - > B,那么把A
和B做相关分析的话是spurious。但是也有的说如果Y这一边本来就是X的一个函数,
那么这个correlation是spurious的。我想重量本来就等于密度乘体积,所以我用重量
和体积做回归,相当于用密度乘体积与体积做回归。方程的两边都有体积,那不就得到
spurious correlation了?
我是做环境的,我问这个的主要原因是我做了一些污染物的量与河流流量的回归,后来
在网上查了这些类似的文献,很多都说污染物的量与河流流量之间的correlation是
spurious correlation,原因是污染物的量等于浓度乘流量,这样方程的两边都有流
量项,所以是spurious correlation。有的建议用浓度和流量做回归,可以一是由机
理我已经知道浓度和流量没有简单的相关关系,二是浓度不也等于污染物的量除流量吗
,流量不也出现在方程的两边了吗? |
|
n**e 发帖数: 2026 | 17 真相就是事物本来面目;造假就是改变事物本来面目。这个道理谁都知道。但是遇到实
际问题,很多人自动认为既然打假,手里当然握有真相。方是民之流正是利用大众的这
种惯性心理大行其道。
柴静生孩子有三个细节,良性肿瘤,玩具小熊和手上的针眼。方舟子质疑柴静生孩子造
假,可能到现在都没有人真正搞清楚,在生孩子的问题上柴静作了什么假,又根据什么
事实认定柴静造假。
用一只小熊来打假柴静在美国生孩子的经历,这本来就是八杆子够不着的事情。认定小
熊是医院专门用来安慰小病人的,一开始就荒诞不经。实际上任何产科病房都不需要安
慰小病人的玩具。给柴静一个小熊并非医院的行为而是护士的个人行为。小熊身上的眼
科标识与柴静生孩子的产科在逻辑上没有任何联系。
为了加强打假火力,方是民甚至不惜捏造柴静言论。『柴静谈到她在生下女儿从医院回
家的路上,“全是烟熏火燎的味,我就拿一个手绢捂在她鼻子上”,这显然不是在洛杉
矶,貌似在北京。』。问题是柴静说过“从医院回家的路上”吗?
柴静说的是“回家的路上我就开始害怕了,全是烟熏火燎的味,我就拿一个手绢捂在她
鼻子上。”在前后文中也没有任何地方暗示这是“从医院回家”。柴静说什么不... 阅读全帖 |
|
g******t 发帖数: 18158 | 18 张宏生:彻底否定孙经先对60年代人口变动的研究
发布时间:2014-08-02 16:23 作者:张宏生 字号:大 中 小 点击: 次
近几年来,孙经先否定“饿死三千万人”的歪理怪论激起人们极大愤慨,受到人
们强烈的质疑与批驳。但孙经先并不思过,前不久又在武汉“中国土地制度演变第一次
国际研讨会”再放谬论,会后网上出现一篇会议报道称:杨继绳先生对孙经先教授的发
言提不出实质性的质疑意见,对孙教授指出的《墓碑》中的一系列重大错误也没有做出
回应,所以对话呈现一边倒的态势,没有出现预期的激烈辩论的情况。所谓“饿死三千
万”的弥天大谎,就这样被戳穿了!由此可见,孙经先的谬论劣行仍得到某些支持,其
背景缘由想必“你懂的”。对此,杨继绳发表“关于武汉会议的声明”说:该报道“完
全歪曲了会议情况。对此,我向会议组织者贺雪峰提出抗议,并要求他秉公报道会议真
实情况。……孙经先和巩献田的报道完全是虚构。鉴于孙经先对会议情况如此歪曲,完
全丧失了学者必须尊重事实的品格,这篇文章是我对孙经先最后一次驳斥,以后孙经先
再挑战我,我不再理采。”由此,孙杨之争暂告一段落。
此后,杨继绳将不再发声,而孙经先... 阅读全帖 |
|
B*******e 发帖数: 142 | 19 统计学上有门课叫做“回归分析”,回归这个概念是英国生物学家高尔顿(达尔文的表
弟)提出,他经过研究发现,通过观察1078对夫妇的身高数据,以每对夫妇的平均身高
作为自变量,取他们的一个成年儿子的身高作为因变量,分析儿子身高与父母身高之间
的关系,发现父母的身高可以预测子女的身高,两者近乎一条直线。当父母越高或越矮
时,子女的身高会比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形
关系,分析出儿子的身高y与父亲的身高x大致可归结为一下关系:
y=33.73+0.516*x (单位为英寸)
根据换算公式1英寸=0.0254米, 1米=39.37英寸。单位换算成米后:
Y= 0.8567+0.516*X (单位为米);
假如父母辈的平均身高为1.75米,则预测子女的身高为1.7597米。
这种趋势及回归方程表明父母身高每增加一个单位时,其成年儿子的身高平均增加0.
516个单位。这就是回归一词最初在遗传学上的含义。
有趣的是,通过观察,高尔顿还注意到,尽管这是一种拟合较好的线形关系,但仍然存
在例外现象:矮个父母所生的儿子比其父要高,身材较高的父母所生子女的身高却回降
到多... 阅读全帖 |
|
H****g 发帖数: 14447 | 20 现在回想起来,总设计师的一个重大设计失误就是忘记了做一个control(对照组)。
如果你学过医学啊生物啊这些专业,就会知道,做实验都是要有control group的。比
如说,一个药到底有没有效果,就要跟placebo对比一下。placebo呢,就是control
group。
在经济学研究里,很多回归方程也是有很多的control variables,目的都是为了确定
到底是不是IV(independent variable)的变化,导致了DV(dependent variable)的
变化。比如说,如果我们要研究一种社会制度对人均预期寿命的影响,最简单的回归方
程就是
Life expectancy = a*社会制度 + e
e就是error term啦。
但是呢,光这样一个方程是肯定不行的,因为没有考虑到科学技术发展的影响。比如说
,1928男弗莱明发明了青霉素后,人类的死亡率就会大大下降,我们就不能说,1928年
后外伤死亡率下降是因为社会制度变更引起的。所以说,研究对人均预期寿命的影响,
至少要加入一个科学技术进步的变量当control,以便排除这个因素的影响。
所以说,... 阅读全帖 |
|
D******n 发帖数: 2965 | 21 同意。
只不过回归模型能处理的,大家都知道的比较清楚了,包括其局限性。但研究的目的在
于发展和提高认识,而不是停止在当前阶段。难道我们就停留在反复用ols回归来看经济
学问题的层次上吗?
对于数据要求,我倒是觉得strucgtural恰恰是相反,数据上的不足是structural得以
发展的动力之一。
一些structrual能回答的问题,简单回归方程根本就没法处理,所以结论一样的说法也不是很恰当。 |
|
r*******a 发帖数: 268 | 22 呵呵非常感谢!
这个也是我一个朋友教我的!但是问题是excel文件列的长度是有限制的啊。好像是6万多
吧(excel 2003,因为SAS好像不支持excel 2007吧)。所以1500×140那就是3个六万。所
以最好得分成三个excel文件。
但是另外问题是我们要做的回归不仅仅是这一个,总共有6个变量的,而且还有好几个m
odel,不仅仅是Y=X。所以这样是很耗时的。而且就是分次做回归,不知道最后怎么把结
果输出成一个好的格式。因为我们最后要对这140个回归方程求平均,还有其他分析等等
。。
十分谢谢! |
|
t*********l 发帖数: 52 | 23 有点明白你要做什么了。处理数据之前,要有一个各变量关系的模型,可以是数学模型
(有些回归方程直接由模型推出),也可以是一个文字表达的关系(有很多回归模型不
是从数学模型中推导出来的)。你应该不会用数学模型,但是需要有一个各变量关系的
STORY或假定(例如消费者为什么想CLICK),然后决定怎样分析数据。分析数据是为了
验证和修改你对各变量关系的最初认识,也就是说,虽然数据分析占了研究的大部分时
间,但是绝对不能忘了BIG PICTURE,也就是分析数据是为了一个什么样的具体问题。
如果你现在根本就不知道变量间可能有什么关系,那么需要用MEAN、CORRELATION等
SUMMARY STATISTICS来发现各变量之间的关系,特别是各变量和CLICK之间的关系。
在有一个假定的关系后,决定使用哪些变量分析,不需使用所有变量。如果你的分析重
点不是消费者因为所处城市不同(或者因为PUBLISHER)不同,而有不同的CLICK决定,
那么你可以不使用CITY或PUBLISHER ID。如果你需要知道不同地区或不同种类
PUBLISHER对CLICK的影响,那么你可以把CITY按区域分成... 阅读全帖 |
|
Z*****l 发帖数: 14069 | 24 我国的刑法,对刑事责任年龄有如下分法:(1)不满14周岁的人,对任何犯罪都不负
刑事责任。(2)已满14周岁不满16周岁的人,犯故意杀人、故意伤害致人重伤或者死
亡、强奸、抢劫、贩卖毒品、放火、爆炸、投毒罪的,负刑事责任。除上述罪名外,不
予刑事处罚。(3)已满14周岁不满18周岁的人犯罪,从轻或者减轻处罚。(4)已满16
周岁的,犯任何罪,都负刑事责任。但犯罪时未满18周岁,不适用死刑。
另外,强奸罪中有述,与不满14周岁的女性发生性关系,无论是否自愿,均按强奸
罪论处。
既然有了这些法律规定,就涉及一个“法律年龄”的问题。随着户籍制度管理的严
格化,我们的身份证上的年龄都和生理年龄是吻合的。但是在一些边远地区或是因为一
些特殊缘故,还是有很多人的生理年龄和户籍年龄不符,也有一些没有经过户籍登记的
人口。如果这些人犯罪或者被强奸,他们的年龄该如何判断呢?法医“蜀黍”们因为此
需要,而发现了骨龄鉴定这项技术。
这项技术主要是根据人体骨骼发育中骨骺[注]愈合的程度来进行骨骼生理年龄的判
断。骨骺愈合时间自13岁开始自25岁完成,法医“蜀黍”们通过阅读各个年龄阶段人... 阅读全帖 |
|
a*******n 发帖数: 156 | 25 回归方程不准确要么是他没有validation
要么是新的数据限定条件跟原方程限定条件不一样
这只能说他的定律应用范围不够广,就像牛顿定律不适用于围观现象一样,没设么稀奇
的 |
|
w****2 发帖数: 12072 | 26 看到有人标题为"冒死转载",以为夸张. 结果发现网上确实已经基本被删光了. 所以在这里存一份. 金雁的那篇同名文章不是这一篇.
苏联解体二十年祭
苏联崩溃、苏东集团瓦解标志着“国家垄断资本主义”的衰落。这让“自由资本主义”
高度亢奋,认为“自由资本主义”就是人类社会演化史的终点。“市场经济导向”凝结
成为所谓“华盛顿共识”,由美国政府及其控制的各国际经济组织在全球大力推行。以
贸易自由为诉求的“关贸总协定”进化成了“世界贸易组织”。几乎所有国家的政府都
力图挤进这个组织,为此甚至不惜损害自己的经济独立和底层国民的生计。
2008年3月,号称“全球领先的金融服务公司”贝尔斯登公司(Bear Stearns Cos.)传出
遇见流动性危机的信息。结果引发了一场席卷全球的经济危机。危机证实,所谓“自由
资本主义”是一种不稳定,不可持续的社会机制。人们不得不思考社会应走向何方?
观察各方对社会经济问题的讨论,可以识别出三个主要的倾向。
信仰:自由资本主义
在学术界里,占主流的倾向仍是自由资本主义。经济学的研讨和教学以它的话语体系进
行,各经济主管部门用它的统计指标体系管理经济,各国际经济组织更... 阅读全帖 |
|
q********n 发帖数: 355 | 27 多元回归中response的范围是在0~4之间,但是回归方程的预测值超出这个0~4的范围
了。
可以通过什么方法来限定target的取值呢?比如用一个什么样的转换函数?
非常感谢! |
|
w*********g 发帖数: 30882 | 28 资源诅咒
编辑
资源诅咒是一个经济学的理论,多指与矿业资源相关的经济社会问题。丰富的自然资源
可能是经济发展的诅咒而不是祝福,大多数自然资源丰富的国家比那些资源稀缺的国家
增长的更慢。经济学家将原因归结为贸易条件的恶化,荷兰病或人力资本的投资不足等
,主要由对某种相对丰富的资源的过分依赖导致。
目录
1简介
2概念
3提出
4程度
5传导机制
1简介
编辑
经济增长和发展问题引起人们的广泛注意以来,经济学家一直致力于探究与经济增长有
关的诸种因素和条件,即增长的源泉问题。自然资源或自然禀赋、物质资本、技术进步
、公共秩序与法律乃至信念和价值观,相继被揭示出来并置于突出的地位。其中,自然
资源作为物质生产活动的必要投入品,成为经济赖以发展的重要物质基础,资源相对丰
裕的国家通常蕴含了更大的发展潜力。近代以来的经济发展史表明,自然资源的确对于
一国国民财富的初始积累起到了非常关键的作用,如美国、澳大利亚、加拿大和斯堪的
纳维亚地区的快速工业化与其丰裕的自然资源密不可分。
20世纪80年代以来,越来越多资源丰裕的国家陷入了增长陷阱的事实引起了经济学家的
深思。经验数据显示,从一个较长的时间范... 阅读全帖 |
|
O***C 发帖数: 1219 | 29 【 以下文字转载自 Military 讨论区 】
发信人: wlwl12 (戒网), 信区: Military
标 题: 网上已经基本全被删了: 苏联解体二十年祭(全文)
发信站: BBS 未名空间站 (Wed Aug 10 14:24:08 2011, 美东)
看到有人标题为"冒死转载",以为夸张. 结果发现网上确实已经基本被删光了. 所以在这里存一份. 金雁的那篇同名文章不是这一篇.
苏联解体二十年祭
苏联崩溃、苏东集团瓦解标志着“国家垄断资本主义”的衰落。这让“自由资本主义”
高度亢奋,认为“自由资本主义”就是人类社会演化史的终点。“市场经济导向”凝结
成为所谓“华盛顿共识”,由美国政府及其控制的各国际经济组织在全球大力推行。以
贸易自由为诉求的“关贸总协定”进化成了“世界贸易组织”。几乎所有国家的政府都
力图挤进这个组织,为此甚至不惜损害自己的经济独立和底层国民的生计。
2008年3月,号称“全球领先的金融服务公司”贝尔斯登公司(Bear Stearns Cos.)传出
遇见流动性危机的信息。结果引发了一场席卷全球的经济危机。危机证实,所谓“自由
资本主义”是一种不稳定,不可... 阅读全帖 |
|
g****t 发帖数: 31659 | 30 1.
Let x=1,2,3,4,。。。
你自己用方程z=100*x+2
造一列z。
对这组( x,z)用spark试验一下,
算出来是100和2,那就是线性回归,不然就不是呗。
2.
Linear regression就跟个操作系统类似,无数坑。 |
|
m******y 发帖数: 753 | 31 长话短说,系数就不写在方程里了, cross sectional data 回归分析
Y1(数据已知)= X1(数据未知)+ X2(数据已知)+ X3(数据已知)
Y2(数据已知)= Y1(数据已知)+ X1(数据未知)+ X2(数据已知)+ X4(数据已知)
X1是Y2的前一年t-1的值,但是没有数据.
这个未知的X1应该怎么处理呢?不允许直接扔掉X1。 |
|
C*****1 发帖数: 185 | 32 如果两个方程联立回归,
y1是unordered的情况:取值a,b,c
y2是ordered的情况:取值0,1,2,3.
关键是can't control y1 和 y2的相关性
应该怎么处理这种情况? |
|
w****2 发帖数: 12072 | 33 苏联解体二十年祭
苏联崩溃、苏东集团瓦解标志着“国家垄断资本主义”的衰落。这让“自由资本主义”
高度亢奋,认为“自由资本主义”就是人类社会演化史的终点。“市场经济导向”凝结
成为所谓“华盛顿共识”,由美国政府及其控制的各国际经济组织在全球大力推行。以
贸易自由为诉求的“关贸总协定”进化成了“世界贸易组织”。几乎所有国家的政府都
力图挤进这个组织,为此甚至不惜损害自己的经济独立和底层国民的生计。
2008年3月,号称“全球领先的金融服务公司”贝尔斯登公司(Bear Stearns Cos.)传出
遇见流动性危机的信息。结果引发了一场席卷全球的经济危机。危机证实,所谓“自由
资本主义”是一种不稳定,不可持续的社会机制。人们不得不思考社会应走向何方?
观察各方对社会经济问题的讨论,可以识别出三个主要的倾向。
信仰:自由资本主义
在学术界里,占主流的倾向仍是自由资本主义。经济学的研讨和教学以它的话语体系进
行,各经济主管部门用它的统计指标体系管理经济,各国际经济组织更是它的积极推行
者。
然而,这一切并非建立在学理的基础上,而是建立在“信仰”的基础上。诚如张维迎指
出的:
“西方经济学界一般把... 阅读全帖 |
|
m********3 发帖数: 3280 | 34 中日在钓鱼岛问题上的争执,又一次掀起了民族主义的浪潮。中国人的民族主义情绪有
多大?民族主义情绪对中国的社会和政治有什么影响?西方学者从不同角度分析了这个
话题。
有的学者注重文本分析,把分析焦点放在民族主义者的著作(例如《中国可以说不》《
中国不高兴》等)和一些民族主义事件(例如1999年反美游行,2005年反日游行等)。
“政见”此前介绍的胡可礼的文章就从四本民族主义著作出发阐述了中国民族主义和地
缘政治相结合的观点。另外,俄克拉荷马大学的彼得格里斯(Peter Gries)教授在几
年前出版的专著中,综合分析了中国的书刊、新闻报道以至游行口号和标语中的民族主
义文本,提出中国的民族主义是一种“面子民族主义”,即必须建立在和“他者”的不
断互动之上,而美国、日本是其中最重要的两个国家。中国人用“胜利者”话语和“受
害者”话语去解读中美、中日之间的历史交往和现实摩擦,从中汲取了建构民族主义意
识源源不断的素材,用以保存国家和自身的“面子”和尊严。
相对于格里斯专注于带有明显民族主义特征的文本,特拉华州立大学程映虹教授则更重
视一般大众文化之中的民族主义话语。他的分析材料是中国流行文化... 阅读全帖 |
|
b********n 发帖数: 38600 | 35 习包子要是在陕北窑洞多呆几年,而不是在Iowa,台湾问题早就解决了。
叔做了个回归方程发现,中国领导人的guts跟在陕北窑洞呆的天数成正比。
越是早年吃苦受罪的后来越有guts。 |
|
|
S**********0 发帖数: 22 | 37 文科生情书对抗理科生情书,笑死了……我傻得可以╮
文科生的情书
XXX:
你好!
就像太阳和月亮轮番注视着地球,我的两只眼睛也日夜不停地关注着你!你可知在盘古开
天劈地之时,在猿人没进化成人类之时,苍穹间就注定我对你的一网情深
我爱你,就像纽约街头的自由女神时刻守望整个美利坚,我时刻守望你,虽然我现在不能
和你在一起,就像阿拉斯加和美国总隔着个加拿大,但是我相信,板块总要漂移,总有一天
你的心和我的心会飘到一起.
我爱你,你在我心中就像青藏高原支撑着整个世界那般伟岸,我永远甘做高原上的青稞陪
伴着你,直到喜玛拉雅山都夷为平地,直到太平洋都被填满,直到东非大裂谷都愈合,我相
信,总有一天沧海桑田会实现.
我爱你,我对你的思念犹如波斯湾沿岸的石油源源不断,虽然有阿拉伯半岛横在中间,那
里仍然成立了石油输出国组织,共同对付列强的侵犯,也许有一天那里的石油会枯竭,可
是我对你的爱却永恒如一天地可鉴
我爱你,我对你痴痴的恋就像南非约翰内斯堡的黄金一样熠熠生辉,虽然那里还比较贫困
,那里的孩子仍然穿不上衣吃不上饭,可是我相信,金子般的心灵肯定会打动上帝,让你发
现我在闪光,就像南非的人民早晚会有财... 阅读全帖 |
|
s********g 发帖数: 124 | 38 John Hollinger是ESPN的篮球分析专家,中国球迷亲切地称之为火灵哥。火灵哥原先也
就是个球迷,受moneyball的影响他也开始自娱自乐做篮球统计分析,终于发展为他下半辈
子的职业。他发明的球员效率值PER(Player Efficiency Rating)虽然是比较晚近的
评价指标,但还是挺有影响力的,算是计量篮球界(Sabermetrics)的后起之秀。
PER简单来说就是一个球员在场每分钟的产出效率综合指标值(composite index)。它
把正产出(得分、罚球、篮板、助攻、抢断、盖帽)和负产出(偷失球、失误、犯规)
等数值统统冶于一炉,然后再根据分钟数normalize,接着根据球队的节奏进行调整。
整个公式的form和parameter还是属于经验性的,也有个别参数是通过回归方程得出。
有兴趣的可以看这个wiki和他的书《Pro Basketball Forecast》。
http://en.wikipedia.org/wiki/Player_Efficiency_Rating
PER的问题在于这些毛的统计数据没cover的东西,PER也没办法cover。... 阅读全帖 |
|
Z*****l 发帖数: 14069 | 39 我拿起刀,对死者的颈部进行了解剖。死者的颈部肌肉大片出血,右侧胸锁乳突肌已经
断裂,结合皮肤看,这里并没有试切创,也没有拖擦痕,这应该是因为死者处于固定体
位下,被凶手用单刃刺器刺破血管的。
“死者和凶手有这么大范围的搏斗痕迹,但是这一刀却孤立存在,而且是在固定体
位下形成的。这一点,可以还原出杀人的动作。”我说,“凶手先是经过掐扼,让死者
晕厥,然后再用刀刺破了死者的颈静脉。”
“加固行为?”吴响问。
我点点头。
吴响说:“这个凶手还蛮老道的。”
“确实,加固死者死亡,打扫现场。”我说,“这一方面说明凶手和死者很有可能
是熟人,一方面说明凶手的反侦查意识很强,很有可能有前科劣迹。”
经过尸体检验,死者的全身脏器都呈贫血貌,血管内也较为空虚,这些都是典型的
失血貌。通过胃内容物检验,验证了死者是23日午夜死亡的。
“我现在有一些疑问。”我说,“不如我们先去现场看看,再到专案组碰头吧?”
林涛有些奇怪,说:“现场经过了反复拖擦,地面上的大部分血迹都被擦拭干净了
。”
“从尸体损失的血量看,现场确实应该有大量的血迹。”... 阅读全帖 |
|
d***s 发帖数: 275 | 40 搞回归方程什么的,弄简化模型描述什么的都是物理学家做的事情吧。
数学家要处理的问题应该是别人给抽象好的吧 |
|
s**********y 发帖数: 509 | 41 再多说几句, 尽管板斧已近发话要清理门户了。阳谋啊
这样的讨论有助于知道为什么interdisciplinar research不容易, 到底不容易在哪。
大题目, 只能泛泛的讲。
还是在自己起的楼里添砖吧。 言归正传。
生物学的基本思维是归纳,所以有一个新的事实, 大家都很兴奋。
数学的基本思维是演绎。 数学工具用的强的邻域, 只有在新的事实挑战既有的理论时
, 大家才兴奋。参见十九世纪末的物理学。
生物学研究有一个特点, 大家都在找新的事实。 欢句话说, 如果一个体系已近可以
开始演绎, 生物学的热点早已过去 (参见 老鼠派对 虫子派, 尽管虫子还离演绎差
很远)。
也就是说当你的回归方程可以用的时候, 生物学家会说让我们考虑另一种情况, 原来
的情况已近太简单 :)。 so you are chasing a moving target all the time.
生物学和数学可以结合吗? 结论是悲观的。但是我们看到的却是数学越来越多的在生
物学中引用。 为什么?
(1) 新仪器。 测序,图像, 筛选,array,这些技术的出现使得数学处理非常有用
。 凡是在instrumen... 阅读全帖 |
|
s**********y 发帖数: 509 | 42 重读了艳阳天 的 巨贴, 我也与生物学家合作了十几年了, 也来讲讲另一端的感受。
给大家提供另一个侧面, 希望有助合作。无意踢馆,如有冒犯, 请多包涵。
如果已经读了帖子 “生物使用数学“, 您可以跳过此帖, 因为我只是把信息整理了
一下。
I
生物中数学的使用有限, 主要在于生物研究从整体上仍处于描述的状态,还没有进入
预测的状态。 如果只用于描述,数学就会显得太复杂。
生物学的描述往往依赖于感觉 (或视觉)。 很多分子层面的描述,没有数据的支持,
可以称之为少量数据 + 大量想象。 国内某名家 称 动画, (ppt animation) 对生
物过程描述恒重要。要是从数理来看, 几乎是臆想 (呵呵)
经典遗传学, 是可以用数学预测 (如 豌豆性状 3:1 分离)。 但太少了。
想起一个故事: 生物老师上课: 某植物叶缘是大圆,某植物叶缘是小圆。
某植物叶缘是大齿,某植物叶缘是小齿。
数学家: 大小和形状是需要定义的!您在讲曲率,挠率, 半径,还是弧长?
生物老师: 少打岔, 认识杨树和槐树的差别吗?
关于形态分类, see 早期癌症细胞的自动分类。
II
生物学的基本思维是归纳... 阅读全帖 |
|
h***u 发帖数: 498 | 43 来自主题: Computation版 - 建立方程 STAT Toolbox,做回归分析。 |
|
D**o 发帖数: 2653 | 44 (下面说的主要针对金融里面的现象)
这问题我多年前就自以为理解透彻了,但直到最近才有全新的理解
我这里指的theory主要指的是applied theory
pure theory难那是公认的,也无需解释
applied theory很多文章看上去技巧都不复杂,但为什么做的人感觉很难
但到底比empirical难在什么地方,
我今天的看法要比过去理解深
做applied theory,解释一个事情,一开始难是难在如何把几个可能的原因
比如A,B,C,D的作用分别用4个模型显示出来,接下去难就难在要解释一个
相关的事情的时候,假如原因也可能就是A,B,C,D,但这时候的作者就一定
要把模型弄得至少看上去和原来已有的4个模型形式差别很大。
常常的情况就是看到一个模型觉得很容易就可以改进,但这类改进往往得不到
重视。你要改进可以,请给一个看上去和原来模型形式差别很大的出来。
empirical恰恰是相反的,这里面你去解释两个哪怕差别很大的事情,用到的
解释变量和回归方程,这个领域的人希望是越一样越好。比如fama-french
3factor出来以后,90%的文章都直接用这个了。这个就好比是 |
|
s**********y 发帖数: 509 | 45 【 以下文字转载自 Biology 讨论区 】
发信人: sunflowerboy (lonestar), 信区: Biology
标 题: 感慨一下数学/物理 和 生物 合作之难
发信站: BBS 未名空间站 (Sun Sep 2 23:32:00 2012, 美东)
重读了艳阳天 的 巨贴, 我也与生物学家合作了十几年了, 也来讲讲另一端的感受。
给大家提供另一个侧面, 希望有助合作。无意踢馆,如有冒犯, 请多包涵。
如果已经读了帖子 “生物使用数学“, 您可以跳过此帖, 因为我只是把信息整理了
一下。
I
生物中数学的使用有限, 主要在于生物研究从整体上仍处于描述的状态,还没有进入
预测的状态。 如果只用于描述,数学就会显得太复杂。
生物学的描述往往依赖于感觉 (或视觉)。 很多分子层面的描述,没有数据的支持,
可以称之为少量数据 + 大量想象。 国内某名家 称 动画, (ppt animation) 对生
物过程描述恒重要。要是从数理来看, 几乎是臆想 (呵呵)
经典遗传学, 是可以用数学预测 (如 豌豆性状 3:1 分离)。 但太少了。
想起一个故事: 生物老师上课: ... 阅读全帖 |
|
s**********y 发帖数: 509 | 46 【 以下文字转载自 Biology 讨论区 】
发信人: sunflowerboy (lonestar), 信区: Biology
标 题: 感慨一下数学/物理 和 生物 合作之难
发信站: BBS 未名空间站 (Sun Sep 2 23:32:00 2012, 美东)
重读了艳阳天 的 巨贴, 我也与生物学家合作了十几年了, 也来讲讲另一端的感受。
给大家提供另一个侧面, 希望有助合作。无意踢馆,如有冒犯, 请多包涵。
如果已经读了帖子 “生物使用数学“, 您可以跳过此帖, 因为我只是把信息整理了
一下。
I
生物中数学的使用有限, 主要在于生物研究从整体上仍处于描述的状态,还没有进入
预测的状态。 如果只用于描述,数学就会显得太复杂。
生物学的描述往往依赖于感觉 (或视觉)。 很多分子层面的描述,没有数据的支持,
可以称之为少量数据 + 大量想象。 国内某名家 称 动画, (ppt animation) 对生
物过程描述恒重要。要是从数理来看, 几乎是臆想 (呵呵)
经典遗传学, 是可以用数学预测 (如 豌豆性状 3:1 分离)。 但太少了。
想起一个故事: 生物老师上课: ... 阅读全帖 |
|
p***l 发帖数: 1775 | 47 有multicolinearity的时候,一般都是用best subset 或者stepwise去筛变量吧? |
|
|
s*********e 发帖数: 1051 | 49 everyone here is interested in independent variables selection. however, in
my work, i am more concerned about dependent variable definition :-) |
|
|