boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 一个线性回归问题,希望大家提供点思路
相关主题
我说老陈,咱别玩儿虚的了。你给说明一下这个简单的例子
问一个线性回归的问题
一个关于regression的问题
##如果logistic回归自变量x不是线性的,怎么办?##
[合集] 请教哪里有上百条满足二元线性回归的数据?
问一个Model的问题
怎么解决共线性问题
问个回归系数的问题
弱弱地问一句:SAS 对线性回归的趋势检验怎么做?
各位大侠帮帮忙,R问题求助
相关话题的讨论汇总
话题: 抽样话题: 模型话题: x2话题: x1话题: 回归
进入Statistics版参与讨论
1 (共1页)
l********e
发帖数: 220
1
现在有两个自变量A和B,依据这两个自变量分别建立一元线性回归模型,得到的可决系
数R^2分别是a和b,比方说第一个回归模型R^2是0.1,而第二个是0.2.
现在问题是,用A,B一起建立一个二元回归模型,R^2的上界和下界分别是多少?在比较
极端的条件下会是怎样的情况?
我只知道二元模型的R^2不会低于一元模型,可是对确切上下界没有思路,大家说说?
l********e
发帖数: 220
2
没有人指点下么?帮顶
D******n
发帖数: 2836
3
because no one knows what u r talking about, especially with these Chinese s
tat terms.

【在 l********e 的大作中提到】
: 没有人指点下么?帮顶
l*********s
发帖数: 5409
4
0.2 to 0.3

【在 l********e 的大作中提到】
: 没有人指点下么?帮顶
l********e
发帖数: 220
5
thanks. Is it possible to prove that?
My guess is:
lower bound: max(a,b)
upper bound: min(a+b, 1)
However, I tried a real case, the new R^2 could be bigger than (a+b). How
come? I feel confused..

【在 l*********s 的大作中提到】
: 0.2 to 0.3
T*******I
发帖数: 5138
6
如果让我来回答你的问题,我会说,你所提的问题以及试图加以证明的结论根本不存在
。其理由是,你的两个抽样所得的R^2不是确定的且有抽样标准误,而你试图得到的联
合R^2的可测空间与两个单独的R^2的可测空间是一样的,都是[0,1]。
你要明白,这里的问题是统计的非确定性的样本测量问题,不存在确定性命题的证明问
题。



【在 l********e 的大作中提到】
: 现在有两个自变量A和B,依据这两个自变量分别建立一元线性回归模型,得到的可决系
: 数R^2分别是a和b,比方说第一个回归模型R^2是0.1,而第二个是0.2.
: 现在问题是,用A,B一起建立一个二元回归模型,R^2的上界和下界分别是多少?在比较
: 极端的条件下会是怎样的情况?
: 我只知道二元模型的R^2不会低于一元模型,可是对确切上下界没有思路,大家说说?

l********e
发帖数: 220
7
其实不是两个抽样,是同一组抽样数据,只是分别用了两个feature做regression 而已
。联合R^2也是基于同样的这组数据。

【在 T*******I 的大作中提到】
: 如果让我来回答你的问题,我会说,你所提的问题以及试图加以证明的结论根本不存在
: 。其理由是,你的两个抽样所得的R^2不是确定的且有抽样标准误,而你试图得到的联
: 合R^2的可测空间与两个单独的R^2的可测空间是一样的,都是[0,1]。
: 你要明白,这里的问题是统计的非确定性的样本测量问题,不存在确定性命题的证明问
: 题。
:
: ?

l*********s
发帖数: 5409
8
No, your claim is utterly baseless. I bet you cannot find a single example
that bi-variate regression has a lower R^2 than min(Ra,Rb).

【在 T*******I 的大作中提到】
: 如果让我来回答你的问题,我会说,你所提的问题以及试图加以证明的结论根本不存在
: 。其理由是,你的两个抽样所得的R^2不是确定的且有抽样标准误,而你试图得到的联
: 合R^2的可测空间与两个单独的R^2的可测空间是一样的,都是[0,1]。
: 你要明白,这里的问题是统计的非确定性的样本测量问题,不存在确定性命题的证明问
: 题。
:
: ?

T*******I
发帖数: 5138
9
你和LZ显然没有读懂我的回答。理解我的回答似乎可以从下面的陈述中获得灵感:
如果将LZ的样本中的IDV扩大到>2的更高维度,其联合的R^2的可测空间依然是[0, 1]。
这里没有LZ所说的确定性命题需要被证明。即使有,那个证明又有何现实意义?统计面
对的是关于现实世界的随机的抽样测量,而非数学命题的逻辑证明。

【在 l*********s 的大作中提到】
: No, your claim is utterly baseless. I bet you cannot find a single example
: that bi-variate regression has a lower R^2 than min(Ra,Rb).

l*********s
发帖数: 5409
10
yes, it is possible. say if z = a - b, and a, b are highly correlated. then
Ra, Rb will be very small even when total R^2 is nearly 1.

【在 l********e 的大作中提到】
: thanks. Is it possible to prove that?
: My guess is:
: lower bound: max(a,b)
: upper bound: min(a+b, 1)
: However, I tried a real case, the new R^2 could be bigger than (a+b). How
: come? I feel confused..

相关主题
##如果logistic回归自变量x不是线性的,怎么办?##
[合集] 请教哪里有上百条满足二元线性回归的数据?
问一个Model的问题
怎么解决共线性问题
进入Statistics版参与讨论
G********t
发帖数: 334
11
下界正确。上界不对。(a+b)没有上界。
如果你学过线性模型理论,从几何的角度看y, x1, x2 这三个向量,你会发现只要他们
的相对位置合适,可以使得 a, b 很小,而(a+b)很大。
用下面的假数据:
y x1 x2
0.5 0.001 0.0015
1 -1 -0.9991
0.5 -0.001 0
1 0.89 0.94
SAS run 出来的结果是
R^2(x1)=0.0017, R^2(x2)=0.0005
R^2(x1,x2)= 0.9998

【在 l********e 的大作中提到】
: thanks. Is it possible to prove that?
: My guess is:
: lower bound: max(a,b)
: upper bound: min(a+b, 1)
: However, I tried a real case, the new R^2 could be bigger than (a+b). How
: come? I feel confused..

G********t
发帖数: 334
12
正解。

then

【在 l*********s 的大作中提到】
: yes, it is possible. say if z = a - b, and a, b are highly correlated. then
: Ra, Rb will be very small even when total R^2 is nearly 1.

G********t
发帖数: 334
13
大师你还是洗洗睡吧。

【在 T*******I 的大作中提到】
: 你和LZ显然没有读懂我的回答。理解我的回答似乎可以从下面的陈述中获得灵感:
: 如果将LZ的样本中的IDV扩大到>2的更高维度,其联合的R^2的可测空间依然是[0, 1]。
: 这里没有LZ所说的确定性命题需要被证明。即使有,那个证明又有何现实意义?统计面
: 对的是关于现实世界的随机的抽样测量,而非数学命题的逻辑证明。

c****y
发帖数: 3592
14
简单的问题竟然被搞得这么复杂
correlation正定矩阵,二元一次方程就完了么
x^2-2*sqrt(0.02)*x-0.7 <=0
-0.7~0.98都可以(这个是R,R^2就平方以下)
A*******s
发帖数: 3942
15
大师v5. 只要是大师不懂的, 都算没有意义, 因为大师要研究的是随机的不确定的, 确
定的答案大师都不屑一顾.

【在 T*******I 的大作中提到】
: 你和LZ显然没有读懂我的回答。理解我的回答似乎可以从下面的陈述中获得灵感:
: 如果将LZ的样本中的IDV扩大到>2的更高维度,其联合的R^2的可测空间依然是[0, 1]。
: 这里没有LZ所说的确定性命题需要被证明。即使有,那个证明又有何现实意义?统计面
: 对的是关于现实世界的随机的抽样测量,而非数学命题的逻辑证明。

T*******I
发帖数: 5138
16
我说那是两个抽样也没错。第一次你抽样研究Y与A的关系,第二次抽样研究Y与B的关系
,然后你将两次抽样合并来研究Y同时与A和B的关系。这样说有什么错吗?
你的问题是,你想通过已经得到的R^2(A)=a和R^2(B)=b来构造一个函数关系以确定R^2(
A & B)=c的可测空间。这是一个没有意义的事情,因为对于任何给定的样本,a, b, c
都是一个简单的随机“常量”,也就是说,只要样本被给定了,a, b, c就被确定了,
而它们中的每一个的可测空间根据其定义都是[0, 1]。

【在 l********e 的大作中提到】
: 其实不是两个抽样,是同一组抽样数据,只是分别用了两个feature做regression 而已
: 。联合R^2也是基于同样的这组数据。

g********r
发帖数: 8017
17
几何解决。知道Y和X1,X2之间的夹角了。X1,X2在平面上自由旋转。Y和平面夹角的范
围。

【在 l********e 的大作中提到】
: 现在有两个自变量A和B,依据这两个自变量分别建立一元线性回归模型,得到的可决系
: 数R^2分别是a和b,比方说第一个回归模型R^2是0.1,而第二个是0.2.
: 现在问题是,用A,B一起建立一个二元回归模型,R^2的上界和下界分别是多少?在比较
: 极端的条件下会是怎样的情况?
: 我只知道二元模型的R^2不会低于一元模型,可是对确切上下界没有思路,大家说说?

p***r
发帖数: 920
18
看大师写的中文我真的很崩溃
T*******I
发帖数: 5138
19
基本上,你的思维系统比较僵化。这是以罗素哲学系统为代表的现代数理逻辑训练出来
的数学头脑的悲剧。

【在 p***r 的大作中提到】
: 看大师写的中文我真的很崩溃
p*****r
发帖数: 341
20

爱因斯坦也没像你这么牛逼哄哄的。神马玩意!

【在 T*******I 的大作中提到】
: 基本上,你的思维系统比较僵化。这是以罗素哲学系统为代表的现代数理逻辑训练出来
: 的数学头脑的悲剧。

相关主题
问个回归系数的问题
弱弱地问一句:SAS 对线性回归的趋势检验怎么做?
各位大侠帮帮忙,R问题求助
zero-truncated poisson是啥意思?
进入Statistics版参与讨论
T*******I
发帖数: 5138
21
你之所以这样说是因为你不懂在这个数理逻辑之外还有另外的逻辑系统。

【在 p*****r 的大作中提到】
:
: 爱因斯坦也没像你这么牛逼哄哄的。神马玩意!

p*****r
发帖数: 341
22

你那神马系统我搞不懂也没兴趣搞懂

【在 T*******I 的大作中提到】
: 你之所以这样说是因为你不懂在这个数理逻辑之外还有另外的逻辑系统。
T*******I
发帖数: 5138
23
所以,你的思路就永远只能在演绎-归纳之间循环。

【在 p*****r 的大作中提到】
:
: 你那神马系统我搞不懂也没兴趣搞懂

w******e
发帖数: 1621
24
你们啊 naive!!!
大师的回复给我们带来了多少欢乐,你们还这样
1 (共1页)
进入Statistics版参与讨论
相关主题
各位大侠帮帮忙,R问题求助
zero-truncated poisson是啥意思?
问统计大侠们一个有趣的数学问题
请教一个曲线拟合的问题 (转载)
请问: 在做LOGISTIC REGRESSION 分析的时候,ORDINAL 的自变量可以当作CONTINUOUS 来处理么,
regression要求做normality test么?
请教一个很白痴的回归分析的问题
如何确定什么情况time series,什么情况linear reg?
请大侠帮忙看一下这个该用哪个SAS code
linear regression 中的categorical data
相关话题的讨论汇总
话题: 抽样话题: 模型话题: x2话题: x1话题: 回归