由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
PKU版 - 怎么算两个变量的相关度啊?
相关主题
[合集] 怎么算两个变量的相关度啊?收到周校长的信
人生完整了!做个心理游戏吧
发包子!(买买提最大方的包子贴)有没有校友愿意给我当导游啊 :)
今天咖啡喝多了 啊50人在线
今天堕落时间到人呢?
你们这些疯人刘若英《光》翻唱 by breeziness
pd奔了么?微风mm啥时候奔啊?
微风mm请进可怜的微风mm阿
相关话题的讨论汇总
话题: regression话题: linear话题: 微风话题: excel
进入PKU版参与讨论
1 (共1页)
h*******x
发帖数: 12808
1
有什么好的度量吗?
b******a
发帖数: 12216
2
regression?就是那个啥r2的东东?

【在 h*******x 的大作中提到】
: 有什么好的度量吗?
h*******x
发帖数: 12808
3
这是什么啊?

【在 b******a 的大作中提到】
: regression?就是那个啥r2的东东?
b******a
发帖数: 12216
4
统计分析啊?

【在 h*******x 的大作中提到】
: 这是什么啊?
h*******x
发帖数: 12808
5
猪猪姐会用R吗?

【在 b******a 的大作中提到】
: 统计分析啊?
b******a
发帖数: 12216
6
你去查correlation,那里有讲R^2啥的。而且一般学校里都有统计学的老师可以给你免
费的consult(至少我们学校有)。再不行的话,你把具体的数据和实验情况发给我,
我看看我会不会分析。我数统不强,顶多就是个半瓶子醋。。。

【在 h*******x 的大作中提到】
: 猪猪姐会用R吗?
h*******x
发帖数: 12808
7
我就是两列数据,一个是power,一个是丢包率,都是每隔几毫秒sample一次。
我想知道,power和丢包率之间有没有关系,是否是能量越低,丢包率越高。不知道怎
么衡量他俩之间的关系。我现在办法,把同一个时间的里面的power和丢包率,做为一
个点画到图上。有好多好多这样的点对,如果最后形成图看着很细,说明他们之间相关
性越强。如果最后在坐标图上到处都是点,那么说明他们之间没有什么关系。

【在 b******a 的大作中提到】
: 你去查correlation,那里有讲R^2啥的。而且一般学校里都有统计学的老师可以给你免
: 费的consult(至少我们学校有)。再不行的话,你把具体的数据和实验情况发给我,
: 我看看我会不会分析。我数统不强,顶多就是个半瓶子醋。。。

b******a
发帖数: 12216
8
那就用linear regression就行了吧。有prism5不?没有去下一个试用版,然后就用那
个。

【在 h*******x 的大作中提到】
: 我就是两列数据,一个是power,一个是丢包率,都是每隔几毫秒sample一次。
: 我想知道,power和丢包率之间有没有关系,是否是能量越低,丢包率越高。不知道怎
: 么衡量他俩之间的关系。我现在办法,把同一个时间的里面的power和丢包率,做为一
: 个点画到图上。有好多好多这样的点对,如果最后形成图看着很细,说明他们之间相关
: 性越强。如果最后在坐标图上到处都是点,那么说明他们之间没有什么关系。

h*******x
发帖数: 12808
9
这都是神马?
linear regression?prism?我都不知道是啥。

道怎
为一
相关

【在 b******a 的大作中提到】
: 那就用linear regression就行了吧。有prism5不?没有去下一个试用版,然后就用那
: 个。

b******a
发帖数: 12216
10
放狗查。

【在 h*******x 的大作中提到】
: 这都是神马?
: linear regression?prism?我都不知道是啥。
:
: 道怎
: 为一
: 相关

相关主题
你们这些疯人收到周校长的信
pd奔了么?做个心理游戏吧
微风mm请进有没有校友愿意给我当导游啊 :)
进入PKU版参与讨论
h*******x
发帖数: 12808
11
我还在狗窝里面呢。看不懂结果啊。

【在 b******a 的大作中提到】
: 放狗查。
b******a
发帖数: 12216
12
唉,我再坚持坚持。你把结果说出来听听。

【在 h*******x 的大作中提到】
: 我还在狗窝里面呢。看不懂结果啊。
h*******x
发帖数: 12808
13
我是说那个计算机过程看不懂
如果两个变量有关系,但是不是线性关系,怎么办?

【在 b******a 的大作中提到】
: 唉,我再坚持坚持。你把结果说出来听听。
b******a
发帖数: 12216
14
prism 5里有多种线性关系,一级,二级,三级的都有。你一个一个试试,哈哈。

【在 h*******x 的大作中提到】
: 我是说那个计算机过程看不懂
: 如果两个变量有关系,但是不是线性关系,怎么办?

h*******x
发帖数: 12808
15
prism没有linux版本啊
而且要明白那些关系是什么含义啊

【在 b******a 的大作中提到】
: prism 5里有多种线性关系,一级,二级,三级的都有。你一个一个试试,哈哈。
c*******e
发帖数: 1828
16
covariance?

【在 h*******x 的大作中提到】
: 有什么好的度量吗?
h*******x
发帖数: 12808
17
这是啥?

【在 c*******e 的大作中提到】
: covariance?
b********s
发帖数: 6928
18
correct me if this isn't right
want to test the correlation of the two variables? use any basic softw
are package and look for the Pearson's product-moment coefficient? the
larger the value, the stronger the association of the two variables?
want to see how the dependent variable changes with the independent va
riable? try linear regression, test significance of the slope??? if do
esn't fit, add polynomial terms???
your idea is correct. if the graph shows a line that is almost linear,
it means that the two variables have a linear relationship. if the do
ts are spread all over, then it means there is no relationship between
the two variables. if the graph shows a curve, you need to add polyno
mial terms to the equation. you may want to first do the graph to visu
ally see what relationship there is and then fit the data to a regress
ion?

【在 h*******x 的大作中提到】
: 我就是两列数据,一个是power,一个是丢包率,都是每隔几毫秒sample一次。
: 我想知道,power和丢包率之间有没有关系,是否是能量越低,丢包率越高。不知道怎
: 么衡量他俩之间的关系。我现在办法,把同一个时间的里面的power和丢包率,做为一
: 个点画到图上。有好多好多这样的点对,如果最后形成图看着很细,说明他们之间相关
: 性越强。如果最后在坐标图上到处都是点,那么说明他们之间没有什么关系。

s********l
发帖数: 5752
19
最简单的就是算correlation,这个用excel就能做~~如果按照你的猜测,算出来的结果
是负的,超过-0.5就属于高度相关了。
c*******e
发帖数: 1828
20
correlation只能反应1维的相关性(比如在x^2+y^2=1上随机采样,算出来的
correlation随样本量增大会收敛到0)

【在 s********l 的大作中提到】
: 最简单的就是算correlation,这个用excel就能做~~如果按照你的猜测,算出来的结果
: 是负的,超过-0.5就属于高度相关了。

相关主题
50人在线微风mm啥时候奔啊?
人呢?可怜的微风mm阿
刘若英《光》翻唱 by breeziness梁静茹有一首歌,谁知道是哪一首
进入PKU版参与讨论
c*******e
发帖数: 1828
21
他这个我估摸着线性的东西是不够用了
我也同意你说的:如果要直观的结果的话,潇妹想法没错,样本点在二维分布上越接近
一条曲线说明dependency越强
nonlinear regression是个办法,不过如果他不需要fit出精确模型且样本量够大的话
算一下var(power|丢包率) 也可以考虑
不过从做research出发,我也推荐用regression搞个模型出来
另外做regression的时候,除了y=poly(x), 也可以考虑y=poly(log(x))这种模型
这里poly(x)指的是关于x的多项式

【在 b********s 的大作中提到】
: correct me if this isn't right
: want to test the correlation of the two variables? use any basic softw
: are package and look for the Pearson's product-moment coefficient? the
: larger the value, the stronger the association of the two variables?
: want to see how the dependent variable changes with the independent va
: riable? try linear regression, test significance of the slope??? if do
: esn't fit, add polynomial terms???
: your idea is correct. if the graph shows a line that is almost linear,
: it means that the two variables have a linear relationship. if the do
: ts are spread all over, then it means there is no relationship between

P**********n
发帖数: 6311
22
赞专业!

【在 c*******e 的大作中提到】
: 他这个我估摸着线性的东西是不够用了
: 我也同意你说的:如果要直观的结果的话,潇妹想法没错,样本点在二维分布上越接近
: 一条曲线说明dependency越强
: nonlinear regression是个办法,不过如果他不需要fit出精确模型且样本量够大的话
: 算一下var(power|丢包率) 也可以考虑
: 不过从做research出发,我也推荐用regression搞个模型出来
: 另外做regression的时候,除了y=poly(x), 也可以考虑y=poly(log(x))这种模型
: 这里poly(x)指的是关于x的多项式

s********l
发帖数: 5752
23
牛死了~~~让我膜拜一下!!!

【在 c*******e 的大作中提到】
: 他这个我估摸着线性的东西是不够用了
: 我也同意你说的:如果要直观的结果的话,潇妹想法没错,样本点在二维分布上越接近
: 一条曲线说明dependency越强
: nonlinear regression是个办法,不过如果他不需要fit出精确模型且样本量够大的话
: 算一下var(power|丢包率) 也可以考虑
: 不过从做research出发,我也推荐用regression搞个模型出来
: 另外做regression的时候,除了y=poly(x), 也可以考虑y=poly(log(x))这种模型
: 这里poly(x)指的是关于x的多项式

h*******x
发帖数: 12808
24
我不太懂regression是什么意思。
我画完图,data是一个比较瘦的平行四边形:(

道怎
为一
相关

【在 b********s 的大作中提到】
: correct me if this isn't right
: want to test the correlation of the two variables? use any basic softw
: are package and look for the Pearson's product-moment coefficient? the
: larger the value, the stronger the association of the two variables?
: want to see how the dependent variable changes with the independent va
: riable? try linear regression, test significance of the slope??? if do
: esn't fit, add polynomial terms???
: your idea is correct. if the graph shows a line that is almost linear,
: it means that the two variables have a linear relationship. if the do
: ts are spread all over, then it means there is no relationship between

c*******e
发帖数: 1828
25
截个图贴上来看看?或者把数据直接贴了 :P

【在 h*******x 的大作中提到】
: 我不太懂regression是什么意思。
: 我画完图,data是一个比较瘦的平行四边形:(
:
: 道怎
: 为一
: 相关

h*******x
发帖数: 12808
26
主要是公司的数据,有些保密条款不敢乱贴。
就是大概这样的
| **************
| ****
| * *****
| ******
| ***
| *****
| ****
| *********
+-----------------------------

【在 c*******e 的大作中提到】
: 截个图贴上来看看?或者把数据直接贴了 :P
c*******e
发帖数: 1828
27
你这个看起来感觉就是一个线性的模型, 两个变量应该有差不多线性的相关关系
按照微风那个贴子里说的办法算correlation或者linear regression肯定没问题
放狗搜一下怎么在R里做linear regression就好了, R是免费软件
(上下两条是基准线么? 1和0? 如果不是,你可能需要解释一下)

【在 h*******x 的大作中提到】
: 主要是公司的数据,有些保密条款不敢乱贴。
: 就是大概这样的
: | **************
: | ****
: | * *****
: | ******
: | ***
: | *****
: | ****
: | *********

h*******x
发帖数: 12808
28
不是,就是当能量大于一个阈值之后,就所有包都能收到
小于一个阈值,所有的包都丢了。

【在 c*******e 的大作中提到】
: 你这个看起来感觉就是一个线性的模型, 两个变量应该有差不多线性的相关关系
: 按照微风那个贴子里说的办法算correlation或者linear regression肯定没问题
: 放狗搜一下怎么在R里做linear regression就好了, R是免费软件
: (上下两条是基准线么? 1和0? 如果不是,你可能需要解释一下)

s****e
发帖数: 3310
29
妹儿啊,有啥不懂的,包在哥身上。

【在 h*******x 的大作中提到】
: 我不太懂regression是什么意思。
: 我画完图,data是一个比较瘦的平行四边形:(
:
: 道怎
: 为一
: 相关

c*******e
发帖数: 1828
30
这样的话可以把能量在另个阈值之间的点拿出来做个linear regression
(如果只需要判断相关性不要具体模型可以直接算correlation)
如果再考虑的细致一点的话, 应该是做了linear regression之后看算出来的R^2
这个值如果不够大的话说明你的模型需要考虑别的参数
(就说丢包率还和能量以外的某些因素相关)
如果R^2已经很大比如大于0.9了 (R^2代表你提出的模型和现有数据的匹配程度,最大是
1)
那你这个能量-丢包率的模型基本上就算做完了:)

【在 h*******x 的大作中提到】
: 不是,就是当能量大于一个阈值之后,就所有包都能收到
: 小于一个阈值,所有的包都丢了。

相关主题
haha, 又抢30000了人生完整了!
呼叫微风mm发包子!(买买提最大方的包子贴)
[合集] 怎么算两个变量的相关度啊?今天咖啡喝多了 啊
进入PKU版参与讨论
h*******x
发帖数: 12808
31
我们不用做模型,就是看看有多少想关性,以后做系统的时候会用到。
r^2是什么啊

【在 c*******e 的大作中提到】
: 这样的话可以把能量在另个阈值之间的点拿出来做个linear regression
: (如果只需要判断相关性不要具体模型可以直接算correlation)
: 如果再考虑的细致一点的话, 应该是做了linear regression之后看算出来的R^2
: 这个值如果不够大的话说明你的模型需要考虑别的参数
: (就说丢包率还和能量以外的某些因素相关)
: 如果R^2已经很大比如大于0.9了 (R^2代表你提出的模型和现有数据的匹配程度,最大是
: 1)
: 那你这个能量-丢包率的模型基本上就算做完了:)

c*******e
发帖数: 1828
32
要是只要相关性就去算correlation吧, 记得只取能量在两个阈值之间的部分
R^2是你算出模型以后考察模型fit程度的东西:)

【在 h*******x 的大作中提到】
: 我们不用做模型,就是看看有多少想关性,以后做系统的时候会用到。
: r^2是什么啊

s********l
发帖数: 5752
33
万一linear regression出来的参数不显著呢~~
c*******e
发帖数: 1828
34
你看他下面贴的那个图, 不显著的可能性不大
而且潇妹说了, 他们不要求做出model来, 只要量化一下相关性就好了
所以让他直接算correlation吧:)

【在 s********l 的大作中提到】
: 万一linear regression出来的参数不显著呢~~
h*******x
发帖数: 12808
35
linear regression到底是作什么的啊?
我一直不理解regression的含义

的酒,却只爱过一个正当最好年龄的人。。。

【在 s********l 的大作中提到】
: 万一linear regression出来的参数不显著呢~~
h*******x
发帖数: 12808
36
谢谢微风。微风好professional啊。

道怎
为一
相关

【在 b********s 的大作中提到】
: correct me if this isn't right
: want to test the correlation of the two variables? use any basic softw
: are package and look for the Pearson's product-moment coefficient? the
: larger the value, the stronger the association of the two variables?
: want to see how the dependent variable changes with the independent va
: riable? try linear regression, test significance of the slope??? if do
: esn't fit, add polynomial terms???
: your idea is correct. if the graph shows a line that is almost linear,
: it means that the two variables have a linear relationship. if the do
: ts are spread all over, then it means there is no relationship between

s****e
发帖数: 3310
37
怎么不谢俺,俺不说也帮你了么。
这么不相信哥啊,就算哥不会,哥还能请人帮你做不是,einstein行不?

【在 h*******x 的大作中提到】
: 谢谢微风。微风好professional啊。
:
: 道怎
: 为一
: 相关

s****e
发帖数: 3310
38
靠,不用谢了。俺秘书说电话打晚了,这位已经不健在了

怎么不谢俺,俺不说也帮你了么。
这么不相信哥啊,就算哥不会,哥还能请人帮你做不是,einstein行不?

【在 s****e 的大作中提到】
: 怎么不谢俺,俺不说也帮你了么。
: 这么不相信哥啊,就算哥不会,哥还能请人帮你做不是,einstein行不?

h*******x
发帖数: 12808
39
下此早点啊

【在 s****e 的大作中提到】
: 靠,不用谢了。俺秘书说电话打晚了,这位已经不健在了
:
: 怎么不谢俺,俺不说也帮你了么。
: 这么不相信哥啊,就算哥不会,哥还能请人帮你做不是,einstein行不?

c*******e
发帖数: 1828
40
参照wiki吧, http://en.wikipedia.org/wiki/Linear_regression

【在 h*******x 的大作中提到】
: linear regression到底是作什么的啊?
: 我一直不理解regression的含义
:
: 的酒,却只爱过一个正当最好年龄的人。。。

相关主题
今天咖啡喝多了 啊pd奔了么?
今天堕落时间到微风mm请进
你们这些疯人收到周校长的信
进入PKU版参与讨论
s****e
发帖数: 3310
41
行,下次你直接到他家找他也行。

下此早点啊

【在 h*******x 的大作中提到】
: 下此早点啊
b********s
发帖数: 6928
42
dude it would be difficult to explain what regression is in a few sent
ences. basically it helps you explore how Y changes with X changing. I
f you have more than one X, then it helps you explore how Y changes wi
th X1 changing and all the other X held constant
anyway, if you don't need the exact relationship between the two varia
bles, just use any available point and click software, run descriptive
statistics, and look for the correlation. if the value is larger than
, say 0.6, it is strong relationship between X and Y, totally simple
use R, it should be totally easy for you to use

【在 h*******x 的大作中提到】
: linear regression到底是作什么的啊?
: 我一直不理解regression的含义
:
: 的酒,却只爱过一个正当最好年龄的人。。。

b********s
发帖数: 6928
43
well then it seems like a linear relationship with a limited range of
the independent variable, i.e. the power

【在 h*******x 的大作中提到】
: 不是,就是当能量大于一个阈值之后,就所有包都能收到
: 小于一个阈值,所有的包都丢了。

b********s
发帖数: 6928
44
R^2 explains how much of the variance in Y is captured by X
if its value is 1, means that 100% of the variance in Y is captured by X
if you don't run the regression, don't worry about this one

【在 h*******x 的大作中提到】
: 我们不用做模型,就是看看有多少想关性,以后做系统的时候会用到。
: r^2是什么啊

p********l
发帖数: 32
45
excel都可以做啊....
选数据分析.
你google下好了...

【在 h*******x 的大作中提到】
: 这都是神马?
: linear regression?prism?我都不知道是啥。
:
: 道怎
: 为一
: 相关

p********l
发帖数: 32
46
是不是线形最简单方法是先描点看啊...
然后run完看看R-sqr好了

【在 h*******x 的大作中提到】
: 我是说那个计算机过程看不懂
: 如果两个变量有关系,但是不是线性关系,怎么办?

b********s
发帖数: 6928
47
请问是不是要加载扩展功能?咋加载?多谢

【在 p********l 的大作中提到】
: excel都可以做啊....
: 选数据分析.
: 你google下好了...

p********l
发帖数: 32
48
附带,你到底只是要知道两个变量相关性(那叫correlation), 还是要知道两个变量的具
体等式阿(比方,一个确确的方程告诉你,y自变量是如何由x因变量确定)?

【在 p********l 的大作中提到】
: 是不是线形最简单方法是先描点看啊...
: 然后run完看看R-sqr好了

p********l
发帖数: 32
49
excel? version 2007 is build in.
just click the office image (left-top corner), then click "excel option",
then click "adds in". u will find it there.
old version excel prob. needs adds in...forget about that, but should be
easy to download online if that is the case...
suddenly i can not type Chinese...-____-
GL

【在 b********s 的大作中提到】
: 请问是不是要加载扩展功能?咋加载?多谢
p********l
发帖数: 32
50
btw, if u only want to see the correlation, a simple function in excel calle
d "correl" does this job~.

【在 p********l 的大作中提到】
: excel? version 2007 is build in.
: just click the office image (left-top corner), then click "excel option",
: then click "adds in". u will find it there.
: old version excel prob. needs adds in...forget about that, but should be
: easy to download online if that is the case...
: suddenly i can not type Chinese...-____-
: GL

相关主题
做个心理游戏吧人呢?
有没有校友愿意给我当导游啊 :)刘若英《光》翻唱 by breeziness
50人在线微风mm啥时候奔啊?
进入PKU版参与讨论
b********s
发帖数: 6928
51
找到了,多谢啊!我原来都不知道excel还可以做这些……

【在 p********l 的大作中提到】
: excel? version 2007 is build in.
: just click the office image (left-top corner), then click "excel option",
: then click "adds in". u will find it there.
: old version excel prob. needs adds in...forget about that, but should be
: easy to download online if that is the case...
: suddenly i can not type Chinese...-____-
: GL

p********l
发帖数: 32
52
you are very welcome, my pleasure ^_^

【在 b********s 的大作中提到】
: 找到了,多谢啊!我原来都不知道excel还可以做这些……
h*******x
发帖数: 12808
53
谢谢微风,微风好专业啊。
我最近一直没有时间来学R

【在 b********s 的大作中提到】
: dude it would be difficult to explain what regression is in a few sent
: ences. basically it helps you explore how Y changes with X changing. I
: f you have more than one X, then it helps you explore how Y changes wi
: th X1 changing and all the other X held constant
: anyway, if you don't need the exact relationship between the two varia
: bles, just use any available point and click software, run descriptive
: statistics, and look for the correlation. if the value is larger than
: , say 0.6, it is strong relationship between X and Y, totally simple
: use R, it should be totally easy for you to use

h*******x
发帖数: 12808
54
原来是这样。微风解释的好清楚啊!

【在 b********s 的大作中提到】
: R^2 explains how much of the variance in Y is captured by X
: if its value is 1, means that 100% of the variance in Y is captured by X
: if you don't run the regression, don't worry about this one

h*******x
发帖数: 12808
55
就看到orrelation的程度把
不用具体的model

【在 p********l 的大作中提到】
: 附带,你到底只是要知道两个变量相关性(那叫correlation), 还是要知道两个变量的具
: 体等式阿(比方,一个确确的方程告诉你,y自变量是如何由x因变量确定)?

h*******x
发帖数: 12808
56
公司里面没有excel啊

【在 p********l 的大作中提到】
: excel? version 2007 is build in.
: just click the office image (left-top corner), then click "excel option",
: then click "adds in". u will find it there.
: old version excel prob. needs adds in...forget about that, but should be
: easy to download online if that is the case...
: suddenly i can not type Chinese...-____-
: GL

p********l
发帖数: 32
57
GOOD NEWS FOR YOU.
you can use online google excel.
and it luckily does have the "correl" function build in, so just paste your
data, and use the "correl" function~~
GL

【在 h*******x 的大作中提到】
: 公司里面没有excel啊
p********l
发帖数: 32
58
click your mouse into any cell, then type "=correl(", then use your mouse to
click the first series data, then type",", then use your mouse to select yo
ur scond series of data, then tyep ")", done~

your

【在 p********l 的大作中提到】
: GOOD NEWS FOR YOU.
: you can use online google excel.
: and it luckily does have the "correl" function build in, so just paste your
: data, and use the "correl" function~~
: GL

b********s
发帖数: 6928
59
赞!!!

to
yo

【在 p********l 的大作中提到】
: click your mouse into any cell, then type "=correl(", then use your mouse to
: click the first series data, then type",", then use your mouse to select yo
: ur scond series of data, then tyep ")", done~
:
: your

h*******x
发帖数: 12808
60
我的数据两比较大,大概有几十万个。
excel之类只能处理小于65k个数据吧。我这里有数十个文件,很多文件的数据都超过几
十万。excel之类不是很给力。

your

【在 p********l 的大作中提到】
: GOOD NEWS FOR YOU.
: you can use online google excel.
: and it luckily does have the "correl" function build in, so just paste your
: data, and use the "correl" function~~
: GL

相关主题
可怜的微风mm阿呼叫微风mm
梁静茹有一首歌,谁知道是哪一首[合集] 怎么算两个变量的相关度啊?
haha, 又抢30000了人生完整了!
进入PKU版参与讨论
h*******x
发帖数: 12808
61
微风,在R里面怎么算相关性啊?能用什么函数啊?或者什么package?

【在 b********s 的大作中提到】
: 赞!!!
:
: to
: yo

b********s
发帖数: 6928
62
我不精通的,用 cor( var1, var2)试试吧,default是Pearson's product-mome
nt correlation coefficient,是最基本的function

【在 h*******x 的大作中提到】
: 微风,在R里面怎么算相关性啊?能用什么函数啊?或者什么package?
p********l
发帖数: 32
63
是啊. 老excel处理60k+行...不好意思不知道你多少数据.
csv或者excel2007可以处理1000k+行,而且可以使用correl 方程.
最后..你随便是用一个统计软件(比如:sas/gauss/stat/eview,或者随便搞个编成软件写
个方程就可以阿,比如C++)
....这个问题折磨你好久阿, GL!!

【在 h*******x 的大作中提到】
: 我的数据两比较大,大概有几十万个。
: excel之类只能处理小于65k个数据吧。我这里有数十个文件,很多文件的数据都超过几
: 十万。excel之类不是很给力。
:
: your

b********s
发帖数: 6928
64
类似这样的东西你难道不是大侠!
setwd("DIRECTORY")
data = read.csv("DATA.csv")
Y=data[,1]
X=data[,2]
correlation=cor(var1, var2)
summary(correlation)

【在 h*******x 的大作中提到】
: 微风,在R里面怎么算相关性啊?能用什么函数啊?或者什么package?
b********s
发帖数: 6928
65
那些软件都要钱的吧。。。话说他cs的编程大侠,竟然要问怎么用R,我觉得他是
故意耍咱们呢,哼哼

件写

【在 p********l 的大作中提到】
: 是啊. 老excel处理60k+行...不好意思不知道你多少数据.
: csv或者excel2007可以处理1000k+行,而且可以使用correl 方程.
: 最后..你随便是用一个统计软件(比如:sas/gauss/stat/eview,或者随便搞个编成软件写
: 个方程就可以阿,比如C++)
: ....这个问题折磨你好久阿, GL!!

p********l
发帖数: 32
66
a a a...被调戏了...
俺闭嘴了...

【在 b********s 的大作中提到】
: 那些软件都要钱的吧。。。话说他cs的编程大侠,竟然要问怎么用R,我觉得他是
: 故意耍咱们呢,哼哼
:
: 件写

b********s
发帖数: 6928
67
别,他估计是真不会做,因为他不知道啥是correlation,你帮帮他吧

【在 p********l 的大作中提到】
: a a a...被调戏了...
: 俺闭嘴了...

h*******x
发帖数: 12808
68
好的,谢谢啊,我去查查。
var1,var2是数组吗?

【在 b********s 的大作中提到】
: 我不精通的,用 cor( var1, var2)试试吧,default是Pearson's product-mome
: nt correlation coefficient,是最基本的function

h*******x
发帖数: 12808
69
微风好厉害啊!太感谢啦。

【在 b********s 的大作中提到】
: 我不精通的,用 cor( var1, var2)试试吧,default是Pearson's product-mome
: nt correlation coefficient,是最基本的function

h*******x
发帖数: 12808
70
微风太牛了,太感谢啦!!
我完全不会统计的东西啊

【在 b********s 的大作中提到】
: 类似这样的东西你难道不是大侠!
: setwd("DIRECTORY")
: data = read.csv("DATA.csv")
: Y=data[,1]
: X=data[,2]
: correlation=cor(var1, var2)
: summary(correlation)

相关主题
人生完整了!今天堕落时间到
发包子!(买买提最大方的包子贴)你们这些疯人
今天咖啡喝多了 啊pd奔了么?
进入PKU版参与讨论
h*******x
发帖数: 12808
71
晕,那我也不能什么都会啊:(

【在 b********s 的大作中提到】
: 那些软件都要钱的吧。。。话说他cs的编程大侠,竟然要问怎么用R,我觉得他是
: 故意耍咱们呢,哼哼
:
: 件写

h*******x
发帖数: 12808
72
可不是,可不是.

【在 b********s 的大作中提到】
: 别,他估计是真不会做,因为他不知道啥是correlation,你帮帮他吧
b******a
发帖数: 12216
73

哦,那我估计帮不了你了,吼吼。

【在 h*******x 的大作中提到】
: prism没有linux版本啊
: 而且要明白那些关系是什么含义啊

h*******x
发帖数: 12808
74
:(,为什么啊?

【在 b******a 的大作中提到】
:
: 哦,那我估计帮不了你了,吼吼。

b******a
发帖数: 12216
75
我就知道结果是什么意思,中间怎么计算的我咋会知道涅。。。
你去wiki啊,一般都会告诉你这个到底怎么计算的。

【在 h*******x 的大作中提到】
: :(,为什么啊?
b********s
发帖数: 6928
76
var1, var2是csv里面的column lable,就是variable name,呵呵

【在 h*******x 的大作中提到】
: 好的,谢谢啊,我去查查。
: var1,var2是数组吗?

d**********u
发帖数: 4124
77
谢谢这个帖子里校友们对潇妹的帮助~赞~
每人一个包子:)
h*******x
发帖数: 12808
78
啊,这样啊,那我给版里面捐点包子把。

【在 d**********u 的大作中提到】
: 谢谢这个帖子里校友们对潇妹的帮助~赞~
: 每人一个包子:)

B******u
发帖数: 23763
79
老弟阿,你这个人,唉,俺咋说你呢?
你躲一边看看也就是了,
插啥嘴阿。

【在 s****e 的大作中提到】
: 靠,不用谢了。俺秘书说电话打晚了,这位已经不健在了
:
: 怎么不谢俺,俺不说也帮你了么。
: 这么不相信哥啊,就算哥不会,哥还能请人帮你做不是,einstein行不?

B******u
发帖数: 23763
80
sb可以用学生证去sac拿office的阿。

【在 h*******x 的大作中提到】
: 公司里面没有excel啊
相关主题
微风mm请进有没有校友愿意给我当导游啊 :)
收到周校长的信50人在线
做个心理游戏吧人呢?
进入PKU版参与讨论
B******u
发帖数: 23763
81
强烈要求小妹自掏腰包哈。

【在 d**********u 的大作中提到】
: 谢谢这个帖子里校友们对潇妹的帮助~赞~
: 每人一个包子:)

B******u
发帖数: 23763
82
赞,
看看小妹这觉悟阿。

【在 h*******x 的大作中提到】
: 啊,这样啊,那我给版里面捐点包子把。
s****e
发帖数: 3310
83
笑死俺了,这话说的好像你别的会的很多似的。
这是大一水平的题好不好,P大真是一辈不如一辈了。

【在 h*******x 的大作中提到】
: 晕,那我也不能什么都会啊:(
s****e
发帖数: 3310
84
俺木有收到包子啊!

【在 d**********u 的大作中提到】
: 谢谢这个帖子里校友们对潇妹的帮助~赞~
: 每人一个包子:)

s****e
发帖数: 3310
85
版主捐包子1000起,不能掉价哦

【在 h*******x 的大作中提到】
: 啊,这样啊,那我给版里面捐点包子把。
d**********u
发帖数: 4124
86
赞潇妹大方~

啊,这样啊,那我给版里面捐点包子把。

【在 h*******x 的大作中提到】
: 啊,这样啊,那我给版里面捐点包子把。
d**********u
发帖数: 4124
87
小童鞋你帮潇妹了么?就看到你捣乱了....

【在 s****e 的大作中提到】
: 俺木有收到包子啊!
s****e
发帖数: 3310
88
俺不会啊,怎么帮。俺虽然没帮上忙,在主观意愿上也是支持潇妹的吧,也算精神可嘉
对不

小童鞋你帮潇妹了么?就看到你捣乱了....

【在 d**********u 的大作中提到】
: 小童鞋你帮潇妹了么?就看到你捣乱了....
d**********u
发帖数: 4124
89
你不是说这是大一水平的题么!

【在 s****e 的大作中提到】
: 俺不会啊,怎么帮。俺虽然没帮上忙,在主观意愿上也是支持潇妹的吧,也算精神可嘉
: 对不
:
: 小童鞋你帮潇妹了么?就看到你捣乱了....

s****e
发帖数: 3310
90
我。。。我是小学文化

【在 d**********u 的大作中提到】
: 你不是说这是大一水平的题么!
相关主题
刘若英《光》翻唱 by breeziness梁静茹有一首歌,谁知道是哪一首
微风mm啥时候奔啊?haha, 又抢30000了
可怜的微风mm阿呼叫微风mm
进入PKU版参与讨论
d**********u
发帖数: 4124
91
哼唧,偶看你小学也没毕业

【在 s****e 的大作中提到】
: 我。。。我是小学文化
s****e
发帖数: 3310
92
哼哼,俺开个玩笑,还当真了啊。俺不出手那是因为俺一出手,问题就迎刃而解了,还
咋灌水?这份儿苦心,你们好好理解着点吧。

【在 d**********u 的大作中提到】
: 哼唧,偶看你小学也没毕业
d**********u
发帖数: 4124
93


【在 s****e 的大作中提到】
: 哼哼,俺开个玩笑,还当真了啊。俺不出手那是因为俺一出手,问题就迎刃而解了,还
: 咋灌水?这份儿苦心,你们好好理解着点吧。

b******a
发帖数: 12216
94
哇,快来看城墙拐弯啊!

【在 s****e 的大作中提到】
: 哼哼,俺开个玩笑,还当真了啊。俺不出手那是因为俺一出手,问题就迎刃而解了,还
: 咋灌水?这份儿苦心,你们好好理解着点吧。

c*******e
发帖数: 1828
95
大一的孩子不学回归分析吧

【在 s****e 的大作中提到】
: 笑死俺了,这话说的好像你别的会的很多似的。
: 这是大一水平的题好不好,P大真是一辈不如一辈了。

h*******x
发帖数: 12808
96
猪猪姐是西安人吗?

,还

【在 b******a 的大作中提到】
: 哇,快来看城墙拐弯啊!
b********s
发帖数: 6928
97
高三的学的?

【在 c*******e 的大作中提到】
: 大一的孩子不学回归分析吧
h*******x
发帖数: 12808
98
高三学这么多啊!
微风好厉害!

【在 b********s 的大作中提到】
: 高三的学的?
b********s
发帖数: 6928
99
大哥你有没有逻辑啊!!!被你打败了啊!!!!!!

【在 h*******x 的大作中提到】
: 高三学这么多啊!
: 微风好厉害!

h*******x
发帖数: 12808
100
对了,微风,如果我像visulization的相关度德化,有什么图比较好呢?
画什么图呢?

【在 b********s 的大作中提到】
: 高三的学的?
相关主题
[合集] 怎么算两个变量的相关度啊?今天咖啡喝多了 啊
人生完整了!今天堕落时间到
发包子!(买买提最大方的包子贴)你们这些疯人
进入PKU版参与讨论
b********s
发帖数: 6928
101
不做model的,用scatter plot,如果run了model之后,可以画regression line/curve
找个software画吧

【在 h*******x 的大作中提到】
: 对了,微风,如果我像visulization的相关度德化,有什么图比较好呢?
: 画什么图呢?

h*******x
发帖数: 12808
102
scatter plot是什么?就是把点都放上去吗?

【在 b********s 的大作中提到】
: 不做model的,用scatter plot,如果run了model之后,可以画regression line/curve
: 找个software画吧

h*******x
发帖数: 12808
103
啊?怎么发咆哮体了啊。

【在 b********s 的大作中提到】
: 大哥你有没有逻辑啊!!!被你打败了啊!!!!!!
b********s
发帖数: 6928
104
对,就是你不run任何model,只用原始数字做的直观的图,帮你看到底是什么re
lationship的,我刚才的帖子改了,你看一眼吧

【在 h*******x 的大作中提到】
: scatter plot是什么?就是把点都放上去吗?
b********s
发帖数: 6928
105
因为大哥你的逻辑太强了

【在 h*******x 的大作中提到】
: 啊?怎么发咆哮体了啊。
h*******x
发帖数: 12808
106
原来是叫scatter plot啊,谢谢微风。

【在 b********s 的大作中提到】
: 对,就是你不run任何model,只用原始数字做的直观的图,帮你看到底是什么re
: lationship的,我刚才的帖子改了,你看一眼吧

h*******x
发帖数: 12808
107
最近比较迷糊,哎,不知道怎么了。

【在 b********s 的大作中提到】
: 因为大哥你的逻辑太强了
b********s
发帖数: 6928
108
你就这么个东西折腾一个周末了,你找个software就20分钟就都做好了,你能不
迷糊么,嘻嘻

【在 h*******x 的大作中提到】
: 最近比较迷糊,哎,不知道怎么了。
h*******x
发帖数: 12808
109
不是,我的写一次自动化的脚本,不能光靠软件啊。
每次都会有数十个文件,做得东西都差不多
我不能没底都打开软件算算:(

【在 b********s 的大作中提到】
: 你就这么个东西折腾一个周末了,你找个software就20分钟就都做好了,你能不
: 迷糊么,嘻嘻

s****e
发帖数: 3310
110
城墙拐弯奇怪吗,不拐弯才奇怪呢。
嗯,俺就是直的城墙————长城!

【在 b******a 的大作中提到】
: 哇,快来看城墙拐弯啊!
相关主题
你们这些疯人收到周校长的信
pd奔了么?做个心理游戏吧
微风mm请进有没有校友愿意给我当导游啊 :)
进入PKU版参与讨论
s****e
发帖数: 3310
111
嘿嘿,俺喜欢夸张的手法,风笛见谅哈。俺是逗潇妹玩呢

大一的孩子不学回归分析吧

【在 c*******e 的大作中提到】
: 大一的孩子不学回归分析吧
b********s
发帖数: 6928
112
我说算correlation和画图,不是你那个高级东西啦,那个我可不懂哦

【在 h*******x 的大作中提到】
: 不是,我的写一次自动化的脚本,不能光靠软件啊。
: 每次都会有数十个文件,做得东西都差不多
: 我不能没底都打开软件算算:(

b******a
发帖数: 12216
113
嗯,很希望我是西安人,那里的面食听说很好吃。

【在 h*******x 的大作中提到】
: 猪猪姐是西安人吗?
:
: ,还

b******a
发帖数: 12216
114
长城直的地方没你脸皮厚,就拐弯的地方跟你脸皮厚度有一拼。

【在 s****e 的大作中提到】
: 城墙拐弯奇怪吗,不拐弯才奇怪呢。
: 嗯,俺就是直的城墙————长城!

s****e
发帖数: 3310
115
光荣啊,这厚度俺可以去保护核电站了。以后俺就叫中华神盾了

【在 b******a 的大作中提到】
: 长城直的地方没你脸皮厚,就拐弯的地方跟你脸皮厚度有一拼。
b******a
发帖数: 12216
116
对啊,用我们小学老师说的,以后再打仗,把你这样的放前线,防弹!

【在 s****e 的大作中提到】
: 光荣啊,这厚度俺可以去保护核电站了。以后俺就叫中华神盾了
s****e
发帖数: 3310
117
你小学老师就知道俺?看来俺是威名远扬啊,不但远扬,还厉害到穿越,牛

【在 b******a 的大作中提到】
: 对啊,用我们小学老师说的,以后再打仗,把你这样的放前线,防弹!
B******u
发帖数: 23763
118
哦,一个问题哈,
长城有拐弯么?

【在 b******a 的大作中提到】
: 长城直的地方没你脸皮厚,就拐弯的地方跟你脸皮厚度有一拼。
B******u
发帖数: 23763
119
哦,一个问题哈,
长城有拐弯么?

【在 b******a 的大作中提到】
: 长城直的地方没你脸皮厚,就拐弯的地方跟你脸皮厚度有一拼。
b******a
发帖数: 12216
120
汗,难道长城是一笔直的线???

【在 B******u 的大作中提到】
: 哦,一个问题哈,
: 长城有拐弯么?

相关主题
50人在线微风mm啥时候奔啊?
人呢?可怜的微风mm阿
刘若英《光》翻唱 by breeziness梁静茹有一首歌,谁知道是哪一首
进入PKU版参与讨论
b******a
发帖数: 12216
121
顺便歪楼。你不觉得小学老师这么说学生很过分么?反正当时我看我老师这么说学生(
一男生),我觉得那男生挺可怜。

【在 s****e 的大作中提到】
: 你小学老师就知道俺?看来俺是威名远扬啊,不但远扬,还厉害到穿越,牛
b********s
发帖数: 6928
122
我觉得是挺那啥,但是也不像米国小学老师动不动就把学生说是有学习障碍症要
治病,觉得这个比国内老师说小孩脸皮厚更讨厌

【在 b******a 的大作中提到】
: 顺便歪楼。你不觉得小学老师这么说学生很过分么?反正当时我看我老师这么说学生(
: 一男生),我觉得那男生挺可怜。

s****e
发帖数: 3310
123
不可怜!俺小学老师都是直接打人。话说有一个变态老师,上课第一件事,就是所有学
生起立,但后他挨个打一遍,没有原因。算是例行警告。
当然女生除外。

【在 b******a 的大作中提到】
: 顺便歪楼。你不觉得小学老师这么说学生很过分么?反正当时我看我老师这么说学生(
: 一男生),我觉得那男生挺可怜。

b******a
发帖数: 12216
124
对,更讨厌那种动不动就说孩子有病的。那种人才有病。自己没本事教好人家孩子就别
干这行,简直误人子弟。我们单位一tech就是,晓得时候被老师说有病,数学就是学不
好。后来就一直对自己很没有信心。我做培训的时候就特费劲,一半的时间都要用来跟
她说她能自己做计算,给自己信心。后来事实证明,只要给她时间,多做几个例子,她
能做得很好。

【在 b********s 的大作中提到】
: 我觉得是挺那啥,但是也不像米国小学老师动不动就把学生说是有学习障碍症要
: 治病,觉得这个比国内老师说小孩脸皮厚更讨厌

b******a
发帖数: 12216
125
ft。我们小学本来也有老师打学生的(插花:我小学开学不到1周被老师拿着尺子追着
满屋打,那时候也不懂要站着被打,我就跑啊,愣是没被打到,哈哈),后来小孩他爹
愣是把老师打得进医院住了1-2个月,从此以后我们学校再也没有老师打学生了。

【在 s****e 的大作中提到】
: 不可怜!俺小学老师都是直接打人。话说有一个变态老师,上课第一件事,就是所有学
: 生起立,但后他挨个打一遍,没有原因。算是例行警告。
: 当然女生除外。

c*******e
发帖数: 1828
126
借微风的脚本用用
setwd("DIRECTORY")
data = read.csv("DATA.csv")
Y=data[,1]
X=data[,2]
correlation=cor(Y,X)
summary(correlation)
pdf('graph.pdf', width=5, height=5) #图的长宽看情况自己改吧
plot(X, Y, xlab='power', ylab='package loss rate')
dev.off()
这样就连算数带画图都搞定了
你搞个输入输出重定向就可以批处理了:)
写bash脚本啥的你肯定比我们都在行

【在 h*******x 的大作中提到】
: 不是,我的写一次自动化的脚本,不能光靠软件啊。
: 每次都会有数十个文件,做得东西都差不多
: 我不能没底都打开软件算算:(

s****e
发帖数: 3310
127
哈哈,典型的欺软怕硬啊。话说许多小学老师的确是素质太低了,一点为人师表都做不
到。如果能遇到一个好老师,其实真是幸运的,我在大学以前也就只遇到过几个,感觉
受益匪浅。

【在 b******a 的大作中提到】
: ft。我们小学本来也有老师打学生的(插花:我小学开学不到1周被老师拿着尺子追着
: 满屋打,那时候也不懂要站着被打,我就跑啊,愣是没被打到,哈哈),后来小孩他爹
: 愣是把老师打得进医院住了1-2个月,从此以后我们学校再也没有老师打学生了。

B******u
发帖数: 23763
128
应该是平滑的曲线吧。

【在 b******a 的大作中提到】
: 汗,难道长城是一笔直的线???
b******a
发帖数: 12216
129
嗯,我小学班主任就挺烦人,但是我的数学老师就很好(就是被打的那个,唯一的缺点
就是脾气太爆),所以我后来数学就不错。上高中也是,一开始的物理老师很差,我的
成绩就不好,后来的老师很好,成绩就特好。

【在 s****e 的大作中提到】
: 哈哈,典型的欺软怕硬啊。话说许多小学老师的确是素质太低了,一点为人师表都做不
: 到。如果能遇到一个好老师,其实真是幸运的,我在大学以前也就只遇到过几个,感觉
: 受益匪浅。

b******a
发帖数: 12216
130
那就肯定有转弯,只不过就是一直在转弯,哈哈。

【在 B******u 的大作中提到】
: 应该是平滑的曲线吧。
相关主题
haha, 又抢30000了人生完整了!
呼叫微风mm发包子!(买买提最大方的包子贴)
[合集] 怎么算两个变量的相关度啊?今天咖啡喝多了 啊
进入PKU版参与讨论
s****e
发帖数: 3310
131
nod,就是这样。俺也是喜欢哪个老师,那一科就学的好。唉,不过这样的老师还是太少
了,俺遇到的美女老师只有那么几个。

【在 b******a 的大作中提到】
: 嗯,我小学班主任就挺烦人,但是我的数学老师就很好(就是被打的那个,唯一的缺点
: 就是脾气太爆),所以我后来数学就不错。上高中也是,一开始的物理老师很差,我的
: 成绩就不好,后来的老师很好,成绩就特好。

B******u
发帖数: 23763
132
ft,
看成了,小学老师打学生插花了。

【在 b******a 的大作中提到】
: ft。我们小学本来也有老师打学生的(插花:我小学开学不到1周被老师拿着尺子追着
: 满屋打,那时候也不懂要站着被打,我就跑啊,愣是没被打到,哈哈),后来小孩他爹
: 愣是把老师打得进医院住了1-2个月,从此以后我们学校再也没有老师打学生了。

B******u
发帖数: 23763
133
咳,咳,
俺好象是,谁当班主任,俺那门就学的好些哈。

【在 b******a 的大作中提到】
: 嗯,我小学班主任就挺烦人,但是我的数学老师就很好(就是被打的那个,唯一的缺点
: 就是脾气太爆),所以我后来数学就不错。上高中也是,一开始的物理老师很差,我的
: 成绩就不好,后来的老师很好,成绩就特好。

B******u
发帖数: 23763
134
那样的转弯不需要加厚的吧?

【在 b******a 的大作中提到】
: 那就肯定有转弯,只不过就是一直在转弯,哈哈。
h*******x
发帖数: 12808
135
这些东西我都好办,我造就写好了。
主要我不知道怎么present出来:(

【在 b********s 的大作中提到】
: 我说算correlation和画图,不是你那个高级东西啦,那个我可不懂哦
h*******x
发帖数: 12808
136
根号2城墙啊,西安的说法。

【在 b******a 的大作中提到】
: 嗯,很希望我是西安人,那里的面食听说很好吃。
h*******x
发帖数: 12808
137
小猪师姐就是有耐心啊

【在 b******a 的大作中提到】
: 对,更讨厌那种动不动就说孩子有病的。那种人才有病。自己没本事教好人家孩子就别
: 干这行,简直误人子弟。我们单位一tech就是,晓得时候被老师说有病,数学就是学不
: 好。后来就一直对自己很没有信心。我做培训的时候就特费劲,一半的时间都要用来跟
: 她说她能自己做计算,给自己信心。后来事实证明,只要给她时间,多做几个例子,她
: 能做得很好。

h*******x
发帖数: 12808
138
师姐好霸气啊。

有学

【在 b******a 的大作中提到】
: ft。我们小学本来也有老师打学生的(插花:我小学开学不到1周被老师拿着尺子追着
: 满屋打,那时候也不懂要站着被打,我就跑啊,愣是没被打到,哈哈),后来小孩他爹
: 愣是把老师打得进医院住了1-2个月,从此以后我们学校再也没有老师打学生了。

h*******x
发帖数: 12808
139
谢谢啊,我保持一下。

【在 c*******e 的大作中提到】
: 借微风的脚本用用
: setwd("DIRECTORY")
: data = read.csv("DATA.csv")
: Y=data[,1]
: X=data[,2]
: correlation=cor(Y,X)
: summary(correlation)
: pdf('graph.pdf', width=5, height=5) #图的长宽看情况自己改吧
: plot(X, Y, xlab='power', ylab='package loss rate')
: dev.off()

b******a
发帖数: 12216
140
那就是从头厚到尾,嗯。

【在 B******u 的大作中提到】
: 那样的转弯不需要加厚的吧?
相关主题
今天咖啡喝多了 啊pd奔了么?
今天堕落时间到微风mm请进
你们这些疯人收到周校长的信
进入PKU版参与讨论
b******a
发帖数: 12216
141
我也不是有耐心啊,老板要求把tech教会,我没耐心也没用啊。

【在 h*******x 的大作中提到】
: 小猪师姐就是有耐心啊
1 (共1页)
进入PKU版参与讨论
相关主题
可怜的微风mm阿今天堕落时间到
梁静茹有一首歌,谁知道是哪一首你们这些疯人
haha, 又抢30000了pd奔了么?
呼叫微风mm微风mm请进
[合集] 怎么算两个变量的相关度啊?收到周校长的信
人生完整了!做个心理游戏吧
发包子!(买买提最大方的包子贴)有没有校友愿意给我当导游啊 :)
今天咖啡喝多了 啊50人在线
相关话题的讨论汇总
话题: regression话题: linear话题: 微风话题: excel