b********i 发帖数: 1252 | 1 我的数据是这样的:
水中污染物的总量为dependent variable
水流量为independent variable
通常这两个变量的关系都是污染物量随水流量增加
因此作出来的图都是一条递增曲线
现在我有一组数据(几百个)
把这两个变量作图发现看上去是两条线
用另外几组类似的数据都发现有这个问题
所以我想把这两条线分开来分析
问题是我不知道如何分开
每一个observation都有很多相关的参数
比如采样时间、地点、水温度、水里藻类浓度等等等等
所以我不知道应该根据什么来分
我记得有专门统计方法解决类似问题的
请大家指点一下应该用什么方法
是不是叫什么cluster analysis?
多谢了
我会给您包子 |
b********i 发帖数: 1252 | 2 自己顶一下,
希望好心人能帮忙解答一下
会给包子
我的数据是这样的:
水中污染物的总量为dependent variable
水流量为independent variable
通常这两个变量的关系都是污染物量随水流量增加
因此作出来的图都是一条递增曲线
现在我有一组数据(几百个)
把这两个变量作图发现看上去是两条线
用另外几组类似的数据都发现有这个问题
所以我想把这两条线分开来分析
问题是我不知道如何分开
每一个observation都有很多相关的参数
比如采样时间、地点、水温度、水里藻类浓度等等等等
所以我不知道应该根据什么来分
我记得有专门统计方法解决类似问题的
请大家指点一下应该用什么方法
是不是叫什么cluster analysis?
多谢了
我会给您包子
【在 b********i 的大作中提到】 : 我的数据是这样的: : 水中污染物的总量为dependent variable : 水流量为independent variable : 通常这两个变量的关系都是污染物量随水流量增加 : 因此作出来的图都是一条递增曲线 : 现在我有一组数据(几百个) : 把这两个变量作图发现看上去是两条线 : 用另外几组类似的数据都发现有这个问题 : 所以我想把这两条线分开来分析 : 问题是我不知道如何分开
|
s*****9 发帖数: 108 | 3 把这两个变量作图发现看上去是两条线?你是说X轴和Y轴是这两个变量,然后每个点对
应a pair,看到的是两条线(近似的)? |
l*********s 发帖数: 5409 | 4 your scatter plots show "2 lines" patterns, but you don't know what causes
the separation,right?
request 2-cluster classification followed by discriminant analysis. |
b********i 发帖数: 1252 | 5 yes you are right that I donot know what causes the 2 lines pattern.
Thanks a lot for your help.
Will you please tell me which procedure I should use if I use SAS software?
Thanks!\
【在 l*********s 的大作中提到】 : your scatter plots show "2 lines" patterns, but you don't know what causes : the separation,right? : request 2-cluster classification followed by discriminant analysis.
|
s*r 发帖数: 2757 | 6 1) maybe it is just heteroscedasticity
2) i would try to screen all factors for interaction with X |
T*******I 发帖数: 5138 | 7 Could you please post the picture for your data? A correct analytical method
depends on how they are shown.
【在 b********i 的大作中提到】 : 我的数据是这样的: : 水中污染物的总量为dependent variable : 水流量为independent variable : 通常这两个变量的关系都是污染物量随水流量增加 : 因此作出来的图都是一条递增曲线 : 现在我有一组数据(几百个) : 把这两个变量作图发现看上去是两条线 : 用另外几组类似的数据都发现有这个问题 : 所以我想把这两条线分开来分析 : 问题是我不知道如何分开
|
b********i 发帖数: 1252 | 8 多谢各位热心帮助,这里是图。4个流域的水流flow和污染物load都是这种关系,所以
可能里面有点什么。谢谢!包子很快就发。
【在 b********i 的大作中提到】 : 我的数据是这样的: : 水中污染物的总量为dependent variable : 水流量为independent variable : 通常这两个变量的关系都是污染物量随水流量增加 : 因此作出来的图都是一条递增曲线 : 现在我有一组数据(几百个) : 把这两个变量作图发现看上去是两条线 : 用另外几组类似的数据都发现有这个问题 : 所以我想把这两条线分开来分析 : 问题是我不知道如何分开
|
l*********s 发帖数: 5409 | 9 it may be well explained by outliers. It does not look like you have
established solid linear relationship.
【在 b********i 的大作中提到】 : 多谢各位热心帮助,这里是图。4个流域的水流flow和污染物load都是这种关系,所以 : 可能里面有点什么。谢谢!包子很快就发。
|
T*******I 发帖数: 5138 | 10 不要什么时候遇到此类点都把它们归于outliers。这不是一个严谨的思想。有些总体就
是有那样的点存在,而非纯粹测量上的误差导致的奇异点。
我觉得应该结合其它可能的影响因子来分析,在此基础上先用cluster,再用回归模型
可能比较好。这样做对结果的解释会比较综合性。
【在 l*********s 的大作中提到】 : it may be well explained by outliers. It does not look like you have : established solid linear relationship.
|
l*********s 发帖数: 5409 | 11 Outlier is outlier, no matter whether it is due to measurement errors,
sample issues, or novel theoretical constructs.
Your definition for outlier is too narrow-minded.
【在 T*******I 的大作中提到】 : 不要什么时候遇到此类点都把它们归于outliers。这不是一个严谨的思想。有些总体就 : 是有那样的点存在,而非纯粹测量上的误差导致的奇异点。 : 我觉得应该结合其它可能的影响因子来分析,在此基础上先用cluster,再用回归模型 : 可能比较好。这样做对结果的解释会比较综合性。
|
c**d 发帖数: 104 | 12 It looks like that x should be transformed to log(x) if no zero |