由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请问这个问题应该用什么方法解决
相关主题
问个outlier 和 sample size 的问题哈Anyone use Proc Shewhart before?
outlier detections请教个简单的统计问题~~
问个SAS 基本问题,请大家帮忙。怎么样才能提高R SQUARE的值--using SPSS?
about outlier identification请问你们在上交结果之前都做哪些检查?
建模过程中对于outlier的处理问题请教outlier的influence check标准
做linear reg怎么去掉outlier?求助,今天某老板问这么个屁问题
求教, clinical trial中如何处理missing value 和outlier问个统计问题 (转载)
Question about DFFITSbond price data clearn (转载)
相关话题的讨论汇总
话题: 两条线话题: outlier话题: your话题: 变量话题: 水流量
进入Statistics版参与讨论
1 (共1页)
b********i
发帖数: 1252
1
我的数据是这样的:
水中污染物的总量为dependent variable
水流量为independent variable
通常这两个变量的关系都是污染物量随水流量增加
因此作出来的图都是一条递增曲线
现在我有一组数据(几百个)
把这两个变量作图发现看上去是两条线
用另外几组类似的数据都发现有这个问题
所以我想把这两条线分开来分析
问题是我不知道如何分开
每一个observation都有很多相关的参数
比如采样时间、地点、水温度、水里藻类浓度等等等等
所以我不知道应该根据什么来分
我记得有专门统计方法解决类似问题的
请大家指点一下应该用什么方法
是不是叫什么cluster analysis?
多谢了
我会给您包子
b********i
发帖数: 1252
2
自己顶一下,
希望好心人能帮忙解答一下
会给包子

我的数据是这样的:
水中污染物的总量为dependent variable
水流量为independent variable
通常这两个变量的关系都是污染物量随水流量增加
因此作出来的图都是一条递增曲线
现在我有一组数据(几百个)
把这两个变量作图发现看上去是两条线
用另外几组类似的数据都发现有这个问题
所以我想把这两条线分开来分析
问题是我不知道如何分开
每一个observation都有很多相关的参数
比如采样时间、地点、水温度、水里藻类浓度等等等等
所以我不知道应该根据什么来分
我记得有专门统计方法解决类似问题的
请大家指点一下应该用什么方法
是不是叫什么cluster analysis?
多谢了
我会给您包子

【在 b********i 的大作中提到】
: 我的数据是这样的:
: 水中污染物的总量为dependent variable
: 水流量为independent variable
: 通常这两个变量的关系都是污染物量随水流量增加
: 因此作出来的图都是一条递增曲线
: 现在我有一组数据(几百个)
: 把这两个变量作图发现看上去是两条线
: 用另外几组类似的数据都发现有这个问题
: 所以我想把这两条线分开来分析
: 问题是我不知道如何分开

s*****9
发帖数: 108
3
把这两个变量作图发现看上去是两条线?你是说X轴和Y轴是这两个变量,然后每个点对
应a pair,看到的是两条线(近似的)?
l*********s
发帖数: 5409
4
your scatter plots show "2 lines" patterns, but you don't know what causes
the separation,right?
request 2-cluster classification followed by discriminant analysis.
b********i
发帖数: 1252
5
yes you are right that I donot know what causes the 2 lines pattern.
Thanks a lot for your help.
Will you please tell me which procedure I should use if I use SAS software?
Thanks!\

【在 l*********s 的大作中提到】
: your scatter plots show "2 lines" patterns, but you don't know what causes
: the separation,right?
: request 2-cluster classification followed by discriminant analysis.

s*r
发帖数: 2757
6
1) maybe it is just heteroscedasticity
2) i would try to screen all factors for interaction with X
T*******I
发帖数: 5138
7
Could you please post the picture for your data? A correct analytical method
depends on how they are shown.

【在 b********i 的大作中提到】
: 我的数据是这样的:
: 水中污染物的总量为dependent variable
: 水流量为independent variable
: 通常这两个变量的关系都是污染物量随水流量增加
: 因此作出来的图都是一条递增曲线
: 现在我有一组数据(几百个)
: 把这两个变量作图发现看上去是两条线
: 用另外几组类似的数据都发现有这个问题
: 所以我想把这两条线分开来分析
: 问题是我不知道如何分开

b********i
发帖数: 1252
8
多谢各位热心帮助,这里是图。4个流域的水流flow和污染物load都是这种关系,所以
可能里面有点什么。谢谢!包子很快就发。

【在 b********i 的大作中提到】
: 我的数据是这样的:
: 水中污染物的总量为dependent variable
: 水流量为independent variable
: 通常这两个变量的关系都是污染物量随水流量增加
: 因此作出来的图都是一条递增曲线
: 现在我有一组数据(几百个)
: 把这两个变量作图发现看上去是两条线
: 用另外几组类似的数据都发现有这个问题
: 所以我想把这两条线分开来分析
: 问题是我不知道如何分开

l*********s
发帖数: 5409
9
it may be well explained by outliers. It does not look like you have
established solid linear relationship.

【在 b********i 的大作中提到】
: 多谢各位热心帮助,这里是图。4个流域的水流flow和污染物load都是这种关系,所以
: 可能里面有点什么。谢谢!包子很快就发。

T*******I
发帖数: 5138
10
不要什么时候遇到此类点都把它们归于outliers。这不是一个严谨的思想。有些总体就
是有那样的点存在,而非纯粹测量上的误差导致的奇异点。
我觉得应该结合其它可能的影响因子来分析,在此基础上先用cluster,再用回归模型
可能比较好。这样做对结果的解释会比较综合性。

【在 l*********s 的大作中提到】
: it may be well explained by outliers. It does not look like you have
: established solid linear relationship.

l*********s
发帖数: 5409
11
Outlier is outlier, no matter whether it is due to measurement errors,
sample issues, or novel theoretical constructs.
Your definition for outlier is too narrow-minded.

【在 T*******I 的大作中提到】
: 不要什么时候遇到此类点都把它们归于outliers。这不是一个严谨的思想。有些总体就
: 是有那样的点存在,而非纯粹测量上的误差导致的奇异点。
: 我觉得应该结合其它可能的影响因子来分析,在此基础上先用cluster,再用回归模型
: 可能比较好。这样做对结果的解释会比较综合性。

c**d
发帖数: 104
12
It looks like that x should be transformed to log(x) if no zero
1 (共1页)
进入Statistics版参与讨论
相关主题
bond price data clearn (转载)建模过程中对于outlier的处理问题
问一个和统计相关的算法面试题 (转载)做linear reg怎么去掉outlier?
烂人诚心请教选校问题求教, clinical trial中如何处理missing value 和outlier
贡献SAS Programmer 面试问题并求答案Question about DFFITS
问个outlier 和 sample size 的问题哈Anyone use Proc Shewhart before?
outlier detections请教个简单的统计问题~~
问个SAS 基本问题,请大家帮忙。怎么样才能提高R SQUARE的值--using SPSS?
about outlier identification请问你们在上交结果之前都做哪些检查?
相关话题的讨论汇总
话题: 两条线话题: outlier话题: your话题: 变量话题: 水流量