r*m 发帖数: 16380 | 1 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。
假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角
的线上。实际上会是紧密围绕这根线的分布。
假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。
我的问题是:
1.怎么量化各组数据之间有多接近(远离)
2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画
两道平行线,区分这些“类似”的和“不同”的数据点?
谢谢! |
r*m 发帖数: 16380 | 2 示意图
【在 r*m 的大作中提到】 : 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。 : 假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角 : 的线上。实际上会是紧密围绕这根线的分布。 : 假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。 : 我的问题是: : 1.怎么量化各组数据之间有多接近(远离) : 2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画 : 两道平行线,区分这些“类似”的和“不同”的数据点? : 谢谢!
|
c*******o 发帖数: 1722 | 3 cannot simple done.
you need clean up your data first. if those two group's of data coming
from different distributions, it will be a little more involved.
【在 r*m 的大作中提到】 : 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。 : 假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角 : 的线上。实际上会是紧密围绕这根线的分布。 : 假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。 : 我的问题是: : 1.怎么量化各组数据之间有多接近(远离) : 2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画 : 两道平行线,区分这些“类似”的和“不同”的数据点? : 谢谢!
|
j********e 发帖数: 1192 | 4 V5,linear regression
【在 r*m 的大作中提到】 : 示意图
|
a*****e 发帖数: 1717 | 5 给你google了一个,方法太多种了。
http://amath.colorado.edu/courses/7400/2010Spr/lecture4.pdf
【在 r*m 的大作中提到】 : 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。 : 假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角 : 的线上。实际上会是紧密围绕这根线的分布。 : 假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。 : 我的问题是: : 1.怎么量化各组数据之间有多接近(远离) : 2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画 : 两道平行线,区分这些“类似”的和“不同”的数据点? : 谢谢!
|
u****d 发帖数: 23938 | 6 1. Euclidean distance, statistical distance, Minkowski distance?
2. Classification, or Clustering?
【在 r*m 的大作中提到】 : 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。 : 假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角 : 的线上。实际上会是紧密围绕这根线的分布。 : 假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。 : 我的问题是: : 1.怎么量化各组数据之间有多接近(远离) : 2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画 : 两道平行线,区分这些“类似”的和“不同”的数据点? : 谢谢!
|
u****d 发帖数: 23938 | 7 R 就可以做;Matlab 也应该有类似函数。
【在 u****d 的大作中提到】 : 1. Euclidean distance, statistical distance, Minkowski distance? : 2. Classification, or Clustering?
|
u********e 发帖数: 4950 | 8 先分组做covariance 分析可以直接帮你去掉一些不好的, 对好的, 做regression 然后
排除出在置信区间之外的点就好了, 不需要画线的,呵呵
【在 r*m 的大作中提到】 : 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。 : 假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角 : 的线上。实际上会是紧密围绕这根线的分布。 : 假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。 : 我的问题是: : 1.怎么量化各组数据之间有多接近(远离) : 2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画 : 两道平行线,区分这些“类似”的和“不同”的数据点? : 谢谢!
|
i****e 发帖数: 451 | 9 如果你确定45°对应你的理想情况的话,回归不一定最好,因为回归是不对称的。
你就取(X-Y)的绝对值,或者平方,然后比较每两组的这个分布的不同,简单又好
离的近的和远的也容易分的很,用个QUANTILE就可以了
如果理想情况不一定是45°就回归好了
【在 r*m 的大作中提到】 : 我有多组数据要比较, 每组数据含几百个数据点。我用excel里面的xy scatter做图。 : 假如A组和B组是同一个样本的重复试验,那么“理想”的图形就是所有点都落在45度角 : 的线上。实际上会是紧密围绕这根线的分布。 : 假如A组和C组是不同的样本,那么这些点就会有很多远离这根45度角的线。 : 我的问题是: : 1.怎么量化各组数据之间有多接近(远离) : 2.假如A组数据和B组数据大多数都分布在紧靠45度线附近,有少数远离,我怎么可以画 : 两道平行线,区分这些“类似”的和“不同”的数据点? : 谢谢!
|
C*G 发帖数: 7495 | 10 用originlab都可解决。
我们文科生才用excel。
楼上的大都是统计和工程数值的经验。
hiahia |