由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 问一个统计算average from ranges (转载)
相关主题
大家知道这个公司吗?RANG TECHNOLOGIES in NEW Jersey有人参加这星期在new york的strata hadoop conference 吗?
有人参加明天在SANTA CLARA的strata请教一个用R做cox regression的问题
本周去了 O'Reilly的 Strata Data ConferenceSan Jose Strata Conference Meet up (转载)
Random forests on imbalanced data请教预测算法
National Big Data Eventsmodel selection problem
基于DS的startup究竟都申请些什么专利?怎样能才能快速的找到KNN
Strata+Hadoop NYC 2014 开会归来,总结+job information有人在Big Data 用MATLAB ?
有人去Strata San Jose 2015 么?[挖个坑]数据分析都有哪些开源工具呀?
相关话题的讨论汇总
话题: average话题: cost话题: ranges话题: bounds话题: 做法
进入DataSciences版参与讨论
1 (共1页)
w*********y
发帖数: 7895
1
【 以下文字转载自 Statistics 讨论区 】
发信人: westjourney (胖得走不动), 信区: Statistics
标 题: 问一个统计算average from ranges
发信站: BBS 未名空间站 (Thu Mar 5 20:42:19 2015, 美东)
假设我有一些数据,
A= 1-10, B = 11-20, C = 21-30, D = 31-40
ID Cost
1 A
2 D
3 C
4 C
5 D
......
要求算average cost...
现在有2个做法,一种做法是把A, B, C, D 分别CODE 1, 2, 3, 4,然后加起来,算
average, 如果是 2.5, 我就说average cost 是11-30.
还有一个做法是,把所以lower bounds and higher bounds分别加起来,
再算average cost的range...
我google了一下,没有找到很多信息。。。所以想请教一下大家,这2个方法的利弊,
或者还有什么更好的方法吗?
w*********y
发帖数: 7895
2
【 以下文字转载自 Statistics 讨论区 】
发信人: westjourney (胖得走不动), 信区: Statistics
标 题: 问一个统计算average from ranges
发信站: BBS 未名空间站 (Thu Mar 5 20:42:19 2015, 美东)
假设我有一些数据,
A= 1-10, B = 11-20, C = 21-30, D = 31-40
ID Cost
1 A
2 D
3 C
4 C
5 D
......
要求算average cost...
现在有2个做法,一种做法是把A, B, C, D 分别CODE 1, 2, 3, 4,然后加起来,算
average, 如果是 2.5, 我就说average cost 是11-30.
还有一个做法是,把所以lower bounds and higher bounds分别加起来,
再算average cost的range...
我google了一下,没有找到很多信息。。。所以想请教一下大家,这2个方法的利弊,
或者还有什么更好的方法吗?
w********3
发帖数: 13
3
第一个方法: ABCD不能 认为是 ordinal 的吧
第二个方法: 觉得不对 感觉就像 把 confidence bound 加起来 一样
直觉是 用range 估计 sd=range/4 和 mean= middle point of range
然后 把 ABCD 当成 cluster 或者 strata
如果 每个 cluster的 sample size 不同 就用 probability proportion to size
否则 假设 1/4的 抽取概率 变成 simple random sample 然后做简单的 weighted
mean and weighted sd
还得注意 样本是 with replacement的 因此概率模型 比较简单
my two cents.
a*******y
发帖数: 105
4

这还不算ordinal啊? 对应的变量名都叫cost了

【在 w********3 的大作中提到】
: 第一个方法: ABCD不能 认为是 ordinal 的吧
: 第二个方法: 觉得不对 感觉就像 把 confidence bound 加起来 一样
: 直觉是 用range 估计 sd=range/4 和 mean= middle point of range
: 然后 把 ABCD 当成 cluster 或者 strata
: 如果 每个 cluster的 sample size 不同 就用 probability proportion to size
: 否则 假设 1/4的 抽取概率 变成 simple random sample 然后做简单的 weighted
: mean and weighted sd
: 还得注意 样本是 with replacement的 因此概率模型 比较简单
: my two cents.

w*********y
发帖数: 7895
5
谢谢回答。。。

【在 w********3 的大作中提到】
: 第一个方法: ABCD不能 认为是 ordinal 的吧
: 第二个方法: 觉得不对 感觉就像 把 confidence bound 加起来 一样
: 直觉是 用range 估计 sd=range/4 和 mean= middle point of range
: 然后 把 ABCD 当成 cluster 或者 strata
: 如果 每个 cluster的 sample size 不同 就用 probability proportion to size
: 否则 假设 1/4的 抽取概率 变成 simple random sample 然后做简单的 weighted
: mean and weighted sd
: 还得注意 样本是 with replacement的 因此概率模型 比较简单
: my two cents.

1 (共1页)
进入DataSciences版参与讨论
相关主题
[挖个坑]数据分析都有哪些开源工具呀?National Big Data Events
[Data Science Project Case] Bias Correction - third try基于DS的startup究竟都申请些什么专利?
only average statisticsStrata+Hadoop NYC 2014 开会归来,总结+job information
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?有人去Strata San Jose 2015 么?
大家知道这个公司吗?RANG TECHNOLOGIES in NEW Jersey有人参加这星期在new york的strata hadoop conference 吗?
有人参加明天在SANTA CLARA的strata请教一个用R做cox regression的问题
本周去了 O'Reilly的 Strata Data ConferenceSan Jose Strata Conference Meet up (转载)
Random forests on imbalanced data请教预测算法
相关话题的讨论汇总
话题: average话题: cost话题: ranges话题: bounds话题: 做法