s********r 发帖数: 297 | 1 大家好,我想请教大家一道题,所以希望各位能帮忙指点,先谢谢大家了!
老板让我做一个A/B testing, 但是没有control group和test group。现在只有 pre-
test population group 和 post-test population group。因为只有一小部分人被
test, 所以打算用 post-test population group作为test group, 然后pre-test
population group作为control group
为了确保 comparing apples with apples, 老板让我trim pre-test population
group by different attributes/dimensions 比如 income level, age group,
activity engagement 都和 post-test population group 类似。
最终要确保trimmed pre-test group 在各个attribute 比如 income level, age
group, activity engagement 都和 post-test population group 类似, 并且 pass t
-test。换句话讲,用 t-test 测试 trim 过的pre-test group 和 post-test
population group 在各个attribute 上都没有 statistical significant difference
我看了下两个 population group 各个attribute的distribution都相差很大, 请问我
该怎么trim pre-test group 呢? 请问我是该用k-mean clustering还是decision
tree还是stratified sampling呢?谢谢大家了! | h*****m 发帖数: 955 | | s********r 发帖数: 297 | 3 非常感谢楼上的回复,请问能说得更具体些吗? 非常感谢您! | s**e 发帖数: 294 | 4 我好久以前给epi的数据做过,好像是要match case和control,用SAS写个macro,每一
个case在control data里面找一个或几个基本一样的人,比如性别种族吸烟史完全一样
,年龄那种contious上下允许个两三岁,这样最后ttest没问题。用SQL应该更容易。一
种思路供参考。 | h*****m 发帖数: 955 | 5 try 'matchit' in R
For SAS I think a macro will needed to make it better. SAS may also have
some simple procedures, but I think R does this well. | s********r 发帖数: 297 | |
|