t*******t 发帖数: 369 | 1 这两天在clean我的survey data,有两个关于missing value的小问题,匆忙找了一下
看到有人引用过两本年代较久远的教材来解决,但是不能肯定,特此请教。
1)有人引用一篇说"...if a variable contains more than 15% missing data, the
variable should be eliminated from the variable pools."
这个比较make sense,我的数据也适用。
2)另外一篇说"... if the number of missing cases is more than 5%, it is
common to eliminate the cases from the analysis."大家觉得这个5%的门槛是否合
适?
另外,我的问卷中有八个item是用来计算一个HHI index,这八个数值(in percentages
)相加必需为1。但是有一些人skip了这个part,或者没有全部回答,这样我就没法计算
那个index了,这个index是我一个model中的dependen |
|