n***p 发帖数: 508 | 1 我有一个大的dataset, 1000个categorical变量,很多变量里有的value占了很大的
portion. 比如说,变量之一教育程度有3个levels, A,B and C, 其中A占了98%, B和C
加一起才占2%.我想做的是,把这样变量(其中一个level超过95%)挑出来,把它们的
名字Output到一个file里。当然是用SAS base 和Macro来作了。请打家给我一些具体的
思路,越具体越好。谢谢 | D******n 发帖数: 2836 | 2 proc freq
和C
【在 n***p 的大作中提到】 : 我有一个大的dataset, 1000个categorical变量,很多变量里有的value占了很大的 : portion. 比如说,变量之一教育程度有3个levels, A,B and C, 其中A占了98%, B和C : 加一起才占2%.我想做的是,把这样变量(其中一个level超过95%)挑出来,把它们的 : 名字Output到一个file里。当然是用SAS base 和Macro来作了。请打家给我一些具体的 : 思路,越具体越好。谢谢
| a********a 发帖数: 3176 | 3 You can also use MODE in proc univariate to get the most prevaling value.
和C
【在 n***p 的大作中提到】 : 我有一个大的dataset, 1000个categorical变量,很多变量里有的value占了很大的 : portion. 比如说,变量之一教育程度有3个levels, A,B and C, 其中A占了98%, B和C : 加一起才占2%.我想做的是,把这样变量(其中一个level超过95%)挑出来,把它们的 : 名字Output到一个file里。当然是用SAS base 和Macro来作了。请打家给我一些具体的 : 思路,越具体越好。谢谢
|
|