E**********e 发帖数: 1736 | 1 【 以下文字转载自 DataSciences 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: DataSciences
标 题: 有没有大牛来classifiy一下 PCA用法吗?
发信站: BBS 未名空间站 (Wed May 20 11:52:29 2015, 美东)
紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
一下好像不能用来select significant variables。 谢谢。
欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。 |
|