r********n 发帖数: 6979 | 1 我知道可以用decision tree
这个好像对变量没有硬性的要求
不过如果在别的model里面
有没有什么方法可以让两种变量并存
比方在linear regression model里面怎么办?
而且categorical变量里面
有些时候变量只是代表不同而已
之间没有“距离”的概念
比方说, 一个变量是颜色, 红色,绿色,黄色
好像不能简单的变成0,1,2
这种情况应该怎么办? |
h***i 发帖数: 3844 | 2 you need to find a regression book, I think, this is a basic thing
【在 r********n 的大作中提到】 : 我知道可以用decision tree : 这个好像对变量没有硬性的要求 : 不过如果在别的model里面 : 有没有什么方法可以让两种变量并存 : 比方在linear regression model里面怎么办? : 而且categorical变量里面 : 有些时候变量只是代表不同而已 : 之间没有“距离”的概念 : 比方说, 一个变量是颜色, 红色,绿色,黄色 : 好像不能简单的变成0,1,2
|
l******r 发帖数: 682 | 3 第一个问题如果那个continuous是pre-measure之类的,可以把它设置成covariate变量
,ancova分析,但是这个貌似对continuous的变量有要求(好像是independent with
the reponse变量,不太记得了)。
第二个问题,可以建立两个dummy variables, red: 0 0, green: 1 0, yellow: 0 1
【在 r********n 的大作中提到】 : 我知道可以用decision tree : 这个好像对变量没有硬性的要求 : 不过如果在别的model里面 : 有没有什么方法可以让两种变量并存 : 比方在linear regression model里面怎么办? : 而且categorical变量里面 : 有些时候变量只是代表不同而已 : 之间没有“距离”的概念 : 比方说, 一个变量是颜色, 红色,绿色,黄色 : 好像不能简单的变成0,1,2
|
r********n 发帖数: 6979 | 4 那给介绍一本书里面有如何解决这个问题的吧
【在 h***i 的大作中提到】 : you need to find a regression book, I think, this is a basic thing
|
r********n 发帖数: 6979 | 5 用ANCOVA可能是可以
不过如果我有好几个categorical variable
每个有很多的level
有的level可能有数据不足的问题。。。
第二个问题只是举个例子
同样的
如果我有大量的categroical variables
每个有很多level
每个categorical variables都变成了K-1个dummy variables
有没有overfitting的问题?
对于ordinal categorical variables又应该怎么处理呢?变成0,1,2,3,4.。。?
1
【在 l******r 的大作中提到】 : 第一个问题如果那个continuous是pre-measure之类的,可以把它设置成covariate变量 : ,ancova分析,但是这个貌似对continuous的变量有要求(好像是independent with : the reponse变量,不太记得了)。 : 第二个问题,可以建立两个dummy variables, red: 0 0, green: 1 0, yellow: 0 1
|