T*******I 发帖数: 5138 | 1 我最近学着用R做randomForest,结果没有成功。我看了Andy Liaw编写的package
document, 花了很多时间也没搞清楚整个分析的过程是怎样的,因为他/她把相关的
topics按照字母顺序编写。我也不熟悉Random Forest的方法学及其逻辑思想,我只想
用R提供的randomForest对我的数据进行一次处理并得到一个结果。我希望一个操作说
明书应该按照操作过程来写。Anyway, 言归正传。我试图用Andy提供的帮助写分析语句
,显然我没有完全搞懂。下面是我的R语句和部分结果以及错误信息:
> library(randomForest)
randomForest 4.5-34
Type rfNews() to see new features/changes/bug fixes.
> library(foreign)
> ggmrf <- read.xport("ggmrf.xport")
> ggmrf
以下是我的data frame的存储格式:
GAD X0001 X0002 ... X1503
1
2
3
...
50
其 | p****m 发帖数: 19 | 2 你的ggm.na是什末,我想你不应该放这个东西,因为它对应的是xtest. | T*******I 发帖数: 5138 | 3 多谢指教。You are right.
我修改后的code如下:
数据读入R后,
(去掉) > ggm.na <- NA
(直接用)> ggmrf.roughfix <- na.roughfix(ggmrf)
处理missing values, 然后就开始拟合一个random forest:
> ggmrf.narf <- randomForest(GAD ~ ., data=ggmrf.roughfix, prox=TRUE,
importance=TRUE)
> print(ggmrf.narf)
结果出来了。
【在 p****m 的大作中提到】 : 你的ggm.na是什末,我想你不应该放这个东西,因为它对应的是xtest.
| z**k 发帖数: 378 | 4 my boss and matthew wiener are really close friend, he always forward my
question to matthew, haha
【在 T*******I 的大作中提到】 : 多谢指教。You are right. : 我修改后的code如下: : 数据读入R后, : (去掉) > ggm.na <- NA : (直接用)> ggmrf.roughfix <- na.roughfix(ggmrf) : 处理missing values, 然后就开始拟合一个random forest: : > ggmrf.narf <- randomForest(GAD ~ ., data=ggmrf.roughfix, prox=TRUE, : importance=TRUE) : > print(ggmrf.narf) : 结果出来了。
|
|