由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请教关于用R做randomForest的问题
相关主题
RandomForest: How to score validation set?五月毕业的统计master求内推&建议
Can somebody explain what the advantage of using "randomForest"?请教遗传算法的问题
proc logistic: how to build 2 X 2 classification table多谢版主解封,并请教“什么是统计学?”
classification 问题 求教!!请问有没有人有用R来编写 hidden markov model?
请问几个回归的sas code结构方程模型被誉为应用统计的第三次革命???
急问有关SVM,randomforest的问题(gene expression data)求教一道SAS题
machine learning救助 模型在1数据集上表现好 其他烂应用乘数法估计暗娼规模的方法学研究
Random forests on imbalanced data (转载)有必要学编程吗?
相关话题的讨论汇总
话题: ggmrf话题: andy话题: 关于话题: gad
进入Statistics版参与讨论
1 (共1页)
T*******I
发帖数: 5138
1
我最近学着用R做randomForest,结果没有成功。我看了Andy Liaw编写的package
document, 花了很多时间也没搞清楚整个分析的过程是怎样的,因为他/她把相关的
topics按照字母顺序编写。我也不熟悉Random Forest的方法学及其逻辑思想,我只想
用R提供的randomForest对我的数据进行一次处理并得到一个结果。我希望一个操作说
明书应该按照操作过程来写。Anyway, 言归正传。我试图用Andy提供的帮助写分析语句
,显然我没有完全搞懂。下面是我的R语句和部分结果以及错误信息:
> library(randomForest)
randomForest 4.5-34
Type rfNews() to see new features/changes/bug fixes.
> library(foreign)
> ggmrf <- read.xport("ggmrf.xport")
> ggmrf
以下是我的data frame的存储格式:
GAD X0001 X0002 ... X1503
1
2
3
...
50
p****m
发帖数: 19
2
你的ggm.na是什末,我想你不应该放这个东西,因为它对应的是xtest.
T*******I
发帖数: 5138
3
多谢指教。You are right.
我修改后的code如下:
数据读入R后,
(去掉) > ggm.na <- NA
(直接用)> ggmrf.roughfix <- na.roughfix(ggmrf)
处理missing values, 然后就开始拟合一个random forest:
> ggmrf.narf <- randomForest(GAD ~ ., data=ggmrf.roughfix, prox=TRUE,
importance=TRUE)
> print(ggmrf.narf)
结果出来了。

【在 p****m 的大作中提到】
: 你的ggm.na是什末,我想你不应该放这个东西,因为它对应的是xtest.
z**k
发帖数: 378
4
my boss and matthew wiener are really close friend, he always forward my
question to matthew, haha

【在 T*******I 的大作中提到】
: 多谢指教。You are right.
: 我修改后的code如下:
: 数据读入R后,
: (去掉) > ggm.na <- NA
: (直接用)> ggmrf.roughfix <- na.roughfix(ggmrf)
: 处理missing values, 然后就开始拟合一个random forest:
: > ggmrf.narf <- randomForest(GAD ~ ., data=ggmrf.roughfix, prox=TRUE,
: importance=TRUE)
: > print(ggmrf.narf)
: 结果出来了。

1 (共1页)
进入Statistics版参与讨论
相关主题
有必要学编程吗?请问几个回归的sas code
好奇问陈老师一个问题急问有关SVM,randomforest的问题(gene expression data)
求一段SAS codemachine learning救助 模型在1数据集上表现好 其他烂
余波难平Random forests on imbalanced data (转载)
RandomForest: How to score validation set?五月毕业的统计master求内推&建议
Can somebody explain what the advantage of using "randomForest"?请教遗传算法的问题
proc logistic: how to build 2 X 2 classification table多谢版主解封,并请教“什么是统计学?”
classification 问题 求教!!请问有没有人有用R来编写 hidden markov model?
相关话题的讨论汇总
话题: ggmrf话题: andy话题: 关于话题: gad