由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 【求问】cross validation 与 predictor selection
相关主题
请教如何用R做Cox model的k-fold cross-validation请教如何分析一个case control study。
KS 的问题a question about ordinal predictor
求问~做大数据时怎样知道哪些predictor应该构造interaction term??问个基本的建MODEL问题
求教一个模型/预测问题How to deal with this predictor with 50% missing values
cross validation选择 lasso的 参数model和variables都sig.但每个category都不sig
any regression model with high prediction accuracy?做machine learning还有这么悲催的吗
anybody use minitab?通常Predictor越多AIC是不是应该越低?
请问:想fit gamma 并同时用lasso的方法做variable selectionpredictor什么意思
相关话题的讨论汇总
话题: predictor话题: validation话题: cross话题: selection话题: 求问
进入Statistics版参与讨论
1 (共1页)
f********3
发帖数: 20
1
大家好!我最近在用一个类似naive bayes的模型做文本分类,文章中的词是我的
predictor。
如果我先把在很多文章中都出现的词去除(这里利用了整个数据集),再做cross
validation,得到的error会不会是downwards biased的?
补充:我知道依据整个数据集的label选predictor再做cv会使错误偏小。但好像又听到
过别人说利用unsupervised的信息选predictor再cv不会bias,还请大家不吝赐教!
1 (共1页)
进入Statistics版参与讨论
相关主题
predictor什么意思cross validation选择 lasso的 参数
请教ㄧ个modeling问题any regression model with high prediction accuracy?
包子求解释,为什么anova解释variance这么少anybody use minitab?
请教一个面试问题。请问:想fit gamma 并同时用lasso的方法做variable selection
请教如何用R做Cox model的k-fold cross-validation请教如何分析一个case control study。
KS 的问题a question about ordinal predictor
求问~做大数据时怎样知道哪些predictor应该构造interaction term??问个基本的建MODEL问题
求教一个模型/预测问题How to deal with this predictor with 50% missing values
相关话题的讨论汇总
话题: predictor话题: validation话题: cross话题: selection话题: 求问