由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - machine learning 课程项目的presentation: 大疑问-???
相关主题
问问面试如何出题kaggle上那批人太逆天了 (转载)
报面筋求实习合租 (转载)random forest/xgbclassifier的feature importance
为什么要知道DETAILS OF A MACHINE LEARNING ALGORITHM有没有做sentiment analysis的,求思路 (转载)
请问哪些算法是可以用python写的,然后输入PMML恭喜开版,发个刚看到的好玩的machine learning的图
kaggle上这个restaurant-revenue-prediction的题目有人考虑过么?恭喜新版成立。什么背景的人会成为data scientist
model selection problem[经验帖] 我是如何当上DS的
please explain the difference between Logistic Regression and Linear Kernel SVMs30+零经验大妈求转行DS建议
有谁知道skytree的?Project :advertersiment click prediction
相关话题的讨论汇总
话题: 疑问话题: learning话题: machine话题: 课程
进入DataSciences版参与讨论
1 (共1页)
f*******6
发帖数: 56
1
有一个组的整个建模过程如下:
1)组员4个,用同一个training dataset,建立1~2个classification model(logistic
regression,SVM,NN);
2)总共8个model,最后用vote的方法决定每个record的class. 超过半数以上是yes的就
判断是yes, 否则为no.
我的疑问是:当新数据进来的时候,这个vote的结果对预测这个数据的class没有任何
参考意义。
不能理解这样的做法,不知道工业界里建模时有这样运用的吗?
a*****s
发帖数: 838
2
新数据是指test dataset吗?如果是的话,那training set就不可能完全预测新数据的
class啊,只能是参考test dataset的参数对比做估计而已。
f*******6
发帖数: 56
3
是我自己想岔了。
是这8个模块已经建立好了,等新的数据到了后,就作为TESTDATA直接用这些模块算出
预测结果,然后用VOTE的方式选出占多数的那一个CLASS。
s*********i
发帖数: 218
4
觉得这个种就是广义的ensemble method,目的在于叠加几个相对独立的模型来减小
prediction的variance. Skytree和Azure这种软件很多带这个选项。
实际应用的话一个做好一个模型已经很麻烦了,谁没事认真做8个。。。
1 (共1页)
进入DataSciences版参与讨论
相关主题
Project :advertersiment click predictionkaggle上这个restaurant-revenue-prediction的题目有人考虑过么?
Role miningmodel selection problem
现在的大数据技术的价值和功用有些被夸大了please explain the difference between Logistic Regression and Linear Kernel SVMs
机器学习需要自己搞算法吗有谁知道skytree的?
问问面试如何出题kaggle上那批人太逆天了 (转载)
报面筋求实习合租 (转载)random forest/xgbclassifier的feature importance
为什么要知道DETAILS OF A MACHINE LEARNING ALGORITHM有没有做sentiment analysis的,求思路 (转载)
请问哪些算法是可以用python写的,然后输入PMML恭喜开版,发个刚看到的好玩的machine learning的图
相关话题的讨论汇总
话题: 疑问话题: learning话题: machine话题: 课程