c******g 发帖数: 63 | 1 如果model是固定的(比如一个linear model,就五个系数要fit),给50个数据(X,y)
,得到fit出的model A;再给50个数据,用这100个数据得到Model B。那么,应该选哪
个model呢?用什么方法来pick model?
我个人觉得,应该拿额外的test data看test error吧。但是如果一共就只有这100个数
据,没有额外data,怎么办?
多谢指教! |
d******e 发帖数: 551 | 2 100个数据分两组,一组70个train-test,另一组30个validation
【在 c******g 的大作中提到】 : 如果model是固定的(比如一个linear model,就五个系数要fit),给50个数据(X,y) : ,得到fit出的model A;再给50个数据,用这100个数据得到Model B。那么,应该选哪 : 个model呢?用什么方法来pick model? : 我个人觉得,应该拿额外的test data看test error吧。但是如果一共就只有这100个数 : 据,没有额外data,怎么办? : 多谢指教!
|
c******g 发帖数: 63 | 3 Thanks! 但这样怎么跟那个仅用50个data来做的model进行公平的比较呢? |
z******n 发帖数: 397 | 4 没什么公平而言,样本量大的为准,如果采样过程没有问题的话
【在 c******g 的大作中提到】 : Thanks! 但这样怎么跟那个仅用50个data来做的model进行公平的比较呢?
|