k****z 发帖数: 1863 | 1 自己想的
比方我人为产生一个数据
有10000个sample, 100个变量X1,X2,,,X100
sample分成5个classes, 是根据其中10个变量的的方程值的分布分成5分
比方说一个简单的方程
Y=X1+X6*X20/X30-X38+10*X44^2+X55/X66-10X77+x88
当然我不会告诉你,现在的ML算法能搞清楚这个classification吗? |
k******s 发帖数: 506 | 2 我觉得用random forest regression可以筛出来 |
r***t 发帖数: 110 | 3 这个应该用lasso做variable selection和linear regression。可以算出公式系数来。
如果非要用machine learning做,比如已知其中80%的分类,预测剩余的20%,random
forest之类的方法也能做出正确的分类来。但是没办法告诉具体的variable和系数。 |
H**********f 发帖数: 2978 | 4 我觉得,如果1,多项式里没有error term,而且2,假定多项式degree不超过3,比如
你的那个方程,那应该能用lasso学出来
如果多项式再复杂一些就得用别的模型,还可以预测,但没法还原你的多项式,准确度
估计会差些,毕竟模型不对了 |
c******g 发帖数: 238 | 5 除法目前没戏,可以polynomial拟合。但是次数过高一定会有过拟合问题。机器学习从
来不是去得到正确的公式,而是得到相对相似,合理的结果。 |
H**********f 发帖数: 2978 | 6 可以每个变量都取倒数当作新变量,这样让除变乘
: 除法目前没戏,可以polynomial拟合。但是次数过高一定会有过拟合问题。机器
学习从
: 来不是去得到正确的公式,而是得到相对相似,合理的结果。
【在 c******g 的大作中提到】 : 除法目前没戏,可以polynomial拟合。但是次数过高一定会有过拟合问题。机器学习从 : 来不是去得到正确的公式,而是得到相对相似,合理的结果。
|
e*********6 发帖数: 3453 | 7 线性不行,tree和mlp可能行,看训练样本量了。不过感觉够呛 |