由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 关于SVM 数据scale的问题
相关主题
问问各位大佬:SVM和RF在几百个sample几万个variable的情况下关于在R中run SVM的问题
SAS数据输入疑问support vector machine
该用什么model?谁给说说到底如何在一堆变量中找到the biggest contributing factor?
如何用SAS 生成一个组合变量?请教: 3组数据之间的correlation??
有这么一种单变量分布吗全部都是Character Variables怎么做分类啊
问response只能取正值时的least square regression.谢谢svm的变量选择和shrinking选项什么关系?
向大家请教一个生物统计 RESEARCH的问题[合集] 多变量回归
Interview时应该怎样描述自己做过的Project?求教一个sas读data的问题
相关话题的讨论汇总
话题: scale话题: svm话题: 年龄话题: 数据话题: min
进入Statistics版参与讨论
1 (共1页)
c*******i
发帖数: 160
1
我看别人的paper或是别的说明,都建议scale输入svm的数据到0-1。 但是我不清楚怎
样scale,以及这些方法对svm结果的影响。
假设: 一个人的年龄是输入数据,我找到数据中最大的年龄max和最小年龄min,然后,
new age= (old age-min)/(max-min),最后到[0,1]之间了。
但是,这样scale似乎是有问题的,因为60 虽然是20 的三倍,但是对结果的影响显然
不是3倍的关系。 假如我用另一个方法:我按照一定的规则,把年龄分段,假如5段的
话,这样就用5个取值 0或1的variable表示了这个连续变量年龄,这样会不会更好些?
类似的问题很多,比如我知道一个排名,从第一名到100名,显然第一名的影响不是第
100名的100倍,也许是10000倍。
有没有专门介绍常用scale方法的资料。
非常感谢。
N******n
发帖数: 3003
2

后,
scale的目的是让所有的variable对最后的Model的影响在一个标尺内。

【在 c*******i 的大作中提到】
: 我看别人的paper或是别的说明,都建议scale输入svm的数据到0-1。 但是我不清楚怎
: 样scale,以及这些方法对svm结果的影响。
: 假设: 一个人的年龄是输入数据,我找到数据中最大的年龄max和最小年龄min,然后,
: new age= (old age-min)/(max-min),最后到[0,1]之间了。
: 但是,这样scale似乎是有问题的,因为60 虽然是20 的三倍,但是对结果的影响显然
: 不是3倍的关系。 假如我用另一个方法:我按照一定的规则,把年龄分段,假如5段的
: 话,这样就用5个取值 0或1的variable表示了这个连续变量年龄,这样会不会更好些?
: 类似的问题很多,比如我知道一个排名,从第一名到100名,显然第一名的影响不是第
: 100名的100倍,也许是10000倍。
: 有没有专门介绍常用scale方法的资料。

1 (共1页)
进入Statistics版参与讨论
相关主题
求教一个sas读data的问题有这么一种单变量分布吗
几个简单的用R的问题。问response只能取正值时的least square regression.谢谢
SAS data merge求助向大家请教一个生物统计 RESEARCH的问题
问一下这个双变量变换的问题 谢谢Interview时应该怎样描述自己做过的Project?
问问各位大佬:SVM和RF在几百个sample几万个variable的情况下关于在R中run SVM的问题
SAS数据输入疑问support vector machine
该用什么model?谁给说说到底如何在一堆变量中找到the biggest contributing factor?
如何用SAS 生成一个组合变量?请教: 3组数据之间的correlation??
相关话题的讨论汇总
话题: scale话题: svm话题: 年龄话题: 数据话题: min