b****u 发帖数: 1130 | 1 也许我的网络训练的不够好,输出的结果不合理,比如流量预测是负值。 |
w***g 发帖数: 5958 | 2 我觉得,ideally这种东西得对输出的分布建模。
一般regression,其实都假设的是正太分布。
为了限制输出在[0, 1]内,产生了logistic function和soft max。
你这个流量预测,最简单的就是在输出前加一个relu,作为网络
结构的一部分参与训练。这个和你得到结果后再手工把负数变成0
是不一样的。然后还有各种soft relu可以用。
上升到理论,我感觉应该是那种非对称的钟型分布。比如gamma
或者log normal分布之类的。你可以去搜下怎么样对gamma变量做
regression。这种东西肯定早有人研究无数遍了。直接把前人的
结果套到神经网络最后一层就行了。
【在 b****u 的大作中提到】 : 也许我的网络训练的不够好,输出的结果不合理,比如流量预测是负值。
|
b****u 发帖数: 1130 | 3 太对了,豁然开朗。
的确应该先对y值的分布建模。
【在 w***g 的大作中提到】 : 我觉得,ideally这种东西得对输出的分布建模。 : 一般regression,其实都假设的是正太分布。 : 为了限制输出在[0, 1]内,产生了logistic function和soft max。 : 你这个流量预测,最简单的就是在输出前加一个relu,作为网络 : 结构的一部分参与训练。这个和你得到结果后再手工把负数变成0 : 是不一样的。然后还有各种soft relu可以用。 : 上升到理论,我感觉应该是那种非对称的钟型分布。比如gamma : 或者log normal分布之类的。你可以去搜下怎么样对gamma变量做 : regression。这种东西肯定早有人研究无数遍了。直接把前人的 : 结果套到神经网络最后一层就行了。
|
c*******v 发帖数: 2599 | 4 Given:{ x,x_label}
训练 ann for {x,sqrt(x_label)}
也可以一试. inference的时候最后平方一下
【在 w***g 的大作中提到】 : 我觉得,ideally这种东西得对输出的分布建模。 : 一般regression,其实都假设的是正太分布。 : 为了限制输出在[0, 1]内,产生了logistic function和soft max。 : 你这个流量预测,最简单的就是在输出前加一个relu,作为网络 : 结构的一部分参与训练。这个和你得到结果后再手工把负数变成0 : 是不一样的。然后还有各种soft relu可以用。 : 上升到理论,我感觉应该是那种非对称的钟型分布。比如gamma : 或者log normal分布之类的。你可以去搜下怎么样对gamma变量做 : regression。这种东西肯定早有人研究无数遍了。直接把前人的 : 结果套到神经网络最后一层就行了。
|