由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 做一个CART现在还是用 C4.5 吗? (转载)
相关主题
深度学习真正有实用价值的应用FP的大神,帮忙看看8行代码是如何打印出x_n的?
minitab收购salford systems 你们怎么看?一个算法题
xgboost 里面的tree到底是一整个depth=N的树,还是一个binaryHello! HTML5 & CSS3
问一个用R抓网上数据,抓下来的和网页不一致Indiana大学的牛人
有谁懂这个: example(data.table) ; dt.tbl> DT[X, on=.(y<=foo)](zz)王垠:我和权威的故事
大过节的,不要吵啦,推荐本函数编程的入门书吧?谷歌技术大汇总
有没有做sentiment analysis的,求思路王垠继续喷各路大神:我为什么在乎这一个A+ (转载)
xgboost 训练大数据问题CNN和template matching到底有啥区别
相关话题的讨论汇总
话题: cart话题: boosting话题: friedman话题: ranger话题: fern
进入Programming版参与讨论
1 (共1页)
r****t
发帖数: 10904
1
【 以下文字转载自 DataSciences 讨论区 】
发信人: repast (xebec), 信区: DataSciences
标 题: 做一个 decision tree 现在还是用 C4.5 吗?
发信站: BBS 未名空间站 (Wed Oct 30 23:30:15 2019, 美东)
三十年前的算法了,目前有没有更好的选择?C5.0 靠谱吗?
C4.5 和 boosting 的关系是啥,过去5年这方面只听说 boosting 了。
m******r
发帖数: 1033
2
就是这个人改进一点,起个名字 那个人改进一点,起个名字。 4.5是挺有名的,作者
是叫什么man, friedman? 斯坦福的物理教授?
大同小异。 这个树真比那个树好? 我没觉出来, 谁用过谁来说说。R的很多树我都调
用过,有的跑起来很慢, 有的最后生成文件特别大, 有的语法很奇怪。 最后还是随
大流用rpart,作者好像是默克药厂的,实现c4.5算法。
忘说了, wickham hadley自己发明了一种树算法,起名叫ranger . 人家是永远不消停
,不断发明新东西。
r****t
发帖数: 10904
3
Friedman 应该是做 boosting, GBM的。
Ranger 是这个吗? https://github.com/imbs-hl/ranger

【在 m******r 的大作中提到】
: 就是这个人改进一点,起个名字 那个人改进一点,起个名字。 4.5是挺有名的,作者
: 是叫什么man, friedman? 斯坦福的物理教授?
: 大同小异。 这个树真比那个树好? 我没觉出来, 谁用过谁来说说。R的很多树我都调
: 用过,有的跑起来很慢, 有的最后生成文件特别大, 有的语法很奇怪。 最后还是随
: 大流用rpart,作者好像是默克药厂的,实现c4.5算法。
: 忘说了, wickham hadley自己发明了一种树算法,起名叫ranger . 人家是永远不消停
: ,不断发明新东西。

m******r
发帖数: 1033
4
我记不清这个慢那个慢, 前几年研究过一阵,觉得大同小异。 树这种东西其实解释不
太清楚,数据变一变,树就不一样, 人眼也就看3,4层了不起了,所以我觉得树没啥大
用。
但是用森林, 预测效果还是相当不错的。R里面这种‘小发明’多的不得了(什么fern
, 条件树,等等),用来用去,还是cpart手感最好,最流行。
好像你也是老江湖了, 为啥琢磨这玩意 ?

【在 r****t 的大作中提到】
: Friedman 应该是做 boosting, GBM的。
: Ranger 是这个吗? https://github.com/imbs-hl/ranger

r****t
发帖数: 10904
5
森林的话每棵树都很矮?最后都是加起来?fern才听说,研究下。
问题要解决好,最终还是要上ml, 最近才有机会琢磨这块,
即使做技术的应用,也还是喜欢做这种有探索性的东西,
不做世界上有人做过的,而是解决没人想做,或者没人敢做的问题。

fern

【在 m******r 的大作中提到】
: 我记不清这个慢那个慢, 前几年研究过一阵,觉得大同小异。 树这种东西其实解释不
: 太清楚,数据变一变,树就不一样, 人眼也就看3,4层了不起了,所以我觉得树没啥大
: 用。
: 但是用森林, 预测效果还是相当不错的。R里面这种‘小发明’多的不得了(什么fern
: , 条件树,等等),用来用去,还是cpart手感最好,最流行。
: 好像你也是老江湖了, 为啥琢磨这玩意 ?

r****t
发帖数: 10904
6
【 以下文字转载自 DataSciences 讨论区 】
发信人: repast (xebec), 信区: DataSciences
标 题: 做一个 decision tree 现在还是用 C4.5 吗?
发信站: BBS 未名空间站 (Wed Oct 30 23:30:15 2019, 美东)
三十年前的算法了,目前有没有更好的选择?C5.0 靠谱吗?
C4.5 和 boosting 的关系是啥,过去5年这方面只听说 boosting 了。
这些术语好混乱:
Gradient boosting
Boosted Trees (= Gradient tree boosting)
Tree boosting
m******r
发帖数: 1033
7
就是这个人改进一点,起个名字 那个人改进一点,起个名字。 4.5是挺有名的,作者
是叫什么man, friedman? 斯坦福的物理教授?
大同小异。 这个树真比那个树好? 我没觉出来, 谁用过谁来说说。R的很多树我都调
用过,有的跑起来很慢, 有的最后生成文件特别大, 有的语法很奇怪。 最后还是随
大流用rpart,作者好像是默克药厂的,实现c4.5算法。
忘说了, wickham hadley自己发明了一种树算法,起名叫ranger . 人家是永远不消停
,不断发明新东西。
r****t
发帖数: 10904
8
Friedman 应该是做 boosting, GBM的。
Ranger 是这个吗? https://github.com/imbs-hl/ranger

【在 m******r 的大作中提到】
: 就是这个人改进一点,起个名字 那个人改进一点,起个名字。 4.5是挺有名的,作者
: 是叫什么man, friedman? 斯坦福的物理教授?
: 大同小异。 这个树真比那个树好? 我没觉出来, 谁用过谁来说说。R的很多树我都调
: 用过,有的跑起来很慢, 有的最后生成文件特别大, 有的语法很奇怪。 最后还是随
: 大流用rpart,作者好像是默克药厂的,实现c4.5算法。
: 忘说了, wickham hadley自己发明了一种树算法,起名叫ranger . 人家是永远不消停
: ,不断发明新东西。

m******r
发帖数: 1033
9
我记不清这个慢那个慢, 前几年研究过一阵,觉得大同小异。 树这种东西其实解释不
太清楚,数据变一变,树就不一样, 人眼也就看3,4层了不起了,所以我觉得树没啥大
用。
但是用森林, 预测效果还是相当不错的。R里面这种‘小发明’多的不得了(什么fern
, 条件树,等等),用来用去,还是cpart手感最好,最流行。
好像你也是老江湖了, 为啥琢磨这玩意 ?

【在 r****t 的大作中提到】
: Friedman 应该是做 boosting, GBM的。
: Ranger 是这个吗? https://github.com/imbs-hl/ranger

r****t
发帖数: 10904
10
森林的话每棵树都很矮?最后都是加起来?fern才听说,研究下。
问题要解决好,最终还是要上ml, 最近才有机会琢磨这块,
即使做技术的应用,也还是喜欢做这种有探索性的东西,
不做世界上有人做过的,而是解决没人想做,或者没人敢做的问题。

fern

【在 m******r 的大作中提到】
: 我记不清这个慢那个慢, 前几年研究过一阵,觉得大同小异。 树这种东西其实解释不
: 太清楚,数据变一变,树就不一样, 人眼也就看3,4层了不起了,所以我觉得树没啥大
: 用。
: 但是用森林, 预测效果还是相当不错的。R里面这种‘小发明’多的不得了(什么fern
: , 条件树,等等),用来用去,还是cpart手感最好,最流行。
: 好像你也是老江湖了, 为啥琢磨这玩意 ?

1 (共1页)
进入Programming版参与讨论
相关主题
predictive analysis只能用来prediction吧?有谁懂这个: example(data.table) ; dt.tbl> DT[X, on=.(y<=foo)]
王垠:对博士学位说永别 (转载)大过节的,不要吵啦,推荐本函数编程的入门书吧?
有谁干过这件事?有没有做sentiment analysis的,求思路
ZT:C++未来断想xgboost 训练大数据问题
深度学习真正有实用价值的应用FP的大神,帮忙看看8行代码是如何打印出x_n的?
minitab收购salford systems 你们怎么看?一个算法题
xgboost 里面的tree到底是一整个depth=N的树,还是一个binaryHello! HTML5 & CSS3
问一个用R抓网上数据,抓下来的和网页不一致Indiana大学的牛人
相关话题的讨论汇总
话题: cart话题: boosting话题: friedman话题: ranger话题: fern