n******g 发帖数: 2201 | 1 【 以下文字转载自 Faculty 讨论区 】
发信人: nostring (尼), 信区: Faculty
标 题: 大数据到底是不是忽悠?
发信站: BBS 未名空间站 (Thu May 7 14:32:47 2015, 美东)
各位懂行的说说把
大数据到底能不能提供有用的新信息,大数据作出的结果,不用大数据能否做到?
机器学习和普通的统计回归有什么本质区别。。。? |
Y****a 发帖数: 243 | 2 很多人试图用海量数据和数据挖掘机器学习等算法来代替统计模型,试图尽量减少人为
干预直接从数据中提取有价值信息。这其实本身就是自相矛盾。有价值与否本身就是一
个人为主观判断,在缺少对数据和项目的深度了解的情况下,这个判断有很大可能是错
误的。另外统计的很多结论是建立在前提假设的条件下,盲目乱用各种假设检验,简单
到一个t test,见过很多是misleading的。自己亲身经历叫停了一个做了几个月两三个
组合作的项目,因为从数据收集开始就无法满足项目需求。等他们做了几个月,只在最
后的分析阶段才把我加进去,但是为时已晚,巧妇难为无米之炊啊。 |
Y*********i 发帖数: 713 | |
W**o 发帖数: 547 | 4 Re!
【在 Y****a 的大作中提到】 : 很多人试图用海量数据和数据挖掘机器学习等算法来代替统计模型,试图尽量减少人为 : 干预直接从数据中提取有价值信息。这其实本身就是自相矛盾。有价值与否本身就是一 : 个人为主观判断,在缺少对数据和项目的深度了解的情况下,这个判断有很大可能是错 : 误的。另外统计的很多结论是建立在前提假设的条件下,盲目乱用各种假设检验,简单 : 到一个t test,见过很多是misleading的。自己亲身经历叫停了一个做了几个月两三个 : 组合作的项目,因为从数据收集开始就无法满足项目需求。等他们做了几个月,只在最 : 后的分析阶段才把我加进去,但是为时已晚,巧妇难为无米之炊啊。
|