由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 大数据到底是不是忽悠? (转载)
相关主题
数据科学就是大数据应用?阿里巴巴数据挖掘开赛:100万 (转载)
大数据时代和金融--- 海量数据,"大数据"和高频数据,从"Big Data"谈开去之二你们用的都是pig吗?
"大数据"vs. 海量数据来美国两年半,工作-》绿卡-》创业,钱不重要,自己最重要
组建互联网公司数据团队大数据时代的最大挑战(一)?
【求审稿机会】求机器学习,统计,优化,数据挖掘方面的审稿机互联网的原罪 --- 大数据时代的最大挑战(之二)
VMware推出新科技 用软件可预测员工何时离职 (转载)求一本书:Data Science for Business
Re: 请问大数据问题和以前的数据挖掘有什么区别? (转载)DS工作还是要去美国找么
技术宅男寻真爱,数据挖掘遇佳人替国内朋友贴个 (转载)
相关话题的讨论汇总
话题: 数据话题: 到底话题: 忽悠话题: 是不是话题: 统计
进入DataSciences版参与讨论
1 (共1页)
n******g
发帖数: 2201
1
【 以下文字转载自 Faculty 讨论区 】
发信人: nostring (尼), 信区: Faculty
标 题: 大数据到底是不是忽悠?
发信站: BBS 未名空间站 (Thu May 7 14:32:47 2015, 美东)
各位懂行的说说把
大数据到底能不能提供有用的新信息,大数据作出的结果,不用大数据能否做到?
机器学习和普通的统计回归有什么本质区别。。。?
Y****a
发帖数: 243
2
很多人试图用海量数据和数据挖掘机器学习等算法来代替统计模型,试图尽量减少人为
干预直接从数据中提取有价值信息。这其实本身就是自相矛盾。有价值与否本身就是一
个人为主观判断,在缺少对数据和项目的深度了解的情况下,这个判断有很大可能是错
误的。另外统计的很多结论是建立在前提假设的条件下,盲目乱用各种假设检验,简单
到一个t test,见过很多是misleading的。自己亲身经历叫停了一个做了几个月两三个
组合作的项目,因为从数据收集开始就无法满足项目需求。等他们做了几个月,只在最
后的分析阶段才把我加进去,但是为时已晚,巧妇难为无米之炊啊。
Y*********i
发帖数: 713
3
看怎么用了
W**o
发帖数: 547
4
Re!

【在 Y****a 的大作中提到】
: 很多人试图用海量数据和数据挖掘机器学习等算法来代替统计模型,试图尽量减少人为
: 干预直接从数据中提取有价值信息。这其实本身就是自相矛盾。有价值与否本身就是一
: 个人为主观判断,在缺少对数据和项目的深度了解的情况下,这个判断有很大可能是错
: 误的。另外统计的很多结论是建立在前提假设的条件下,盲目乱用各种假设检验,简单
: 到一个t test,见过很多是misleading的。自己亲身经历叫停了一个做了几个月两三个
: 组合作的项目,因为从数据收集开始就无法满足项目需求。等他们做了几个月,只在最
: 后的分析阶段才把我加进去,但是为时已晚,巧妇难为无米之炊啊。

1 (共1页)
进入DataSciences版参与讨论
相关主题
替国内朋友贴个 (转载)【求审稿机会】求机器学习,统计,优化,数据挖掘方面的审稿机
[找工作]求内推entry level data analyst/analyticsVMware推出新科技 用软件可预测员工何时离职 (转载)
Baidu在线笔试Re: 请问大数据问题和以前的数据挖掘有什么区别? (转载)
转行数据挖掘和机器学习技术宅男寻真爱,数据挖掘遇佳人
数据科学就是大数据应用?阿里巴巴数据挖掘开赛:100万 (转载)
大数据时代和金融--- 海量数据,"大数据"和高频数据,从"Big Data"谈开去之二你们用的都是pig吗?
"大数据"vs. 海量数据来美国两年半,工作-》绿卡-》创业,钱不重要,自己最重要
组建互联网公司数据团队大数据时代的最大挑战(一)?
相关话题的讨论汇总
话题: 数据话题: 到底话题: 忽悠话题: 是不是话题: 统计