由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 纽约时报:大数据时代降临
相关主题
Interviews with Heads of Accenture, SAS (转载)求救, F家onsite算法题
打造卓越团队的五项理论和实战大家工作压力怎么样啊?不是想海龟么?给你看看国内的节奏
cs专业同学里,孩子是男孩多,还是女孩多啊国内码农也发大财了
有想跳槽的软工么???本人纽约小猎头对一个化学博士毕业后转金融现在身价10亿美元的科大校友的访谈 (转载)
请教一个H-1B期限的问题[内部推荐] 中国科学院大学电子电气与通信工程学院 教学科研岗位人才招聘
恳求推荐data mining, statistical modelling 经典教材!!!为什么华人在美国的地位如此低下? (转载)
求 data mining 统计方面的书申请h1b时候的prevailing wage数据到哪里查呀?
请教一道题有预感会被雷,刚刚把电脑里数据转移到一个微型硬盘上
相关话题的讨论汇总
话题: 数据话题: 领域话题: 分析话题: big话题: data
进入JobHunting版参与讨论
1 (共1页)
z****u
发帖数: 241
1
老土早就指出: 懂数据会分析哪都要,钱不少活的好干到老.
English version on New York Times: The Age of Big Data
By STEVE LOHR
Published: February 11, 2012
http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impac
纽约时报:大数据时代降临
导读:《纽约时报》网站今天刊载文章称, “大数据时代”已经降临,在这一领域
拥有专长的人士正面临许多机会。文章指出,“大数据”正在对每个领域都造成影响。
举例来说,在商业、经济及其他领域 中,决策行为将日益基于数据和分析而作出,而
并非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预
见能力也已经崭露头角。以下 是这篇文章的全文。
你在数字方面很拿手?数据令你感到着迷?那么你听到的声音是机会正在敲门。
作为一名刚刚毕业的耶鲁大学MBA(工商管理硕士),周默(音译)在去年夏天被IBM抢
聘,加入了该公司迅速增长中的数据顾问团队。IBM数据 顾问的职责是帮助企业弄明白
数据爆炸背后的意义——网络流量和社交网络评论,以及监控出货量、供应商和客户的
软件和传感器等——用来指导决策、削减成本和 提高销售额。“我一直都热爱数字。
”周默说道,她的岗位是数据分析师,与其所学的技能相符合。
为了开发数据洪流,美国将需要许多象她一样的人。据顾问公司麦肯锡旗下研究部
门麦肯锡全球学会(McKinsey Global Institute)去年发布的一份报告显示,预计美国
需要14万名到19万名拥有“深度分析”专长的工作者,以及150万名更加精通数据的经
理人,无论 是已退休人士还是已受聘人士。
数据充斥所带来的影响远远超出了企业界。举例来说,贾斯汀-格里莫(Justin
Grimmer)是新生代的政治科学家,他现年28岁,在斯坦福大学任助理教授。在大学生和
研究生时期的研究报告中,他将数学与政治科学联系起来,称其看 到了“一个机会,
原因是纪律正日益变得数据密集化”。他研究的内容涉及对博客文章、国会演讲和新闻
稿进行计算机自动化分析等,希望藉此洞察政治观点是如何 传播的。
在科学和体育、广告和公共卫生等其他许多领域中,也有着类似的情况——也就是朝
着数据驱动型的发现和决策的方向发生转变。哈佛大学量化社会科学 学院(Institute
for Quantitative Social Science)院长加里-金(Gary King)称:“这是一种革命,我
们确实正在进行这场革命,庞大的新数据来源所带来的量化转变将在学术界、企业界和
政界中迅速蔓延开来。没有哪个领域不会 受到影响。”
欢迎来到“大数据时代”(Age of Big Data)。硅谷新贵们——最初是在谷歌(微博
), 现在是在Facebook——都精通于驾驭网络数据(网络搜索、帖子和信息等)与互联网
广告之间的关系。在上个月于瑞士达沃斯召开的世界经济论坛上,大数 据是讨论的主
题之一。这个论坛上发布的一份题为《大数据,大影响》(Big Data, Big Impact)的报
告宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。
“生命中的一天”(Day in the Life)系列摄影作品的创作人里克-斯莫兰(Rick
Smolan)正计划在今年晚些时候推出一个新项目,这个名为“大数据的人类脸孔”(The
Human Face of Big Data)的项目将记录数据的采集和使用。斯莫兰是一名狂热分子,
他认为“大数据”有成为“人性仪表盘”的潜力,也就是一种能帮助人类与贫穷、犯罪
和污染 等现象展开斗争的智能工具。而私人部门的倡导组织则持有悲观的观点,警告
称“大数据”与“独裁者”(Big Brother)同出一辙,只是披上了企业的外衣。
什么是“大数据”?这当然是一个带有文化基因和营销理念的词汇,但同时也反映
了科技领域中正在发展中的趋势,这种趋势为理解这个世界和作出决策 的新方法开启
了一扇大门。根据科技研究公司IDC作出的估测,数据一直都在以每年50%的速度增长,
换而言之,也就是每两年就增长一倍。这不是简单的数据 增多的问题,而是全新的问
题。举例来说,在当今全球范围内的工业设备、汽车、电子仪表和装运箱中,都有着无
数的数字传感器,这些传感器能测量和交流位置、 运动、震动、温度和湿度等数据,
甚至还能测量空气中的化学变化。
将这些交流传感器与计算智能连接起来,那么你就会看到所谓的“物联网”(
Internet of Things)或“工业互联网”(Industrial Internet)。在信息获取的问题上
取得进步也是促进“大数据”趋势发展的原因之一。举例来说,政府数据——聘用数据
及其他信息——一直都在稳步地向 网络转移。在2009年中,美国政府通过启动Data.
gov网站的方式进一步开放了数据的大门,这个网站向公众提供各种各样的政府数据。
数据不仅仅是正在变得更加可用,同时也正在变得更加容易被计算机所理解。“大
数据”发展趋势中所增加的大部分数据都是在自然环境下产生的,比如 说网络言论、
图片和视频等不受控制的东西,以及来自于传感器的数据等。这些是所谓的“非结构化
数据”,通常不能为传统的数据库所用。
但是,旨在从互联网时代非结构化数据的庞大“宝藏”中获得知识和洞察力的计算
机工具正在迅速发展中。在这种工具发展的最前沿是迅速取得进步的人工智能(AI)技术
,比如说自然语言处理、模式识别和机器学习等。
这些人工智能技术能应用于许多领域。举例来说,谷歌的搜索和广告业务及其实验
中的机器人(19.530,0.13,0.67%)汽车都利用了很多的人工智能技术。在加利福尼亚州
的公路上,谷歌的机器人汽车已经跑了数千英里的路。谷歌的这两项业务都让“大数据
”时代的挑战却步,它们对数量庞大的数据进行分析,并作出瞬时的决策。
反过来,大量的新数据也正在加快计算领域的进步,这是“大数据”时代中的一个
良性循环。举例来说,机器学习算法能基于数据来进行学习,数据越多 机器就能学到
越多。以苹果在去年秋天推出的iPhohne手机Siri语音助理服务为例,这个应用的源头
可回溯至五角大楼的一个研究项目,该项目随后被分 离出来,成为了一家硅谷创业公
司。苹果在2010年收购了Siri,并继续向其提供更多数据。时至今日,在人们提供成百
上千万条问题的环境下,Siri正 在变成一种日益熟练的个人助理,能向用户提供提醒
服务、天气预报、餐饮建议和对大量问题作出解答等服务。
麻省理工学院斯隆管理学院的经济学教授埃里克-布吕诺尔夫松(Erik
Brynjolfsson)称,如果想要理解“大数据”的潜在影响力,那么可以看看显微镜的例
子。显微镜是在四个世纪以前发明的,能让人们看到以前从来都 无法看到的事物并对
其进行测量——在细胞的层面上。显微镜是测量领域中的一场革命。
吕诺尔夫松解释称,数据测量就相当于是现代版的显微镜。举个例子,谷歌搜索、
Facebook帖子和Twitter消息使得对人们行为和情绪的细节化测量成为可能。
吕诺尔夫松进一步指出,在商业、经济及其他领域中,决策行为将日益基于数据和
分析而作出,而并非基于经验和直觉。“我们能开始变得远为科学化。”他这样说道。
有很多的轶事证据表明,数据至上的思考方式将带来很高的回报。其中,最著名的
例子仍旧是迈克尔-刘易斯(Michael Lewis)在2003年出版的《点球成金》(Moneyball)
一书,这本书记录了低预算的奥克兰运动家队是如何利用经过分析的数据和晦涩难解的
棒球 统计学来找到被评价过低的棒球手的。在布拉德-皮特(Brad Pitt)主演的电影版
《点球成金》去年被搬上银幕以前,深度的数据分析就不仅已经成为棒球领域中的标准
,而且在英国足球联赛等其他体育项目中也是如此。
沃尔玛(WMT)和Kohl’s等零售商也已经开始对销售额、定价以及经济学、人口统计
学和天气数据进行分析,藉此在特定的连锁店中选择合适的 上架产品,并基于这些分
析来判定商品减价的时机。UPS等货运公司也正在对卡车交货时间和交通模式等相关数
据进行分析,以此对其运输路线进行微调。
Match.com等交友网站也经常会仔细查看其网站上列出的个人特征、回应和交流信
息,用来改进其算法,从而为想要约会的男女提供更好的配 对。在全美范围内,以纽
约市为首的警方部门也正在使用计算机化的地图以及对历史性逮捕模式、发薪日、体育
项目、降雨天气和假日等变量进行分析,从而试图对 最可能发生罪案的“热点”地区
作出预测,并预先在这些地区部署警力。
吕诺尔夫松及其两名同僚在去年发表研究报告称,数据指导下的管理活动正在美国
企业界中蔓延开来,而且这种管理活动正开始获得回报。这三名学者对 179家大型公司
进行了研究,发现那些采用“数据驱动型决策”模式的公司能将其生产力提高5%到6%,
这种生产力的提高是很难用其他因素来解释的。
在公共卫生、经济发展和经济预测等领域中,“大数据”的预见能力正在被开发中
,而且已经崭露头角。研究者发现,曾有一次他们发现“流感症状”和 “流感治疗”
等词汇在谷歌上的搜索查询量增加;而在几个星期以后,到某个地区医院急诊室就诊的
流感病人数量就有所增加(还需要指出的是,医院急诊室发布报 告的时间通常要比病人
就诊的时间晚上两个星期左右)。
联合国(微博)已 经推出了名为“全球脉动”(Global Pulse)的新项目,希望利用
“大数据”来促进全球经济发展。联合国将进行所谓的“情绪分析”,使用自然语言解
密软件来对社交网站和文本消息中的信息作 出分析,用来帮助预测某个给定地区的失
业率、支出削减或是疾病爆发等现象,其目标在于利用数字化的早期预警信号来提前指
导援助项目,以阻止某个地区重新陷 入贫困等困境。
在经济预测领域中,已经有研究表明,与不动产经济学家所作出的预测相比,谷歌
上住房相关搜索查询量的增加或减少的趋势能更加准确地预测未来一个 季度中的住房
市场走势。美联储及其他机构已经注意到这一点。在去年7月份,美国国家经济研究局(
National Bureau of Economic Research)主持召开了一次研讨会,此次会议所讨论的
内容是“大数据时代的机会”及其对经济领域的影响。
“大数据”还已经令针对社交网络运作方式的研究发生了变化。在20世纪60年代,
哈佛大学的斯坦利-米尔格拉姆(Stanley Milgram)利用包裹作为研究媒介,进行了一项
与社交网络相关的著名实验。他将包裹寄往美国中西部地区的志愿者,指导他们如何将
包裹带给波士顿的陌生 人,但不能直接交付;参与实验者如果想要通过邮寄方式来交
付包裹,那么目标对象就是能是他们认识的人。结果表明,一个包裹换手的平均次数相
当之低,仅为6 次左右。这是对所谓“小世界现象”的经典阐释,据此形成了“六度分
隔”(six degrees of separation)的流行词汇。
时至今日,社交网络研究的内容涉及如何采集庞大的数字化数据集合,用来阐释网
络上的集体化行为。这种研究的结果表明,你认识但不经常联系的人 ——在社会学中
被称为“微弱联系”(weak ties)——是职务空缺小道消息的最佳来源,原因是与关系
亲密的朋友相比,这些人在略有不同的社交世界中穿行,因此能看到你和你最好的朋友
们所无法看到 的机会。
在有关某个主题的交流中,研究学者们还能看到其影响模式和高峰——举例来说,
可以通过追踪Twitter上的趋势标签的方式来达成这个目标。对 于数量庞大的用户人群
来说,Twitter这个在线“玻璃鱼缸”是透视其实时行为的窗口。康奈尔大学教授乔恩-
克伦伯格(Jon Kleinberg)称:“我寻找的是数据中的‘热点’,这是我需要理解的一
种活动爆发的现象。只有通过‘大数据’,你才能做到这一点。”
毫无疑问,“大数据”本身也存在一些风险。统计学家和计算机科学家指出,“大
数据”的集合和高密度的测量将令“错误发现”的风险增长。斯坦福大 学的统计学教
授特来沃尔-哈斯迪(Trevor Hastie)称,如果想要在庞大的数据“干草垛”中找到一根
有意义的“针”,那么所将面临的问题就是“许多稻草看起来就像是针一样”。
此外,对于统计学恶作剧和有偏见的实情调查活动而言,“大数据”也提供了更多
的原材料。“大数据”为一个老把戏提供了高科技的手段,那就是——我知道事实,现
在让我们来找到事实吧。乔治梅森大学的数学家瑞贝卡(6.99,0.03,0.43%)-高尔丁(
Rebecca Goldin)称,这是“最有害的数据使用方式之一”。
数据已被计算机和数学模型所驯服和理解,这些模型就像是文学中的隐喻修辞,也
就是一种简化后的解释方式。对于理解数据而言,这些模式是有用的, 但它们也存在
局限性。私人部门的倡导组织发出警告称,一个基于网络搜索的模式可能会发现一种相
关性,从而作出不公平或是带有歧视性的统计推断,对产品、银 行贷款和养老基金提
供的医疗保险造成影响。
虽然面临着这种警告,但“大数据”时代的降临看起来已是无可逆转。数据已经坐
到了驾驶员的位置上,它就在那里,有用而且宝贵,甚至还很时尚。
资深数据分析师称,长期以来,朋友们一谈到他们的工作就会变得厌烦,但现在突
然变得好奇起来。这些分析师们认为,《点球成金》是促成这一变化的 原因之一,但
实际原因远非如此简单。哥伦比亚大学统计学家兼政治科学家安德鲁-格尔曼(Andrew
Gelman)称:“文化已经发生了改变。现在人们的想法是,数字和统计学是有趣的,是
一种很酷的东西。”(金良/编译)
r**********g
发帖数: 22734
2
还是不一样的,传统的结构数据分析我看基本也就那样了
非结构的分析那是机会大大滴

【在 z****u 的大作中提到】
: 老土早就指出: 懂数据会分析哪都要,钱不少活的好干到老.
: English version on New York Times: The Age of Big Data
: By STEVE LOHR
: Published: February 11, 2012
: http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impac
: 纽约时报:大数据时代降临
: 导读:《纽约时报》网站今天刊载文章称, “大数据时代”已经降临,在这一领域
: 拥有专长的人士正面临许多机会。文章指出,“大数据”正在对每个领域都造成影响。
: 举例来说,在商业、经济及其他领域 中,决策行为将日益基于数据和分析而作出,而
: 并非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预

q********c
发帖数: 1774
3
这种文章其实没什么意义,都是不懂技术的人在瞎掰.
g*********e
发帖数: 14401
4
MBA不懂数据的吧 能吹就行
数据应该是指DATA MINING MACHINE LEARNING PATTERN RECOGNITION这一块 是EE的一
个分支
y*******g
发帖数: 6599
5
我还以为大海贼时代呢
v****a
发帖数: 550
6
能不能展开讲讲什么是“非结构的分析”?

【在 r**********g 的大作中提到】
: 还是不一样的,传统的结构数据分析我看基本也就那样了
: 非结构的分析那是机会大大滴

1 (共1页)
进入JobHunting版参与讨论
相关主题
有预感会被雷,刚刚把电脑里数据转移到一个微型硬盘上请教一个H-1B期限的问题
该更新置顶的H1数据啦恳求推荐data mining, statistical modelling 经典教材!!!
急问:电脑硬盘坏了,有可能恢复硬盘里保持的数据吗?求 data mining 统计方面的书
有关于background check出问题的统计数据吗请教一道题
Interviews with Heads of Accenture, SAS (转载)求救, F家onsite算法题
打造卓越团队的五项理论和实战大家工作压力怎么样啊?不是想海龟么?给你看看国内的节奏
cs专业同学里,孩子是男孩多,还是女孩多啊国内码农也发大财了
有想跳槽的软工么???本人纽约小猎头对一个化学博士毕业后转金融现在身价10亿美元的科大校友的访谈 (转载)
相关话题的讨论汇总
话题: 数据话题: 领域话题: 分析话题: big话题: data