由买买提看人间百态

topics

全部话题 - 话题: 数据处理
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
s********e
发帖数: 323
1
我今年12月份统计master毕业,之前在同一个学校拿过一个化学master,学校很一般,
100+的。我有两年国内工作经验(化工研发1年+咨询助理1年),都是在上海的美国公
司。因为有亲戚在休斯顿,所以打算去毕业后休斯顿找工作。我想请教一下统计+化学
的背景在休斯顿工作机会多吗?我比较想找化工公司的DOE或者数据处理的工作,或者
医学院数据处理的工作。是不是先过去住着找local的工作比较方便?还请有经验的大
虾多多指教!不甚感激!
l**n
发帖数: 7272
2
【 以下文字转载自 SanFrancisco 讨论区 】
发信人: continental (飞), 信区: SanFrancisco
标 题: [原创,讨论] 如何才是Data Scientist? (转载)
发信站: BBS 未名空间站 (Sun Jan 5 12:21:02 2014, 美东)
发信人: tninja (K dash), 信区: DataSciences
标 题: [原创,讨论] 如何才是Data Scientist?
发信站: BBS 未名空间站 (Sat Jan 4 17:53:14 2014, 美东)
如何才是Data Scientist?
小弟本是学术界的Bioinformatics Scientist,因生计问题3年前改行工业界Data
Scientist,经历过2家大的互联网公司,3个不同的岗位的Data Scientist。现将这些
年来摸爬滚打中所学所做所想所理解总结如下,抛砖引玉,还请大家多批评指点。
1.1 Data scientist的职责?
DS是数据应用科学家。他应该立足某个应用领域,根据领域需求设计合适的数据产品,
利用可以自动... 阅读全帖
j****c
发帖数: 19908
3
我们天体物理算一个坚定的反windows阵营,不知道还有没有其他学科跟我们一样彻底
排斥microsoft的
我们专业领域的数据处理软件几乎没有windows版的,我上次瞅了一下我用的那个天文
卫星的数据处理软件的FAQ,第一条就是“Q: 我用windows系统,该怎么安装这个软件
?”“A: 找一个安装了unix/linux/mac os的电脑,或者用virtual machine之类的软
件在你的windows里模拟一个linux”。我们也不用office,paper全用latex写
w********e
发帖数: 8594
4
我也推荐了你用宏解决当前的问题,但要学也学个正经的。去下载个R (http://www.r-project.org/)。免费,强大,流行,高大上的数据处理软件。学会在那里面编点简单的程序,掌握一点基本的数据处理能力,以后找工作也多一个选择。
s*******s
发帖数: 5087
5
来自主题: MiddleSchool版 - 2010年10月27日作业
俺木有别的选择也
关键是TC也特别push我做faculty,我找工作那会儿,就跟我老板一起push,现在居然
还贼心不死,老说等他找到,我就在同个学校找faculty(主要是这样就能在一起了)。
转篇今年4月的blog
---
《被两个老板slave》
这两天被老板slave,还是他的私活(他写的书),晚上都做实验到11点多才回家。今
天晚上我红外扫完已经8点多了,正纠结到底是接着把数据处理了,还是回家弄点吃的
先。正好TC打电话来,我问他,然后他以勿庸置疑的口吻说,先把数据处理了再走!好
嘛,这一处理,又到了11点。我老板要知道,估计做梦也要笑醒了。他白天slave我,
他下班,TC正好上班,接手slave,中间都不带停的。。。
我越来越发现,这(要)当faculty的人,咋就都一鼻孔出气呢,比如从我要毕业开始
,我老板就一个劲push我找postdoc(单独谈话好几次),这也不奇怪,可TC也是,我
跟他们两人都说了无数遍,我人笨又缺乏学术热情,可两人还是都push得起劲,还都一
副‘~我看好你哦~’的表情(参见link),ft死。。。
C*******g
发帖数: 9288
6
来自主题: MiddleSchool版 - 2010年10月27日作业
mark
-猪兄

俺木有别的选择也
关键是TC也特别push我做faculty,我找工作那会儿,就跟我老板一起push,现在居然
还贼心不死,老说等他找到,我就在同个学校找faculty(主要是这样就能在一起了)。
转篇今年4月的blog
---
《被两个老板slave》
这两天被老板slave,还是他的私活(他写的书),晚上都做实验到11点多才回家。今
天晚上我红外扫完已经8点多了,正纠结到底是接着把数据处理了,还是回家弄点吃的
先。正好TC打电话来,我问他,然后他以勿庸置疑的口吻说,先把数据处理了再走!好
嘛,这一处理,又到了11点。我老板要知道,估计做梦也要笑醒了。他白天slave我,
他下班,TC正好上班,接手slave,中间都不带停的。。。
我越来越发现,这(要)当faculty的人,咋就都一鼻孔出气呢,比如从我要毕业开始
,我老板就一个劲push我找postdoc(单独谈话好几次),这也不奇怪,可TC也是,我
跟他们两人都说了无数遍,我人笨又缺乏学术热情,可两人还是都push得起劲,还都一
副‘~我看好你哦~’的表情(参见link),ft死。。。
S**********u
发帖数: 1329
7
毫无疑问,苏的战斗力十分强悍。他可以充分利用荒野每一寸土地,每一种地形
,辽阔无边的荒野就是他的主场。他冷静、耐心,拥有顶级杀手所应具备的一切素质,
临战状态下的苏,就是最完美的杀戮机器。他可以吸收利用各种基因,至今为止还没有
看到进化潜力的尽头,可是他却已拥有了九阶感知能力和八阶特殊格斗域能力,也即是
说,他至少可以发展出十阶能力。即使是感知域的十阶能力,那也是十阶能力。按血腥
议会的秘密分阶法,所有十阶能力都威力巨大,属于高级圣阶能力。至于十一阶能力,
则根本没有资料记载。最后,则是他不可思议的再生能力。至少在已知的生物中,没有
一种能够和苏相比。这项特性几乎使苏确立了同阶无敌的地位!仅靠拼伤害承受的消耗
战,苏就绝对是一个可怕的对手。
苏特长众多,反而很难说出真正最强之处。梅迪尔丽陷入了沉思,希尔瓦娜斯则
试着说了几点,却一一为苏否认。
许是知道他们找不到答案,苏自己揭开了谜底:“我最强的地方,就是消灭对方
的主场!”
梅迪尔丽大吃一惊!强大如她,很清楚什么是主场,更清楚主场对于所有拥有九
阶能力的圣阶能力者的意义。如果主场是精心构建、并且... 阅读全帖
w***w
发帖数: 6301
8
1楼
时间已到了春暖花开的时节,又一个寒冷的冬季应该过去。但那是指旧时代,新时
代下由于辐射云层的存在,全球气温普遍下降,现在还应该是冬天。至少在龙城,还该
是飘雪的时节。不过在龙城周围,往昔平滑如镜的厚厚雪层已彻底消失,由仍冒着硝烟
的焦土所替代。
宏伟精美兼而有之的龙城,如今也偶尔会有一朵巨大火云升腾而起,血腥议会的内
战越演越烈,战火已不可避免地烧到了龙城。
把内战演绎到这种程度,可以说,几乎所有的人都疯了。少数几个没有疯的,则别
有所图。
龙城也成了战场,这意味着一向执中立的暗黑龙骑也卷入了战争。至少在议长和女
皇间选择了立场的暗黑龙骑正在迅速增加。少数坚持中立的龙骑已无法对整个龙城设防
。而从战略角度看,龙城中具备战略价值的地点多如繁星,所以内战双方不再刻意避开
龙城,只除了少数重地,比如说龙骑总部。虽然战争已经发展到了不择手段的阶段,但
是聪明点的人仍然不愿意过分得罪摩根将军。攻击龙骑总部无疑是向摩根将军、也即摩
根家族宣战的最好方式,内战双方的大大小小指挥官都没有无脑到这种地步,他们倒是
很希望对方先做出这种无脑举动来。
龙城如美丽的年轻女人,正在战火的反复摧残下迅速凋零... 阅读全帖
P******l
发帖数: 1648
9
这篇文章来自One world 巴别教。不代表基督信仰世界观
《人类简史》作者最新演讲:巨变将至!
2018-01-29 财经会议资讯
谈到数据监管,大多数人只是想到隐私、购物,公司,自己买什么,自己去了哪儿,但
这些真的只是冰山一角。还有更重要的事情没涉及到。
不光是人类,所有生命的未来都取决于我们如何回答这个问题。
文 | 尤瓦尔·赫拉利
本文转载自微信公众号“正和岛”(ID:zhenghedao), 编选自《人类简史》作者 尤
瓦尔·赫拉利教授近日在瑞士达沃斯举行的第48界世界经济论坛的演讲,原标题为“
Will the Future Be Human?”
今天我想聊聊我们这个物种的未来,以及生命的未来。
我们应该是最后一代智人。再过一两百年,世界将被完全不同的实体统治。它们和我们
的差距,也许比我们和黑猩猩的差距还要大。
之所以这样说的原因是,未来几代人会学着改造人体、大脑、思维。这是21世纪经济运
作的结果。21世纪经济的产物不是工厂、车辆、武器,而是人体、大脑、思维。
这个星球未来的主人会是什么样呢?这完全取决于今后拥有数据的人。控制数据的人,
不仅控制了未来,也控制了生命... 阅读全帖
z***y
发帖数: 7151
10
由中国科学院计算技术研究所国家智能计算机研究开发中心联合曙光公司共同研制的“曙
光4000L”超级服务器日前通过验收。专家介绍,该服务是我国最大的百万亿数据处理超
级服务器,可以同时适用于高性能"科学计算"和"信息服务"两大领域。
据悉,该项目组的负责人,现为中科院计算所研究员,国家智能计算机研究开发中心
主任,博士生导师,曙光公司首席科学家孙凝晖。
据专家介绍,“4000L”中的L指的就是基于LINUX。该款产品是当前国内最大的IDC数
据处理主机,具备百万亿字节的数据处理能力,在支持数据密集应用的技术上实现了多项
重大突破,这对于正由"科学计算"向"信息服务"转型的国产高性能计算机产业而言,无疑
是一块重要的里程碑。
曙光4000L整个4000L系统由40个机柜组成,现有644个CPU,峰值速度每秒3万亿次浮
点计算,644GB内存,百万亿字节(100TB)存储。据专家介绍,该系统的可扩展性非常好,
最大可"在线"扩展到80个机柜,1300个CPU,每秒6.75万亿次峰值速度,4000G内存,600T
存储,1200A最大电流,160千瓦最大功耗的海量处理系统。
曙光4000L是传
d*****n
发帖数: 599
11
发信人: Dreamer (不要问我从哪里来), 信区: Dreamer
标 题: Re: 真他妈的气人,关于专业的选择
发信站: BBS 未名空间站 (Sat Oct 15 17:03:54 2011, 美东)
我不是内行,只知道自己做的那一小块
可能没有办法给你建议
我的感觉是
数据处理的背景能帮你找到做统计的能做的data management的位置
但是对于要挣到比it更高的工资没有什么帮助
投行的业务就那么几快,sell side的话做ipo,公司债,并购之类,buy side的话做
asset management,hedge fund,etc 金融里面赚钱的banker,trader甚至算上quant,
都跟数据处理没有关系。
w***g
发帖数: 712
12
来自主题: WHU版 - 刘经南
著名大地测量学专家。中国工程院土木、水利与建筑工程学部院士,教授、博导,
1943年生于湖南长沙,主要从事大地测量坐标系理论、卫星定位理论与应用及数据处理软
件开发等方面的研究,在软件开发、数据处理和工程应用等方面取得了一系列开创性的研
究成果。针对中国目前数据通信暂不发达的特点,创造性地提出了分布式广域差分技术,
其工程实验结果的高精度高可靠性特征曾引起国内有关专家的震惊。目前,正致力于卫星
定位国家空间信息基础设施的建设和GPS工程技术的产业化发展。
a**********k
发帖数: 1953
13
来自主题: Zhejiang版 - 关于微软重组的感想
这些都是很普通但很有用的东西。看来你对OS和硬件不熟。
我一直认为做软件的,不管是系统软件还是应用软件,对OS
一定要吃透, 最好把BSD或Linux Kernel代码读一遍,
至少是Task management和Memory Management这两部分。
比如输入数据总线连到你的Server母板某一个Multicore node,
如果你对OS有深入了解, 就可以把你的输入数据处理Process
分配到那个core上, 再通过NUMA控制把数据存在与那个core直接
相连的memory模块上。 如此你的输入数据处理的瓶颈可能一下子
解决了。 而这些光在应用软件里是很难做到的。
a**********k
发帖数: 1953
14
来自主题: Zhejiang版 - 关于微软重组的感想
这些都是很普通但很有用的东西。看来你对OS和硬件不熟。
我一直认为做软件的,不管是系统软件还是应用软件,对OS
一定要吃透, 最好把BSD或Linux Kernel代码读一遍,
至少是Task management和Memory Management这两部分。
比如输入数据总线连到你的Server母板某一个Multicore node,
如果你对OS有深入了解, 就可以把你的输入数据处理Process
分配到那个core上, 再通过NUMA控制把数据存在与那个core直接
相连的memory模块上。 如此你的输入数据处理的瓶颈可能一下子
解决了。 而这些光在应用软件里是很难做到的。
b*******f
发帖数: 75
15
来自主题: CS版 - LinkedIn Internship Opportunity
主要是数据挖掘,数据分析,大规模数据处理,分布式数据处理方向的。这几天申请时
机应当正好。待遇也还是不错的,地点在Moutain View,Google旁边。
详细见网址:
http://www.linkedin.com/jobs?viewJob=&jobId=1354912
可以在 Linkedin 网上递交简历,也可以投给 Doris。
Job Description
We're looking for superb analytical minds to join our Data and Analytics
Team this summer for an internship!
What are some questions our data can answer? -- Where are you likely to be
in 5,10,15 years? What were the job market trends after the collapse of the
financial industry? How are professionals connected ... 阅读全帖
t********k
发帖数: 808
16
来自主题: Database版 - oracle能开多大的连接池?
谢谢
现在还想到一个解决的方法就是
1.在繁忙时(一年中就只有几天时间,一个月左右吧)用高级复制
这样有二台oracle,一台用来读,一台用来写或是二台都能读写
用高级复制的话对硬件的要求不是太高
但听说如果写数据量大的话,高级复制会有很多问题出现
2.用Logical Standby
Logical Standby、的Standby的数据库可以给应用程序读访问
那也行啊,可以缓解好大的压力
但用Standby技术对硬件要求太高
有点儿为难
3.干脆用一个MySQL,e用来进行写
用户提交的数据(只有在一张表中)都先保存到这
而另一程序同时从MySQL中读数据到Oracle里
数据处理放在主数据库Oracle中
但这还是有一个数据不一致性问题
因为数据处理有较强的实时性
根据提交时间的先后排队处理的
上面三个方案哪一个更可行?
f******b
发帖数: 1148
17
来自主题: Hardware版 - 网络储存
哦,所以router的CPU对USB进来的数据处理不如对网线进来的数据处理速度?
y*********e
发帖数: 140
18
来自主题: Hardware版 - 办公室电脑请教
主要要适合大的数据处理,特别是大的图形数据处理,比如GIS的DISAGGREGATED数据
MAC PRO是不是合适?配置应该怎样比较好?和MAC PRO同样配置的PC是不是更便宜划算
些?谢谢。
t********k
发帖数: 808
19
谢谢
现在还想到一个解决的方法就是
1.在繁忙时(一年中就只有几天时间,一个月左右吧)用高级复制
这样有二台oracle,一台用来读,一台用来写或是二台都能读写
用高级复制的话对硬件的要求不是太高
但听说如果写数据量大的话,高级复制会有很多问题出现
2.用Logical Standby
Logical Standby、的Standby的数据库可以给应用程序读访问
那也行啊,可以缓解好大的压力
但用Standby技术对硬件要求太高
有点儿为难
3.干脆用一个MySQL,e用来进行写
用户提交的数据(只有在一张表中)都先保存到这
而另一程序同时从MySQL中读数据到Oracle里
数据处理放在主数据库Oracle中
但这还是有一个数据不一致性问题
因为数据处理有较强的实时性
根据提交时间的先后排队处理的
上面三个方案哪一个更可行?
f*****0
发帖数: 166
20
新手在学习编程中。。。
现在在学习开发一个实用程序,用得是netbeans ide。
一开始直接使用了subclass of JFrame作为主界面, 以subclass (of JDialog) 作为
次界面来获得用户使用时的输入的状态信息。程序运行时,make a new instance of
the "subclass(of JDialog)", 获得用户输入的状态信息,然后用objectOutputStream
来save保存了这个instance。 再load这个object。
实践中,在load时获得了如下Exception: java.io.WriteAbortedException: writing
aborted; java.io.NotSerializableException: javax.swing.GroupLayout
请教了Google大师,得到的结论是,我不应该储存serialize GUI(包括他们的子类)
,而是应该用Java Preferences 或 Java properties来记录储存状态信息。然后load
使用时,再赋值到GUI 界面中... 阅读全帖
c***n
发帖数: 21
21
来自主题: Programming版 - career问题
本人理科PhD 但不是生物 如果顺利毕业工作应该也不太难找 不过不太想继续作
research 浪费了前两年时间 现在想问问将来当码工的可能性
经验:自学了c++和shell scripting 所以对于linux环境还比较熟悉 暑假里gf选了c++
和system programming的课程 跟着学了一下 所有的project都认真做了一下 就是笔头
的考试没有参加
lab里要用到一个c和c++写的开源linux软件 学过一些时间 基本了解了gtk widget(
一个user interface)和gtk thread的用途 但是那个开源软件还是看不懂 特别是他通
过automake生成的makefile的编译过程
写过用c的system command写成的一个shell 用shell scripting写过一个贪吃蛇的
小游戏 用gtk和c写过一个计算器
现在在自学data structure 想在春季修algorithm作为minor 并且接下来想写一个
图像数据处理的小软件 现在可以从一个netcdf file里读到一个二维数组 但是不知道
怎么用它... 阅读全帖
n****r
发帖数: 5801
22
来自主题: Programming版 - 菜鸟问个Matlab问题
就是觉得很奇怪,图方便在这儿问啦
具体是这样的,某个路径下的数据M1-M15共15个数据,我想用程序自动处理数据所以涉
及到读数据和存数据的问题。
读数据第一步我用了这样的方式:
sub = dir('M*')
这样size 为15, sub(1).name == M1
为的是不想把别的无关数据读进。
但是程序对一个数据处理完之后,sub的size 自动变化为 17了,
sub(2).name == ..
sub(3).name == M1
我想应该是 sub = dir('M*') 自动变回 sub = dir(pwd)了
我想在运行完 sub = dir('M*') 之后,存下sub: save sub sub,然后 clear, 重新
load sub,这样sub 会保持 size 为15,sub(1).name == M1。
可是即使这样,程序对一个数据处理完之后,同样的事又发生了!sub的size 又自动变
化为 17,sub(2).name == ..
很想不通为什么会这样?经过 save,clear, load了不是把变量固定了么?为什么还会
自动变化呢?
A***C
发帖数: 143
23
来自主题: Programming版 - 也谈谈语言之争
摘要:语言之争是无谓之争,最重要的是设计+lib。
(相应某些网友的呼唤,当帖子长度太长的时候写个摘要)
作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身,
我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库,
汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统
是上PhD的时候跟一些水平极烂的教授补上的。
先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿
真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队
做中型系统(100k行左右)的开发,后来做这个团队的lead。
做PhD的时候开始用Matlab,java,python,perl,R,javascript
和php。每接触一个语言,我都维护自己的一套lib,像数据读取,
visualization,socket,数值计算等,所有lib的格式和名称向
Matlab靠拢对齐,后来连继续使用C/C++的时候也如此。
后来你会发现,其实每套语言真的很像,至少在我自己的project里如此。
我的project模块基本上都能分得很清楚:UI/Data... 阅读全帖
i**i
发帖数: 1500
24
来自主题: Programming版 - 百度牵头“健康云”计划
今年百度联盟峰会上,李彦宏称目前很多设备采集的数据是快数据,没有价值,有价值
的是慢数据。当时外界很好奇慢数据是什么?慢数据的价值是什么?如何使用这些慢数据?
现在百度给出了答案。7月23日,由北京市政府倡导、百度牵头,与智能设备厂商和服
务商联手打造“北京健康云”。北京市相关负责人表示:“北京健康云”也是北京“祥
云工程”的重点项目之一。
百度副总裁李明远接受21世纪经济报道记者采访时表示:在“移动互联网云计算大数据
”时代,创新的方向是“软件硬件、线下线上”结合在一起的创新。这也是百度的方向。
据百度云首席架构师侯震宇介绍,北京健康云平台包括三层架构:感知设备层、健康云
平台层和健康服务层。侯震宇说:这三层是从底层到中层,再到上层的递进关系,最终
完成对用户健康状况全生命周期的跟踪。
感知设备层的硬件由第三方合作伙伴提供,现场的展台上,有很多硬件提供商来参展。
一位心电仪提供商接受21世纪经济报道记者采访时透露:其产品与技术十分专业,过去
主要是医院等机构提供产品,现在变为向家庭与个人提供产品,在产品上做了改进。
感知设备层包括体重秤、手环和心电仪等设备,用户可以实时监测、采集健康... 阅读全帖
g*****g
发帖数: 34805
25
http://tech.huanqiu.com/per/2013-08/4307208_2.html
我们作为创业公司总结了一些经验和教训跟大家分享一下:
1、保持简单,这对创业公司来讲非常重要,一个简单的系统出错的可能性就很小
,出错以后解决问题的可能性就变得很大。保持简单我们认为对创业公司来说是非常关
键的问题。
2、我们认为一项技术的超级用户遇到的难度是远远大于普通用户的。我们知道大
家今天都在用一些开元软件,这些开元软件是逐步发展的过程,很多软件在早期并没有
经历过很大的压力测试,在一定的流量基础上他们都工作的非常少,但是超过一定流量
的话都有各种各样的问题。如果你作为超级用户,你可能接触到的问题是前人完全没有
遇到的,你很难在社区里得到任何求助,需要自己读它的代码,去看是不是我能解决,
如果解决不了的话怎么办?如果解决了当然是可以去改一下它的代码,如果解决不了的
话,有的时候构架的限制解决不了是很麻烦的问题。
3、新技术往往看上去很美。这个话其实有两层意思,一种是真的看上去很美,如
果看上去不美也不能叫新技术了。第二层意思是往往只是看上去很美,真正用起来并不
美。我们知道一项... 阅读全帖
a*f
发帖数: 1790
26
来自主题: Programming版 - 程序员有啥核心竞争力
一次性的数据处理不考虑造轮子
要重复劳动的数据处理才造轮子
程序员的贡献就是用轮子省去了重复的劳作,把工作丢给了电脑
G***G
发帖数: 16778
27
来自主题: Programming版 - wpf: 自定义命令command
在wpf中,我有个问题,为什么我们要自定义command?
比如:点击一个button,弹出一个对话框。
我们可以在系统提供的命令中实现,比如:NEW,HELP, CUT, PASTE, COPY
等。
那如果这样的,可以在设定一个button的command为NEW,
但是在New的执行代码里面,不写输入新文本的,而是让这个NEWcommand
进行别的,比如拷贝文字等。
或者说在new command里面进行一些数据处理。
这样,我们进行数据处理,就不需要自定义command了,用系统自带的NEW就可以了。
那为什么我们还要自定义command呢?
z****e
发帖数: 54598
28
来自主题: Programming版 - oop还是跟fp是对立的
你想说的是parametric polymorphism吧
也就是通过不同类型的class塞入方法参数,从而调用不同的方法吧?
这个还是需要通过源代码来修改
无论你怎么写,这个go方法你还是需要增加一部分新代码来配合你新增的那个class
随着class的增加,你的这个go方法会越发地膨胀
所以最后你会发现,还不如干脆全部map和list掉算了
为什么fp经常被用来做数据处理呢?
因为数据处理的class很少,几乎都是数字,不需要怎么描述性质的东西
比较容易搞,你要是不信,我们具体例子具体分析
从例子来说
m***r
发帖数: 359
29
来自主题: Programming版 - Python日报 2015年3月楼
Python日报 2015-03-08
@好东西传送门 出品, 过刊见
http://py.memect.com
订阅:给 h*[email protected] 发封空信, 标题: 订阅Python日报
更好看的HTML版
http://py.memect.com/archive/2015-03-08/short.html
1) 【Python中的默认参数】 by @Python开发者
关键词:基础
《Python中的默认参数》文本介绍了Python中的默认参数,作者从自己的经历中总结了
Python默认参数的使用中,易犯的错误。通过本篇文章可以深入掌握Python默认参数的
细节。 [1] ( @XX含笑饮砒霜XX 译,欢迎加入翻译组: [2] )
[1] http://python.jobbole.com/81105/
[2] http://www.jobbole.com/groups/6/
2) 【Python的Twitter情感预测工具】 by @路遥_机器学习
关键词:资源, 课程
和小伙伴 @黑皮肖特 用Python做个了基于CNN的Twitter Sentiment Predic... 阅读全帖
w***g
发帖数: 5958
30
来自主题: Programming版 - 从心底讨厌scala
目前的几个大数据处理的不都是jvm的?scala还是有它的market的,不然怎么会有vc给
投钱?
这个就是牛人影响历史的例子。如果有个更牛的用basic写出来一个比spark更牛的轮子,
用basic的人自然会多。当年google的gfs/mapreduce如果开源了,根本就不会有hadoop
啥事,也就不会有后来java在大数据处理上称王称霸的现状。在我看来,java跟basic
基本上就是一个水平。
d*******r
发帖数: 3299
31
来自主题: Programming版 - 大牛们,请教大数据系统如何架构
请教,这个 processing server(data pre aggregation) 是指初步的数据处理吧?
比如这些ID来的数据,每分钟 aggregate 一次,有些fields去掉,可能有用的fields
保留.
这一步需要的数据处理能力很小, 不用轮子,基本手写点简单的逻辑就行?

streaming
k***5
发帖数: 393
32
主要是数据处理, 计算, plot, 有时候需要编译一下给非技术人员使用。
平时主要用c++和matlab。前者写得慢, 数据处理和plot都麻烦。后者太贵了,什么包都
要license, 而我们用network license, 有时候人太多了就不能checkout了。
G*****5
发帖数: 30
33
我目前在家看娃(不到2岁),已不年轻. 有国内数学本科文凭和美国计算机硕士文凭, 在
做RA时做一些数据处理和分析的工作,且有约2年的软件工程师的在美工作经验.目前我
打算开始找工作,但不知道路在何方.我有两年多的工作GAP,对纯编程既太擅长又不太感
兴趣.想找个用些编程,用些数据处理的工作. 不知道该学些什么新东西,考哪些证书才
能使自己更有竞争力. 恳请各位前辈指点迷津. 谢谢!
l****z
发帖数: 29846
34
来自主题: Accounting版 - 请问什么叫ACL DATA MINING?
这个, 只要数据行不超过100万,Excel有什么不嫩处理的? 另外实在数据大了, 其实
Acces也可以用啊.
另外, ACL虽然号称可以处理无限的数据, 但一旦数据量大了, 处理起来根本不行. 曾
经要把一个工厂每天的存货进出数据倒到ACL里面去,整整一年的数据, ACL几个小时都
没有搞定, 最后只好放弃, 换Access了. 呵呵.
还有就是ACL后期数据处理很麻烦, 我前面举的例子就是,发现两千多个重复items, ACL
里面根本没有办法处理了, 因为它就显示了有两千个重复在一个表上, 然后你没有办法
做其他的数据处理了. 最后还是回到Excel搞定.
用VBa主要是通用性的问题, 因为原来懂VBA的人可以马上上手, 象IDEA就比较聪明,
script语言选用了VBA. 主要是ACL出来比较早,当时好像VBA还不流行,不过现在可以改
啊.

table
z********c
发帖数: 1268
35
如果你学的不是生统或者计算生物/系统生物学,我建议你有机会弄点数据处理的经验
,简历会上好看很多。
否则简历上通篇都是传统生物学相关的背景和技能,很难说服别人你真的对精算感兴趣
。而且换专业的话,“为什么选择精算”这是个必问的面试问题,你有些数据处理的背
景也好扯一下。
z********c
发帖数: 1268
36
如果你学的不是生统或者计算生物/系统生物学,我建议你有机会弄点数据处理的经验
,简历会上好看很多。
否则简历上通篇都是传统生物学相关的背景和技能,很难说服别人你真的对精算感兴趣
。而且换专业的话,“为什么选择精算”这是个必问的面试问题,你有些数据处理的背
景也好扯一下。
h**********n
发帖数: 279
37
来自主题: Aviation版 - “中国第一幅月图”如何诞生
第一幅月图是由中国科学院西安光机所负责研制的CCD立体相机在距离月球表面
200公里的 轨道上,通过推扫拍摄,图像数据传回后,由地面应用系统进行处理,
制作完成。
从11月20日开始,嫦娥一号卫星搭载的CCD立体相机开机工作。拍摄时,在
同一台相机中采集了前视、下视和后视三幅图像。
拍摄获得的图像通过卫星上由中国科学院空间中心研制的有效载荷数据处理系统存
储、编码,然后传送到卫星发射机,通过定向天线向地球发送,位于北京密云和云南昆
明的国家天文台的两个地面数据接收站负责数据的接收,再传送到国家天文台北京总部
进行数据预处理和进一步的加工,包括拼接、校正和三维图像的合成,得到现在所看到
的图像。
此次公布的第一幅月图,共对19条卫星轨道探测图像进行拼接。
国防科工委有关人士表示,嫦娥一号获取并公布的图像质量非常好,完全符合设计
要求,表明从相机拍摄一直到地面数据处理都非常成功,这也标志着科学探测活动的正
式开始。
p*l
发帖数: 1359
38
来自主题: Biology版 - 业内人士来说说single molecule吧
这要看你想做到什么程度了。理工背景的人做这个,上手快,但是提不出来生物问题,
就只能做显微镜操作员,给人扫数据处理数据。所以理工背景的人想在这上面出头,必
须做新方法。做新方法,要求就很高了,是条回报高但是白骨累累的路。
生物背景的人做这个,得能自己调仪器和编程处理数据。其实有时候数据处理的猫腻很
大,伪造数据和好的处理,只有一线之隔。

single
了.
L*******a
发帖数: 293
39
这个说的很中肯。
需要一个做数据处理的工具,脚本语言perl/python是好选择。
需要一个做统计处理,批量画图的工具,R是好选择。
补充一点,数据处理要scale-up的时候,还需要懂些基本的shell script。
m********e
发帖数: 5088
40
【 以下文字转载自 Military 讨论区 】
发信人: alone40 (alone40), 信区: Military
标 题: [原帖1st更新]-【原创:8年、一个生物WSN的蜕变记】
发信站: BBS 未名空间站 (Wed Sep 24 17:50:53 2014, 美东)
************************
第一次更新,在原帖的后面。
谢谢各位网友的评论。我是一个曾经被绝望逼到死角,没有妥协而最终强行杀出了一条
歪路的人。过去的很多事情历历在目,一写就感觉停不下来。很多事情有太多的细节,
写多了怕啰嗦,写少了又怕别人看得糊涂。知道我所有事情的人其实不算多,如果有当
初在美国的朋友看到了,那么你们也可以从这篇文章里知道很多我回国以后的事(包括
回国之前的事)。没能跟你们常联系感觉很遗憾,但我也有太多事不是简单的几句话所
能说清楚的。。
************************
前一段时间翻墙看到mitbbs上各种征文,网友们回忆在美国的8年、10年经历,当时很
有感触,很想也跟着发个帖子,但还是因为各种事情放下了。最近却突然经常回想起过
去的很多事情,... 阅读全帖
a********t
发帖数: 169
41
来自主题: Biology版 - 求教-生物统计怎么样
从生物转到生物统计了,主要做编程方面的。快毕业正在找工作。就职业发展来说,想
知道以后找工作是找生统类的好,还是干脆全转统计、数据处理方面的好?
生物统计类的工作,还算是科班,会不会对以后升职加薪什么的有利;缺点是招人的职
位比较有限。
纯统计、数据处理方面工作机会多,缺点是学的生物背景基本上完全没用了,不知道对
以后职业发展是不是个限制。。
求过来人指点一二
t**m
发帖数: 158
42
来自主题: Biology版 - 对话施一公及其团队
看一作小姑娘讲的,的确真够拼的啊!
发信人: feimeng (梧桐树,三更雨,不知多少春秋), 信区: TsinghuaCent
标 题: 对话施一公及其团队:世界级难题是如何破解的
发信站: 水木社区 (Mon Aug 24 13:15:21 2015), 站内
8月21日凌晨,一位德国同行的电话,打乱了清华大学生命科学学院院长施一公的工作计
划。这位德国同行,刚刚看到了《科学》在线发表的施一公团队撰写的两篇关于剪接体
结构及其工作机理的研究长文。
这几天,有关施一公的“新闻”不断。6天前的8月18日,他的研究团队刚刚在《自然》
在线发表了一篇研究长文,首次揭示了分辨率高达3.4埃的人体γ-分泌酶的电镜结构,
为理解阿尔茨海默症的发病机理提供了重要基础。翌日,他拟任清华大学副校长的任命
,进入公示期。
然而,这一次,施一公说,这两篇论文带给他的兴奋,超出了过去25年科研生涯的总和

21日中午,记者第一时间赶到清华大学,与施一公和他的3名85后团队成员展开了一场对
话。
“不可能完成的任务”
记者:剪接体结构解析被公认是结构生物学领域的终极难题,你们是如何完成这看似“
不可能完... 阅读全帖
t**m
发帖数: 158
43
来自主题: Biology版 - 对话施一公及其团队
看一作小姑娘讲的,的确真够拼的啊!
发信人: feimeng (梧桐树,三更雨,不知多少春秋), 信区: TsinghuaCent
标 题: 对话施一公及其团队:世界级难题是如何破解的
发信站: 水木社区 (Mon Aug 24 13:15:21 2015), 站内
8月21日凌晨,一位德国同行的电话,打乱了清华大学生命科学学院院长施一公的工作计
划。这位德国同行,刚刚看到了《科学》在线发表的施一公团队撰写的两篇关于剪接体
结构及其工作机理的研究长文。
这几天,有关施一公的“新闻”不断。6天前的8月18日,他的研究团队刚刚在《自然》
在线发表了一篇研究长文,首次揭示了分辨率高达3.4埃的人体γ-分泌酶的电镜结构,
为理解阿尔茨海默症的发病机理提供了重要基础。翌日,他拟任清华大学副校长的任命
,进入公示期。
然而,这一次,施一公说,这两篇论文带给他的兴奋,超出了过去25年科研生涯的总和

21日中午,记者第一时间赶到清华大学,与施一公和他的3名85后团队成员展开了一场对
话。
“不可能完成的任务”
记者:剪接体结构解析被公认是结构生物学领域的终极难题,你们是如何完成这看似“
不可能完... 阅读全帖
f***e
发帖数: 332
44
来自主题: Biology版 - 冷冻电镜技术龙虎榜zz
http://www.jianshu.com/p/baa30697fc6a
什么是2015年最受科学界关注的新技术?
图片来自:nature.com
导语:
每年的岁末年初,《自然》杂志旗下子刊《自然·方法》(Nature Methods)都会盘点
当年的年度科学技术。2015年最受关注的技术为冷冻电镜技术(cryo-EM),此前呼声
很高的CRISPR/Cas9基因编辑技术未能折桂。
在冷冻电镜的这场技术革命中,华人科学家功不可没,在某些方面甚至独领风骚,做出
了诸多重大成果。
文 |张凯(剑桥大学MRC分子生物学实验室博士)
●●●
细胞里面的生命活动井然有序,每一个部分都有其特定的结构,承担不同的功能。生物
大分子则是一切生命活动的最终执行者,它们主要是核酸和蛋白。核酸携带了生命体的
遗传信息,而蛋白是生命活动的主要执行者。自现代分子生物学诞生以来的半个世纪里
,解析和分析生物大分子的结构、进而阐释其功能机制一直都是现代生命科学的核心问
题之一。
事实上,一切自然科学都涉及物质结构及结构间的相互作用为核心的研究方向,天文学
研究宇宙、星体等的结构及其相互作用,粒子物理研究物质世界... 阅读全帖
o*****p
发帖数: 2977
45
https://zhuanlan.zhihu.com/p/21760484?refer=zhishifenzi
“它的确是一个世界级的工作”:中国科学家发明了什么?
饶毅
编者按:
人的大脑大约有1000亿个神经元,它们如何连接以及错误的连接产生何种问题,一直是
人类认知的黑洞。最近,《自然·通讯》杂志发表了华中科技大学骆清铭研究团队的一
种称为全脑定位系统的全自动显微成像方法,这项技术有望帮助基础神经科学和临床研
究者们最终绘制一个完整脑的神经连接地图,被中外科学家视为”世界一流的工作“。
欧美日在数年前纷纷启动了自己的脑计划,脑科学正处在重大突破的前夜,尽管中国脑
计划尚未上线,但注定要在这一领域扮演重要角色。
撰文 | 叶水送
责编 | 徐可
● ● ●
莎士比亚笔下的哈姆雷特有一句旷世名言:To be or not to be,that's the
question。如同哈姆雷特一样,我们也经常处在这种犹豫、纠结的状态。人以及其他认
知水平较高的动物,之所以会有这种复杂的情感,这与我们大脑的认知有关。
事实上,对音乐的感知也与大脑有关。在出生之前,我们就能对音乐进行感知,不同旋... 阅读全帖
h***w
发帖数: 578
46
来自主题: ChemEng版 - 各位大侠教我用气相色谱吧
小弟我从未用过气相色谱,由于工作需要,老板入手一台岛津的老古董gc-8a,色谱柱
是silica column,配的数据处理是岛津的r-c8a。小弟主要是分析co2, ch4, n2的混合
气,请问大侠们injector temp. 还有column temp 该怎么设定。小弟瞎设的是入口
200degree c, colume恒温150degree c. 结果测出来的就是一条直线,但是计算结果却
显示了3个峰,请问大侠,这是因为我的温度设置的不好,还是我的数据处理参数设计
的不好?另外计算结果显示的三个峰的面积,他们的比值是不是就应该是混合气的组分
?小弟公司里面没人懂gc,叫岛津过来教,又要花钱,请大侠们帮帮忙吧。
G*****5
发帖数: 30
47
我目前在家看娃(不到2岁),已不年轻. 有国内数学本科文凭和美国计算机硕士文凭, 在
做RA时做一些数据处理和分析的工作,且有约2年的软件工程师的在美工作经验.目前我
打算开始找工作,但不知道路在何方.我有两年多的工作GAP,对纯编程既太擅长又不太感
兴趣.想找个用些编程,用些数据处理的工作. 不知道该学些什么新东西,考哪些证书才
能使自己更有竞争力. 恳请各位前辈指点迷津. 谢谢!
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)