由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - interview questions about data management
相关主题
贡献SAS Programmer 面试问题并求答案关于proc sql left join的一个问题
请教一个sas求和的问题[合集] 如何检验normality??
[合集] 讲讲最近来我们公司面试的一个小姑娘吧问个proc univariate 打印的问题
HOW TO UPDATE DATA BY STRATUM做药厂工作最常用的统计知识技术是什么?
请教一个用SAS作DATA MERGE的问题How to get summary statistics from multiple imputed data sets
关于merge data的问题!!!odd resulted graph from PROC UNIVARIATE (histogram) results
请教一个看起来挺简单但我怎么也弄不出来的sas程序healthcare data analyst, 电面准备啥呐?
请教一下R的Data Manipulationproc sql: find 4 highest and mean, median
相关话题的讨论汇总
话题: data话题: management话题: proc话题: 数据话题: excel
进入Statistics版参与讨论
1 (共1页)
c*********n
发帖数: 87
1
最近几个面试都提到data management,希望高人指点我一下。
一般的问题都是你在哪里得到这个数据,如果处理这个数据的。
我就我仅有的一点点经验是这样说的: 我从网上download数据,用excel或者是proc
sql进行处理,例如merge,delete, insert,clean missing data, 然后创造data
sets。
有两个面试都是涉及data management,他们用到的data analysis都比较少。而我基本
上没有接触过data management,都是data analysis,搞的我很迷茫啊。
请问他们问这类题的目的在哪里,他们想要的data management的经验是什么呢?
data management的范围太广,网上查了查,也没有啥资料是可以让我系统的学习的,
我从哪里开始学点啥,哪些是我必须知道的呢?
欢迎大家讨论。
c*********n
发帖数: 87
2
只有看,没有回复的啊,为什么?至少冒个泡吧!!

【在 c*********n 的大作中提到】
: 最近几个面试都提到data management,希望高人指点我一下。
: 一般的问题都是你在哪里得到这个数据,如果处理这个数据的。
: 我就我仅有的一点点经验是这样说的: 我从网上download数据,用excel或者是proc
: sql进行处理,例如merge,delete, insert,clean missing data, 然后创造data
: sets。
: 有两个面试都是涉及data management,他们用到的data analysis都比较少。而我基本
: 上没有接触过data management,都是data analysis,搞的我很迷茫啊。
: 请问他们问这类题的目的在哪里,他们想要的data management的经验是什么呢?
: data management的范围太广,网上查了查,也没有啥资料是可以让我系统的学习的,
: 我从哪里开始学点啥,哪些是我必须知道的呢?

d*******o
发帖数: 493
3
你用的是SAS?
c*********n
发帖数: 87
4
是的。是不是用R啊?你用的啥呢?讲讲你的经验吧。

【在 d*******o 的大作中提到】
: 你用的是SAS?
A*******s
发帖数: 3942
5
这个问题太general了啊。像我这种水平一般的没能力回答,大牛们也没时间写一个
comprehensive review。
以我有限的interview经验,这方面相关的问题有
1. read data. 包括一些data step,proc import的细节,怎么读excel文件,怎么读
access里的数据。
2. data cleansing. 比如说怎么发现typo,用什么proc找outlier,extreme value
3. merge in data step and proc sql.
4. data query操作。
....
这个问题真是包罗万有,因为entry level sas programmer 99%的工作内容就是这个。
我觉得你把sas base里的内容搞明白了,再加上adv里的proc sql,基本就cover大部分
了。

【在 c*********n 的大作中提到】
: 最近几个面试都提到data management,希望高人指点我一下。
: 一般的问题都是你在哪里得到这个数据,如果处理这个数据的。
: 我就我仅有的一点点经验是这样说的: 我从网上download数据,用excel或者是proc
: sql进行处理,例如merge,delete, insert,clean missing data, 然后创造data
: sets。
: 有两个面试都是涉及data management,他们用到的data analysis都比较少。而我基本
: 上没有接触过data management,都是data analysis,搞的我很迷茫啊。
: 请问他们问这类题的目的在哪里,他们想要的data management的经验是什么呢?
: data management的范围太广,网上查了查,也没有啥资料是可以让我系统的学习的,
: 我从哪里开始学点啥,哪些是我必须知道的呢?

n********6
发帖数: 1511
6
补充一下:

access里的数据。
- read data from .txt, .dat
2.5:data manipulation.
- 04/12/2010, April 12, 2010变成一致
- F/M, Female/Male, 1/0变成一致
3.5 data mapping
- 把每天,周,月新的记录添加到production database/dataset,或者扣减
4.5 reporting /graph

【在 A*******s 的大作中提到】
: 这个问题太general了啊。像我这种水平一般的没能力回答,大牛们也没时间写一个
: comprehensive review。
: 以我有限的interview经验,这方面相关的问题有
: 1. read data. 包括一些data step,proc import的细节,怎么读excel文件,怎么读
: access里的数据。
: 2. data cleansing. 比如说怎么发现typo,用什么proc找outlier,extreme value
: 3. merge in data step and proc sql.
: 4. data query操作。
: ....
: 这个问题真是包罗万有,因为entry level sas programmer 99%的工作内容就是这个。

w*****e
发帖数: 806
7
3x a lot!! 很详细啊。。赞。。

【在 n********6 的大作中提到】
: 补充一下:
:
: access里的数据。
: - read data from .txt, .dat
: 2.5:data manipulation.
: - 04/12/2010, April 12, 2010变成一致
: - F/M, Female/Male, 1/0变成一致
: 3.5 data mapping
: - 把每天,周,月新的记录添加到production database/dataset,或者扣减
: 4.5 reporting /graph

c*********n
发帖数: 87
8
哇塞,吃了个晚饭,就这么多回复,感激不尽。 谢谢各位!
w*********y
发帖数: 7895
9
这个问题我GOOGLE过.和你说的差不多. 说白了就是把数据弄成好分析的
数据模式.
不过,DATA CLEANSING到是涉及一些很复杂的方法. 要用比较复杂的PROC来看
数据问题.
还有就是MERGE DATA的问题, 会涉及到如果碰到无法MERGE的情况,原因是什么,
怎么解决的.

【在 A*******s 的大作中提到】
: 这个问题太general了啊。像我这种水平一般的没能力回答,大牛们也没时间写一个
: comprehensive review。
: 以我有限的interview经验,这方面相关的问题有
: 1. read data. 包括一些data step,proc import的细节,怎么读excel文件,怎么读
: access里的数据。
: 2. data cleansing. 比如说怎么发现typo,用什么proc找outlier,extreme value
: 3. merge in data step and proc sql.
: 4. data query操作。
: ....
: 这个问题真是包罗万有,因为entry level sas programmer 99%的工作内容就是这个。

w*********y
发帖数: 7895
10
MM不错啊,这么快就有这么多面试了. 我有时候看INDEED.COM,都没有
发现什么新的职位.我指SAN DIEGO区了.

【在 c*********n 的大作中提到】
: 最近几个面试都提到data management,希望高人指点我一下。
: 一般的问题都是你在哪里得到这个数据,如果处理这个数据的。
: 我就我仅有的一点点经验是这样说的: 我从网上download数据,用excel或者是proc
: sql进行处理,例如merge,delete, insert,clean missing data, 然后创造data
: sets。
: 有两个面试都是涉及data management,他们用到的data analysis都比较少。而我基本
: 上没有接触过data management,都是data analysis,搞的我很迷茫啊。
: 请问他们问这类题的目的在哪里,他们想要的data management的经验是什么呢?
: data management的范围太广,网上查了查,也没有啥资料是可以让我系统的学习的,
: 我从哪里开始学点啥,哪些是我必须知道的呢?

相关主题
关于merge data的问题!!!关于proc sql left join的一个问题
请教一个看起来挺简单但我怎么也弄不出来的sas程序[合集] 如何检验normality??
请教一下R的Data Manipulation问个proc univariate 打印的问题
进入Statistics版参与讨论
A*******s
发帖数: 3942
11
cleansing这个要case by case了,你能不能举个例子说说你遇到的问题需要用什么
proc?
我在interview举的例子是drug name,多于1million rows的数据,一百多个drug name
,但是有很多是typo,而且我没有一个正确的drug name list。我说我的cleansing方
法是proc freq,看看哪些drug出现的频率特别少,再自己判断是不是typo。

【在 w*********y 的大作中提到】
: 这个问题我GOOGLE过.和你说的差不多. 说白了就是把数据弄成好分析的
: 数据模式.
: 不过,DATA CLEANSING到是涉及一些很复杂的方法. 要用比较复杂的PROC来看
: 数据问题.
: 还有就是MERGE DATA的问题, 会涉及到如果碰到无法MERGE的情况,原因是什么,
: 怎么解决的.

w*********y
发帖数: 7895
12
我没有经验啦。因为我找工作的时候,看到有DATA MANAGEMENT总是出现,
就GOOGLE了一下相关的东西。找到一些DATA CLEANSING的文章,上面提到
稍微复杂的方法。
我记忆中,你提到的这个是比较常用来检查TYPO的。还有用PROC UNIVARIATE来
检查TYPO。还有就是用那些什么SAS FUNTION来检查的,还有各种GRAPH图像之类的。

name

【在 A*******s 的大作中提到】
: cleansing这个要case by case了,你能不能举个例子说说你遇到的问题需要用什么
: proc?
: 我在interview举的例子是drug name,多于1million rows的数据,一百多个drug name
: ,但是有很多是typo,而且我没有一个正确的drug name list。我说我的cleansing方
: 法是proc freq,看看哪些drug出现的频率特别少,再自己判断是不是typo。

c*********n
发帖数: 87
13
没有SD的面试,都是附近的地方吧,不过都光荣的挂掉了,也没有啥开心的。而且面玩
一个就颓废3天,这个状态是极其的不好啊,现在光想着快点毕业走人啊。
看到你还不挺的学习我就惭愧啊,非常的惭愧。

【在 w*********y 的大作中提到】
: MM不错啊,这么快就有这么多面试了. 我有时候看INDEED.COM,都没有
: 发现什么新的职位.我指SAN DIEGO区了.

r********3
发帖数: 2998
14
我不是学统计的,我是学数据库的。
我觉得,你们应该从database角度来回答。需要data management的通常都是很重要,
很大的数据集。这个时候,你提都不要提到excel。如果对方是一个真正做data
management的DBA,你一提excel, access这些多半就挂了。做data management的DBA,
平时主要都是跟Oracle的PLSQL等打交道,excel那些东西在他们面前显得太naive了。
我觉得应该是如何设计关系数据表,schema,建立index啊,还有就是触发器啊,存储
过程啊。还有table的分页存储查询这些。

【在 c*********n 的大作中提到】
: 最近几个面试都提到data management,希望高人指点我一下。
: 一般的问题都是你在哪里得到这个数据,如果处理这个数据的。
: 我就我仅有的一点点经验是这样说的: 我从网上download数据,用excel或者是proc
: sql进行处理,例如merge,delete, insert,clean missing data, 然后创造data
: sets。
: 有两个面试都是涉及data management,他们用到的data analysis都比较少。而我基本
: 上没有接触过data management,都是data analysis,搞的我很迷茫啊。
: 请问他们问这类题的目的在哪里,他们想要的data management的经验是什么呢?
: data management的范围太广,网上查了查,也没有啥资料是可以让我系统的学习的,
: 我从哪里开始学点啥,哪些是我必须知道的呢?

A*******s
发帖数: 3942
15
excel,access这些东西,是在保险和银行里面大量应用的。
可以试试在monster,CareerBuilder上搜搜这些关键词的组合 statistics excel/
spreadsheet

【在 r********3 的大作中提到】
: 我不是学统计的,我是学数据库的。
: 我觉得,你们应该从database角度来回答。需要data management的通常都是很重要,
: 很大的数据集。这个时候,你提都不要提到excel。如果对方是一个真正做data
: management的DBA,你一提excel, access这些多半就挂了。做data management的DBA,
: 平时主要都是跟Oracle的PLSQL等打交道,excel那些东西在他们面前显得太naive了。
: 我觉得应该是如何设计关系数据表,schema,建立index啊,还有就是触发器啊,存储
: 过程啊。还有table的分页存储查询这些。

c*********n
发帖数: 87
16
说数据库的这位也挺有道理,不过个人认为是针对DBA的。data management in
statistics只是和DBA打交道,而不是做DBA,或者说是用数据库的东西,而不是如何建
数据库。Actuaries说的处理excel,access应该是常见的。

【在 A*******s 的大作中提到】
: excel,access这些东西,是在保险和银行里面大量应用的。
: 可以试试在monster,CareerBuilder上搜搜这些关键词的组合 statistics excel/
: spreadsheet

r********3
发帖数: 2998
17
对啊。
虽然做分析的很多是拿到报表啊,中间文件来做,但是这个跟data management是两回
事。如果从data management来考虑,excel那些的确很navie。
数据库领域研究data management很多年了,在excel诞生之前就已经研究很多成果了。
既然大家都是做数据,面试的时候知道真实大规模数据是如何存储,如何读取,如何写
入,同步互斥这些基本问题还是应该了解一下。
这个MM面试的似乎是DBA。

【在 c*********n 的大作中提到】
: 说数据库的这位也挺有道理,不过个人认为是针对DBA的。data management in
: statistics只是和DBA打交道,而不是做DBA,或者说是用数据库的东西,而不是如何建
: 数据库。Actuaries说的处理excel,access应该是常见的。

1 (共1页)
进入Statistics版参与讨论
相关主题
proc sql: find 4 highest and mean, median请教一个用SAS作DATA MERGE的问题
请教如何做一个类似 boxplot 的图, 包子酬谢关于merge data的问题!!!
SAS model 一个简单的问题。请教一个看起来挺简单但我怎么也弄不出来的sas程序
急,ENTRY LEVEL SAS PROGRAMER明天On-site,需要注意什么啊请教一下R的Data Manipulation
贡献SAS Programmer 面试问题并求答案关于proc sql left join的一个问题
请教一个sas求和的问题[合集] 如何检验normality??
[合集] 讲讲最近来我们公司面试的一个小姑娘吧问个proc univariate 打印的问题
HOW TO UPDATE DATA BY STRATUM做药厂工作最常用的统计知识技术是什么?
相关话题的讨论汇总
话题: data话题: management话题: proc话题: 数据话题: excel