由买买提看人间百态

topics

全部话题 - 话题: imputing
首页 上页 1 2 3 4 5 6 7 8 9 (共9页)
e**p
发帖数: 4259
1
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
老板在我休假的时候,招了个Dr.PH in biostatistics,印度人,是那种带有方向(
southern之类的)的学校毕业的,不知道是州立的还是community college,我没有参加
面试。
她上班第一天,我问她会什么,说dissertation做的是missing data, 比较normal
distribution,chisq distribution, T distribution data,用multiple imputation
的方法来做,有啥优缺点。。。然后问她,用什么软件做的,她说用的是SAS,data哪
来的,simulate的,时间关系,我没有继续问她毕业论文的问题
然后问她,除了SAS,会其他软件么?说会R,我问,会METLAB,C++等么,回答“不会
”,然后继续问,会unix,linux操作系统么,回答'不会';然后继续问,SAS会macro么
,不会;sql呢,她问,是不是sequence?
我继续问,知道prediction model么,说不知道,一脸茫然,然后给她提示,说天气预
报的预测模型;还是一脸茫然,然后给她讲breast c... 阅读全帖
A*******s
发帖数: 3942
2
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
"是那种带有方向(southern之类的)的学校毕业的"
校际坑啊,南加大,西北大学,华(东/南/西/北)(工/师/农)校友们纷纷中枪...
你说的不会是西太平洋大学吧?

imputation
g********n
发帖数: 4054
3
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
休假也可以Skype电面啊, 你老板怎么。。。。

imputation
T*******I
发帖数: 5138
4
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
在很多人看来,统计学的水太深了,而一些人则搅混了这趟深水,令很多人望而却步。
其实,统计学原本是一件简单的事情,就是按照某种哲学思维解决关于认识世界的问题
。这也就是说,任何一个从事某一领域(例如天文、气象、物理、化学、 生物、政治
、经济、教育、医学、农学、体育,等等,当然,搞经典式纯数学的人可以被除外)的
研究和探索的人都应该是一个统计学家。
会不会unix,linux或者METLAB,C++都不重要。在一般情况下,SAS的语言、函数库和统
计模块等的综合应用可以为构建新的统计算法提供充分的解决方案。根据个人经验,
SAS的MACRO在构建新统计方法时是用得很多的,可以节省大量的时间和空间。
你问她“知道prediction model么?”我想如果你问题“知道regression model么”,
她应该会回答说知道。至于对估计的model参数的validation,这个问题我在此前和版上
的几位大佬们有过切磋。我的一个基本观点是,统计学应该是尽可能用全部的数据(即
从外部世界获得的全部经验事实)建立结论体系,而不是从已经得到的全部经验事实中
再随机地抽取一部分建立模型,然后用剩... 阅读全帖
p********6
发帖数: 1339
5
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
虽然不知道prediction model让人感觉比较意外,尤其还是做multiple imputation的
,但是问PhD会不会SAS,SQL,MATLAB实在是有点不合适。如果你把这个的问题拿来问
全美前十名生统系的博士毕业生,至少一半人会告诉你说不会。
l*******o
发帖数: 5673
6
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
southern methodist university?

imputation
d******e
发帖数: 7844
7
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
其实这种面试应该先问做什么,懂什么,然后找找交集,再问具体问题。

imputation
x***4
发帖数: 1815
8
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
你应该问老印的Dr.PH是什么样的一个水平?
说实话,搞统计的,没理由没听过sql的;看她的论文也没多少新意,估计她technical
能力也不强。但是小心她在你背后搞事。老印最善于混organization。以后她每次开会
都争写meeting minute,没多久你老板就可能通过她管理你了。

imputation
w********n
发帖数: 361
9
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
这中英夹杂看得真累.贼累.

imputation
a****a
发帖数: 3411
10
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
too mean

imputation
h******s
发帖数: 3420
11
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
dr.ph is for epidemiologist
what kind of job u r doing?

imputation
u*******g
发帖数: 1808
12
来自主题: Statistics版 - 生统的Dr.PH是什么样的一个水平?
第一次听说research用sas作
也许牛人真的能行,但是macro不会的牛人,我就彻底晕了

imputation
t**u
发帖数: 1572
x**g
发帖数: 807
14
你可以在Excel里把小点.转化成999,然后再SPSS在Variable View里将999 标示成缺失。
missing values中三个选项: exclude cases listwise/
exclude cases pairwise/
report values
都不是最好的处理缺失数字的办法,会导致不同程度的误差。根据你的数据分析模型,
你可以采用multiple imputation 或者Maximum Likelihood处理缺失数据。

listwise
pairwise
x******a
发帖数: 6336
15
A question regarding using PCA to capture the pairwise covariance matrix.
Suppose I have 10 times series and 250 data point for each time series in
the format of a matrix. Let's call it A of shape 10*250,Let us call the
covariance matrix COV and it is a 10*10 nonnegative defined matrix.
I would like to capture this matrix COV with a one-factor model,
0.Is PCA the right direction on this?
1.Assuming 0. is right. We find the largest eigenvalue lamdbda_M and the
correponding vectors v_M of COV. The... 阅读全帖
t*****a
发帖数: 459
16
来自主题: Statistics版 - regression的问题:怎么处理bad data
数据如果知道是错的,那肯定不能用了,那就是没有数据。如果想要把那个空子填上,
就可以根据数据的总体特征做imputation,这个是否用得着也得看具体情况。
怎么知道是错的数据,要看业内标准。简单的检查方法是把所有的variable做一个
summary statistics表格,continuous variable列出min, max mean, std, median,
q1, q3等等,categorical variable列出各项%,然后由了解数据的人检查是否有一眼
看就不对的(比如不该有负数但min是负数)。
不懂股票。看看业内人士怎么说。
l*****t
发帖数: 8319
17
来自主题: Statistics版 - model validation 工作前景如何?
就算是只做logistic。。你总要用varclus吧。。。总要做Bayesian impute missing吧
。。
i***m
发帖数: 148
18
proc mianalyze
n******u
发帖数: 79
19
Thanks iamum
m*******t
发帖数: 168
20
准备明年毕业,不知道找哪方面的工作比较合适,请大牛们给个建议。 拍砖也非常欢
迎。
本人有两年分析genetics data的RA经验, 包括Preprocess and analysis gene
expression data, 1000 Genomes imputation, GWAS, Meta-analysis, gene-based/
region-based test 等。
毕业论文是用Bayesian 方法分析 survival data (clinical trial).
现在感觉外境很尴尬,clinical trial或者gentics方面的背景都不强。 如果找
genetics方面的工作吧,没有一作的paper,没有自己建立的方法。 找 clinical
trial 的工作吧,有paper, 但是SAS又不熟,没有工作经验。
求大家帮忙定位。
谢谢了。。。。
a**u
发帖数: 59
21
来自主题: Statistics版 - Biostatistician position
The Mid America Heart Institute at Saint Luke’s Hospital is seeking a PhD
biostatistician to join its nationally recognized cardiovascular research
program. This non-academic position will:
• Provide statistical support for research & publication activities
across various studies & registries
• Actively collaborate with researchers and study teams on new
studies, including design, planning, study operations, data validation and
preparation, analysis and presentation of results... 阅读全帖
j*****y
发帖数: 26
22
如果是Fresh PhD, 做的就是这些方向,行。Sampling的基本方法,基本的pitfalls比
如non-response,需要理解的比较透彻。Imputation也需要能扯上见解。
Fresh PhD,做的不是这个方向,但是上过课(比如Sampling: desgin and Analysis,
Author Sharon Lohr或者类似)或者做过类似project,另外基本功扎实(regression,
design of experient),最好有实习经验,也行。
不是Fresh, 有这方面的丰富经验(最好也是Stats PhD),行。
请把简历发到[email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.leng... 阅读全帖
s***h
发帖数: 26
23
Many thanks!

5%
t*****a
发帖数: 459
24
这个要么你还是先看看他说的是什么吧。
要是但凡有missing data就整个project都扔掉,那这个科研还真麻烦了。
g*****o
发帖数: 812
25
笑死了,你快点去中科院美科院前面举牌子吧,买买提庙太小容不下你
T*******I
发帖数: 5138
26
请先解释一下上楼我要gaetano回答的问题。
g*****o
发帖数: 812
27
你看来有毛用,你自己概念都一团浆糊,我才懒得解释。反正你也听不懂。
我就是无聊的时候嘲笑你惹
T*******I
发帖数: 5138
28
其实, 我已经把我的认识告诉了你, 只是希望你能重复一遍。而你既不愿接受我的认识
, 又不屑于给出你自己的认识, 所以, 你应该没有资格在此问题上继续瞎叫唤, 因为在
学术领域这样做是令人讨厌的。
a***g
发帖数: 2761
29
missing value部分不清楚
如果lasso选不出显著的变量,基本就说明线性model不work
可以用random forest选一下变量,再试试

rate
categorical
g*****o
发帖数: 812
30
你有毛资格进行“学术讨论”?除非崔永元当了科技部长吧,哈哈
g*****o
发帖数: 812
31
i dont care
我爱说不说,你管的着吗?
A*******s
发帖数: 3942
32
哇哈哈哈
p**5
发帖数: 2544
33
来自主题: Statistics版 - missing data 如何处理?
看了一篇文章,好像multiple imputation is very powerful
C****n
发帖数: 58
34
来自主题: Statistics版 - 请教大家面试中SAS PROFICIENCY的问题
我才看到你发到我收件箱里的信。clinical data的特点是1、有些变量比较乱,因为很
多都是医生或者护士用语言描述的内容,没有规范化,所以需要数据分析人员自己去
clean。2、如何处理missing data。很多CRO都在使用Last Observation Carried
Forward来impute missing values,但是FDA在2012年的一篇论文里阐述了LOCF的缺点
,所以你可以和面试官提一下。3、规范化。因为有些clinical data是需要提交给美国
政府的,所以变量的格式有严格的要求,这个不像其它行业。4、大量的医学术语。作
为统计分析师,还是需要了解一定的医学术语和一些基本知识。譬如看到BNP这样的
variable,你可以大概知道什么样的值是outlier。
当然肯定还有其它特点,我现在只能想到这么多。
我觉得你以前处理数据的类型不是clinical没有关系,不是所有现在在clinical行业里
的人一入行开始做clinical data,关键是你要向面试官证明,你可以用SAS处理非常复
杂的数据。如果你们公司已经有了SAS Programm... 阅读全帖
a********4
发帖数: 2
35
感觉只能得到estimated coefficient 的p value,不会有type III fixed effects 的p
value. 我记得我查过,一个文献上是这么说的。
参考这个文章: Combining Type-III Analyses from Multiple Imputations
他们的macro可以combine, 但是貌似是针对anova的,不知道 mixed model 的是否可
以。你要是搞定了,麻烦通告一声,怎么搞定的。 谢了。
s******d
发帖数: 501
36
来自主题: Statistics版 - 包子求帮忙下一篇文章, 谢谢:)
Journal name: The journal of mathematical sociology
Volume 39, Issue 2, 2015
Auxiliary Variables in Multiple Imputation When Data Are Missing Not at
Random
by Sarah Mustilloa* & Soyoung Kwonb, pages 73-91
k*********g
发帖数: 212
37
来自主题: Statistics版 - 谁能帮找几篇papers,预先谢谢
我的邮箱
[email protected]
/* */
非常感谢
paper 1:
Number of imputations needed to stabilize estimated treatment difference in
longitudinal data analysis
K Lu - Statistical methods in medical research, 2014
doi: 10.1177/0962280214554439
Paper 2:
Short notes on maximum likelihood inference for control゜ased pattern﹎
ixture models
Y Tang - Pharmaceutical statistics, 2015,
Volume 14, Issue 5, pages 395–399,
Paper 3:
MMRM versus MI in Dealing with Missing Data—A Comparison Based on 25 NDA
Data Sets
Ohi... 阅读全帖
E**********e
发帖数: 1736
38
谢谢回复。 这个降维现在还用不着。在这个领域内,不是常规做法。而且有很多data
cleaning要处理,比如,missing imputation。
三大信用局的数据,四份之三是垃圾。剩下的2,3百变量中,有些事不重要的。 从中挑
选,如果supervised的话(看response 变量)就会带来bias。
具体做过risk modeling 项目的话, 可能会理解我的问题。
g*****l
发帖数: 424
39
来自主题: Statistics版 - 数据科学之江湖兵器谱 (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
z********n
发帖数: 710
40
我有两组数据(对照人群),现在在control group也需要一个pseudo date (参与时
间),我想用参与组的date来assign date 给对照组,但是我不想随机assign, 想根据
人群的一些基本信息来相应的assign,我想在有点糊涂,不知道应该用什么方法来做?
是不是类似multiple imputation for missing values?
谢谢指点!
w*********y
发帖数: 7895
41
来自主题: DataSciences版 - 看到一个GOOGLE的工作
想看下有没有人可以给我指点一下他家的JOB 要求。。。忘记说了,
这个POSITION是Survey Research Scientist
1. Apply advanced statistical methods
advanced statistical methods 有很多种,不同领域会有不同要求,
google一般是要求什么样的method?
2. Work with large, complex data sets and solve difficult, non-routine
problems.
这个是大概说什么样的WORK,大概指什么样的NON-ROUTINE PROBLEMS。是说数据分析吗?
3. Write RFPs.
给我感觉有些像PRODUCT SPECS。但RFP在政府的TERM中是有些不一样的,是指对
某个GRANT 或者项目的具体要求,非常非常非常具体的要求。我从来没有写过,
但看过不少。 不知道GOODGLE的RFPS指什么类型的?
4. Experience with missing data/imputation, non-response, an... 阅读全帖
z******n
发帖数: 397
42
来自主题: DataSciences版 - 看到一个GOOGLE的工作
不完全懂,但no-response是指问卷调查没有回应,或者某些特定的用户行为没有发生
,比如看到可点击的广告没点击但停留很长时间。这种missing怎么通过partial
information进行imputation
例子是我胡乱举的
r*****t
发帖数: 74
43
来自主题: DataSciences版 - 求handle missing data的好方法
missing rate太大基本没有好方法,很少的话可以直接listwise deletion,有一些而
且考虑estimation的话,可以考虑multiple imputation和full information maximum
likelihood estimation。当然这都是统计模型下的。
m**o
发帖数: 5261
44
来自主题: DataSciences版 - 求书
请教一下不做MISSING VALUE IMPUTATION改成数字的话, 还可以怎么弄?
w*******y
发帖数: 60932
45
来自主题: _DealGroup版 - 【$】32" lg lcd 1080 p 120 hz - $399.99
Costco has the 32" LG LCD for $399.99. This isn't a sale price but I know
that several of the stores are having a hard time keeping them in stock.
The model number is 32LD550. It has 4 HDMI inputs, 2 component imputs and a
2 year warranty. It is 31.5" wide, 19.8" high and 2.9" deep. If you want
to call your store, the costco stock number is (at least on mine) 732550.
d******a
发帖数: 1047
46
来自主题: _PerfectMoms版 - 儿子的第一场baseball 比赛
let me find an on line chinese imput at first
but what is your primary epectation for andy playing baseball?
h*******d
发帖数: 1191
47
来自主题: _BibleStudy版 - 11月罗马书查经 - 第5章
隨稱義而得來的福份:和平、喜樂、盼望、愛(五1~11)
保羅闡明了神稱罪人為義的方法,並且建立了其聖經基礎之後,便列出了一連串福
份,就是那些以信算為義的人自然會得到的祝福。第一項是與神和好。因基督的死,
從前與神處於敵對狀況的人,現在與他相和了。保羅在別處也曾說,神的旨意是要藉基
督「叫萬有……都與自己和好」,而最首要的,是要與那些從前「與神隔絕……心裏與
祂為敵」的人和好(西一20~22)。基督已經成就了這和平,歷世歷代的信徒都親身體
驗到此事實。神已經藉基督使這種和好生效了,祂呼召人來白白領受,享受其權益,與
神相和。
這和平帶來親近神的權益;從前的叛徒不僅得到赦罪,免受刑罰,並且還被賦予神
寵愛的地位──「現在所站的這恩典」。藉基督,他們得以進入蒙恩的地位,同樣,
藉基督,他們也歡歡喜喜地盼望將來的榮耀。和平與喜樂是福音所帶來的雙胞祝福;
曾有一位傳道人說:「和平是喜樂在安息;喜樂是和平在跳舞。」
這裏提到三種喜樂的因素。第一個是榮耀的盼望。第八章對這種榮耀將作更清楚的
描述。神的榮耀是祂創造人類的目的(參三23註釋{\LinkToBook:TopicID=136,Name=A... 阅读全帖
C*****e
发帖数: 367
48
来自主题: _BibleStudy版 - 海德堡要理问答主日21 (转载)
【 以下文字转载自 Church 俱乐部 】
发信人: CCBible (华人基督徒圣经), 信区: Church
标 题: 海德堡要理问答主日21
发信站: BBS 未名空间站 (Fri Apr 13 11:21:38 2012, 美东)
【 以下文字转载自 TrustInJesus 讨论区 】
发信人: CCBible (华人基督徒圣经), 信区: TrustInJesus
标 题: 海德堡要理问答主日21
发信站: BBS 未名空间站 (Fri Apr 13 11:21:28 2012, 美东)
海德堡要理问答主日21
来自CCWiki中国基督徒百科(Godwithus神同在网)
目录
1 英文版
2 英文2011版
3 赵中辉版
4 陈达/王志勇版
5 基督教要义圣经课程版
6 链接参考
英文版
21. Lord's Day
Q. 54.
What believest thou concerning the "holy catholic church" of Christ?
A.
That the Son of God (a)
from the beginning to t... 阅读全帖
C*****e
发帖数: 367
49
来自主题: _BibleStudy版 - 海德堡要理问答主日23 (转载)
【 以下文字转载自 Church 俱乐部 】
发信人: CCBible (华人基督徒圣经), 信区: Church
标 题: 海德堡要理问答主日23
发信站: BBS 未名空间站 (Sat Apr 14 11:45:08 2012, 美东)
【 以下文字转载自 TrustInJesus 讨论区 】
发信人: CCBible (华人基督徒圣经), 信区: TrustInJesus
标 题: 海德堡要理问答主日23
发信站: BBS 未名空间站 (Sat Apr 14 11:44:58 2012, 美东)
海德堡要理问答主日23
来自基督徒百科
目录
1 英文版
2 英文2011版
3 赵中辉版
4 陈达/王志勇版
5 基督教要义圣经课程版
6 链接参考
英文版
23. Lord's Day
Q. 59.
But what does it profit thee now that thou believest all this?
A.
That I am righteous in Christ, before God, and an heir of eternal life. (a)
... 阅读全帖
C***r
发帖数: 759
50
来自主题: _ZST版 - The Function of Ideas
The Function of Ideas
Weber's concern with the meaning actors impute to
relationships did not limit him to the study of types of
social action. Rather, he used the typology of forms of
social action to understand the drift of historical change.
It will be remembered that the problems posed by modern
civilization were foremost in his mind, and in
this connections he conceived the shift from traditional to
rational action as crucial. He showed that rational action
within a system of rational-legal
首页 上页 1 2 3 4 5 6 7 8 9 (共9页)