由买买提看人间百态

topics

全部话题 - 话题: glm
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
m**********4
发帖数: 774
1
我们系两个拿到google的人都不会c++或者 sql
其中一个人面食的时候我在旁边。一堆r的问题,还记得一个glm的问题。
别的就没啥了,我觉得不是很困难。
当然我那两个同学都是research大牛。
a***e
发帖数: 1627
2
请问是看哪个output的结果啊
c*********r
发帖数: 1802
3
看tukey是否显著。
n*********e
发帖数: 318
4
I am doing an R logistic regression exercise -
My question is - 是否要先从validation set 中删掉 dependent variable, 然后再 run
prediction?
谢谢。
--------------------
library(MASS)
attach(birthwt) #The famous 'low birth weight' data for logistic regression
index <- 1:dim(birthwt)[1]
test<- sample(index, trunc(length(index)/3))
train<-birthwt[-test,]
validation <- birthwt[test,]
logit.1<-glm(low~., data=train, family=binomial(link='logit'))
logit.1
#------------------------------
#这里是否要先从validation set 中删掉 dep... 阅读全帖
a****g
发帖数: 8131
5
来自主题: Statistics版 - 在glm中,如果lsmeans和means结果冲突
model中有4个factors
对于这个factor, global test结果显示有差异,但是lsmeans找不到差别,means可以
对于这种情况,都应该用lsmeans吗?
请赐教
a********a
发帖数: 346
6
来自主题: Statistics版 - 在glm中,如果lsmeans和means结果冲突
我觉得lsmean 的结果可靠,如果不balance 的话,lsmean和mean的结果就不一样。
m*********n
发帖数: 413
7
来自主题: Statistics版 - 在glm中,如果lsmeans和means结果冲突
你说的global test是?
lsmeans和means是两种不同的contrast,看你要用哪一种。
i**z
发帖数: 194
8
来自主题: Statistics版 - 在glm中,如果lsmeans和means结果冲突
unbalanced design or missing data will make a difference in the two
procedures.
n**********e
发帖数: 18
9
dv不normal,有一个numeric的iv和多个categorical的iv
如果用的话,怎么判断结果有多少可信度?
如果不用这个,可以用哪个proc或test来替代?
如果还要做model selection的话,要用哪个?
谢谢!
g**********t
发帖数: 475
10
You mean the residual is not normally distributed? You may try to transform
your response variable to make the residual fit normal distribution better.
n**********e
发帖数: 18
11
是的,residual不normal。
如果不用transform呢?是不是只好用Kruskal Wallis test了?那后面要model
selection怎么办呢?

transform
h***i
发帖数: 3844
12
Kruskal Wallis test 也不能让residual normal吧
不transform就用generalized linear model
s**u
发帖数: 1279
g**********t
发帖数: 475
14
来自主题: Statistics版 - dependent varaible 在[0,1]分布
use GLM and assume response follows beta distribution.
c**********e
发帖数: 2007
15
来自主题: Statistics版 - Does GENMOD give class-level p-value?
Here is the example:
proc genmod data=data_one;
class id x1 x2 x3;
model y = x1 x2 x3 / dist=normal;
repeated subject=id / type=exch;
run;
The default output has p-values for each dummy variable generated by x1, but
not a p-value for x1.
Anyone help please? Thanks a ton. It seems GLM gives such p-values by
default.
s********1
发帖数: 54
16
来自主题: Statistics版 - SAS-GLM random effects questions
try "statement random"
D******n
发帖数: 2836
17
来自主题: Statistics版 - Size of R object for models is so big
為啥在R裏面的model object都那麼大? 譬如lm(),glm(),rpart()等等的object,是不
是因為把modeling的dataframe也帶上了? 真煩人啊。有沒有辦法保存的這些objects
的時候不把modeling data帶上?
承接上面討論R代替SAS,下面我就列出一些R煩人的地方。
1)做一件事很多packages,不統一。各有個各好,可是都不是很好。同時也造成
documentation慘不忍睹。
2) 作為一個高級語言,沒有良好的 pass by reference 機制。
3)很難debug。
4)沒有很好的報表工具。
5)處理大數據還是個問號。
a***d
发帖数: 336
18
来自主题: Statistics版 - Size of R object for models is so big
I remember there is option not to return data in lm or glm.
R debug is not too bad.. how do you debug in SAS?
as for documentation, I think it is still better than SAS.. hoho

objects
D**u
发帖数: 288
19
来自主题: Statistics版 - R glmnet 大数据
我想用glmnet中的 CV.GLMNET 做一下Binary outcome 的variable selection,然后作
为input feed到GLM 中 fit。
想问一下如果大概有 500 个 Variable,1 million observation, 10G左右的大数据
, R 能handel的了么? 如果可以的话运行一次的时间,能否大概控制在1个小时之内?
有经验的朋友能否告知一下,谢啦!
D**u
发帖数: 288
20
来自主题: Statistics版 - R glmnet 大数据
是挺麻烦的,又看了下bigmemory和ff,发现glm虽然可以做,但是data manipulation中
很多用到是与Base R 不同的语句。好麻烦啊!难道只有Revolution R了么?
w*******e
发帖数: 182
21
是data manipulation 那些,还是model预处理 proc freq proc means,还是model分
析 proc reg proc ANOVA proc glm。多谢了,有包子。
k*****u
发帖数: 1688
22
来自主题: Statistics版 - SAS大牛们帮忙看一下!
proc reg不可以对categorical 的自变量做,但是可以用proc glm class
或者你先把那些信用等级变成dummy variable(好像有个叫proc glmselect还是什么的
可以做),然后可以在proc reg里面用
s******o
发帖数: 656
23
来自主题: Statistics版 - SAS大牛们帮忙看一下!
多谢!我又查了一下,用proc logistic也可以做,是glm的一种
S*x
发帖数: 705
24
来自主题: Statistics版 - 问大牛一个proc glm的问题
也不是大牛
不过我建议把C重新code成为dummy variables,比如
/* assuming no missing value */
C_0=(C=0);
C_1=(c=1);
C_2=(c=2);
3不用code的情况下,就是reference variable了
w*******n
发帖数: 469
25
来自主题: Statistics版 - 问大牛一个proc glm的问题
sas 9.3 has this function to set the reference level
l******1
发帖数: 292
26
来自主题: Statistics版 - 问大牛一个proc glm的问题
谢谢大牛们的回答,我现在就是在用SAS 9.3,那个function可以set the reference
level?谢谢
l******1
发帖数: 292
27
来自主题: Statistics版 - 问大牛一个proc glm的问题
这个coding的方法我以前用过,不过我现在这个老板比较喜欢0,1,2,3的coding方法 :(
谢谢你的回答
h***i
发帖数: 3844
28
来自主题: Statistics版 - R glm
这个可以手算了吧
A*******s
发帖数: 3942
29
来自主题: Statistics版 - Proc mixed 显示non est
check the concept of estimability in GLM textbook.
also check the way you parameterize the class variables.
o******6
发帖数: 538
30
我觉得我老板大方向知道,她也大概知道GLM等,可能她还是不是很理解怕写protocal
麻烦把,我们组里一个AP(和我老板一个行业的)说她以前还和我老板交流统计,现在
不了,我老板总和他说我们这里不是搞统计理论的。。。
f*******n
发帖数: 392
31
来自主题: Statistics版 - Odds Ratio问题
我的思路是,用glm 做possion regression. 然后就可以得到beta,e(beta)就是odd
ratio,也可以根据beta的ci算出odd ratio的赐ci。
l****9
发帖数: 115
32
来自主题: Statistics版 - 关于老中找工作和招人的一些看法
最近版主跟大伙讨论是否透SAS TEST的题的问题可谓各执己见;碰巧最近也面了几个刚
毕业找工作的,有老中,有老美,目前没有老印。当然我的行业不是版主的医疗行业,
也不是找SAS程序员,所以侧重不一。
我主要从雇主的角度谈三个方面的问题。一是关于SAS证书;二是如何在面试的时候有
针对性地复习和组织回答;三是对这个行业老中互相提携的看法。我不是这个板上第一
个谈这个问题的,我记得statcompute和songkun都谈过,不妨搜出来看看。
首先,关于SAS 的证书,说实话,真没用,招人的话都不是很在意这个,不过要真列在
简历上,肯定是要考稀奇古怪SAS题;不列的话其实会更多问问学生时代的课题和统计
知识,
这些比较容易自由发挥,比被问乱七八糟的SAS题好应付。所以,水过的SAS证书我看还
是不要写了,即使是对于HR的筛选也不是决定因素。
其次我谈谈如何应对面试的一些通用技巧。
很多博士快毕业了,但是估计是长时间只专注自己的很窄的专业领域,结果很多基本的
统计概念和模型都不知道,这就不好了,好歹一般回归模型的几个基本假设要知道吧?
GLM要知道吧?ANOVA怎么回事要知道吧?另外,统计... 阅读全帖
g******7
发帖数: 1433
33
请问课程上除了statistic inference和regression,还有什么很重要的课需要上(知
识工作上会用到),我现在就在选课,基本所有精算和统计OR的课都可以选
目前想自修的有GLM和data mining,还有advanced data analysis
谢谢大家,说的越详细越好
b********r
发帖数: 764
34
GLM和data mining
g******7
发帖数: 1433
35
来自主题: Statistics版 - 新手问一个很基础的SAS code问题
嗯,如果是binary的 Z test就可以了吧,再请教具体code怎么写。。,我搜了下网上
的,test 2个proportion的code没找到,倒有什么glm的在里面
s********0
发帖数: 2625
36
来自主题: Statistics版 - 请问回归结果的置信区间
如果是一般的linear regression, google prediction interval;
如果是glm,不太清楚。
z****a
发帖数: 58
37
精算版版友推荐转帖到统计版, 特别想听听统计大拿们讲讲GLM在保险业之外哪些行业
有用和受重视?
a********y
发帖数: 474
38
来自主题: Statistics版 - 这个是ANOVA的问题吗?
需要GLM吗?如果有strata 和weight 的话?
c**d
发帖数: 104
39
来自主题: Statistics版 - 这个是ANOVA的问题吗?
1. Scoring (0-10) data are very common and treated as a continuous variable
instead of an ordinal variable.
2. Weiwei pointed out that categorizing will lost a lot of information.
Furthermore, you have to use proportion odds model to fit an ordinal outcome
. So you make thing be complicated and difficult to interpret results
such as odds ratios across the levels of the ordinal outcome.
3. People still want to know how big difference (effect size) between A and
B by using unadjusted and/or adjust... 阅读全帖
j******4
发帖数: 6090
40
来自主题: Statistics版 - 请教一个logistic regression的问题
May I ask for a correct interpretation of the R-squared value from GLM?
If I didn't make myself clear, maybe the following quote can help:
"It(R squared value) is the proportion of variability in a data set that is
accounted for by the statistical model."
Wiki page:
http://en.wikipedia.org/wiki/Coefficient_of_determination#cite_
Ref:
Steel, R. G. D. and Torrie, J. H., Principles and Procedures of Statistics,
New York: McGraw-Hill, 1960, pp. 187, 287.
n**********e
发帖数: 9
41
来自主题: Statistics版 - 请问面试中SAS和R的问题
谢谢楼上回复。请问可不可以具体一点讲讲如何“深刻”?
比如我说用过 R的 survival package,需不需要讲是什么 project,怎么具体用的。
如果SAS的话,我说用过 proc GLM,proc mixed 等等,然后应该讲些什么?才开始面
试一点都不知道这类问题应该如何回答才比较好。
r*****d
发帖数: 346
42
工业界与工程界貌似就是这样。举例”最简单“的linear models,不知道一个CS
Master/PhD能讲多少,但统计这边,lm,glm,再加上random effects;model
specification, inference and diagnostics就已经有很多东西了。
l****c
发帖数: 89
43
来自主题: Statistics版 - 保险公司 vs. 制药厂
换了个能说中文的,有几个朋友刚毕业去了保险公司。好几个说不太喜欢,说是整天就
是proc glm,也有喜欢的不过。感觉很aggressive有拼劲的会喜欢去保险公司。一家之
言,也不知道对不对,如果还没毕业可以找个公司实习感受一下。
w*****1
发帖数: 473
44
来自主题: Statistics版 - 急问proc reg and proc glm
急问这两个哪个快一点。谢谢!
Y******Y
发帖数: 8753
45
来自主题: Statistics版 - 急问proc reg and proc glm
proc reg is faster
w*****1
发帖数: 473
46
来自主题: Statistics版 - 急问proc reg and proc glm
谢谢!
w*****1
发帖数: 473
47
来自主题: Statistics版 - 急问SAS问题
请问用PROC GLM 做拟合,对很多个SNP,
每个SNP有一个P值,请问如何把所有的P-值从结果中取出来写到一个文件里面去?谢谢
X*****O
发帖数: 78
48
马上要准备一个十分重要的电面,职位是在MARKETING公司为Retailer里搞customer
analytics, 方向大概是customer behavior analytics, lifetime value. 强调的
skills是SAS, SQL和excel, 想要尽可能全面的准备, 有好多问题请版上大牛指点。如
能最后顺利通过一定倾尽家财发包子。
1. Data handling and manipulation
Load data: 貌似用的是Teradata, 所以和这里相关的就是如何用SAS data step或SAS
PROC SQL从Teradata里读large data set?
Clean data: missing value (replace with mean value?)
smoothing data (Binning/Clustering in SAS?)
outlier treatment (不知道会怎么问,请大牛指教?)
sampl... 阅读全帖
y*****w
发帖数: 1350
49
来自主题: Statistics版 - 如何处理很多的zero value?
By "a two-stage approach", do you mean a multivariate approach? For example,
if it's a general linear model, would the SAS code look like:
proc glm data=data;
class group;
model original_var zero_dummy = group;
run;
The output has two separate models, one for the dependent variable "original
_var" and the other for the dependent variable "zero_dummy".
q**********9
发帖数: 711
50
来自主题: Statistics版 - 包子问题请教( sas)
proc glm 可以用 model y = var1|var2|var3|var4 @2;
但是option 里没有stepwise选项,
proc reg 有stepwise 选项,但是不能用 model y = var1|var2|var3|var4 @2这个命令,
我的sas 里没有proc glmselect 命令,现在该用哪个 proc 命令呢?
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)