w********2 发帖数: 632 | 1 http://forum.xitek.com/thread-252610-1-1-1.html
老镜头一直是我所喜好。当中人为的喜好占了决定性因素。没有什么好坏,全凭个人兴
趣。使用多年稍有心得。曾在杂志上断断续续的发过几篇文字。但因个人能力时间有限
无由而止。后得知数处转载,感觉惭愧。现集录如下。供大家指正。
老镜头并非常规使用之利器,当先熟其脾性而后与之。贸然听言非善举!我之文字疏漏
甚多,还望拍砖言讨。
(一)镜之启-Protar
很多年来,在我的镜头群中普罗塔(Protar)镜头是最为常用的一种。记得多年前,我
为自己的一套4×5单轨相机,配备了当时最新款的多只XL级广角与APO镜头。实际拍摄
下来,总感觉与之前用过的哈苏,徕佧镜头在影调和韵味有着很多的差距。虽然功能调
整与清晰度得到了极大的改善,但影像整体的色彩,影调毫无精彩之处,甚至只能用“
夸张”来形容拍摄的影像。就好像是一盘放了大量味精的海鲜饭。人眼所看到的真实感
,在喧嚣的艳丽彩色下荡然无存。环顾市场,当时的目之所及确实没有更好的东西了。
只能接受现实。在遗憾中,还会不时带上Leica 50mm ... 阅读全帖 |
|
s****l 发帖数: 38 | 2 今天知道消息,被拒了,一直觉得很有希望,很郁闷。
失败的经验,希望对大家有帮助。
专业问题:
1。描述build model的每一步
我目前master第二学期,只做过几个multiregression和logistic regression,把
我知道的,从understand data set,check outlier, check assumption, 到transform
variable,check collinearity,全讲了一遍。期间讲到outlier时,被问到怎么查
outlier,我说用cook's distance,又问为什么用这个
2。collinearity
collinearity是什么,对model有什么影响,怎么处理collinearity
3。holdout data
为什么用holdout data来检验model,如果data set小,能不能用holdout data做检
验。我说不能,因为样本小,再分出一部分会导致剩余run model的数据更少,error可
能会太大。(这里我觉得我的回答有问题,小样本应该也可以用ho... 阅读全帖 |
|
b******3 发帖数: 377 | 3 由于最近胶片市场低迷,决定写篇器材文,而且是以后慢慢更新补充的,写到哪是哪,
想起啥写啥
注,如果是别人写过的我就不重复了,尽量写一些不那么普及的。可以转载可以转发,
也可以不注明出处,就算有人非要盗用我的文章我也不在乎,因为这文只在校内更新,
真有心思看的人,最终会找到这里的。理论上(注意是理论上,我才没那么多闲工夫)
如果我一直写下去,以我过去五年阅读过的摄影器材文献,写一书架的长度都不难。
所以真正的学富五车,敢于直面盗文者。。。哼
从今天开始,我决定每次更新都变粗体方便阅读,请拉到最下边
。。。。
老镜头有老镜头的缺点,我在极热极冷极湿极干的地方都曾遇到过老头罢工的问题,那
些夏天就开胶冬天就恢复的三片胶合镜组都算好的,有些年代太久远或者稍微劣质一点
的镜头一旦出了问题将会是不可逆转的。所以,在选择新老头这件事上一定要结合自己
的需求。
哈苏的镜头群里CF80,FLE distagon50 sonnar150都很不错,但是你可以以将近哈苏三
分之二的价格去买玛米亚RZ67得到同样的效果,如果你买了玛米亚的测光顶,你还能实
现哈苏500系列不... 阅读全帖 |
|
d******o 发帖数: 59 | 4 The second paragraph is from a research paper. Again, a question about the
correlation among indepedent variables:
Is collinearity diagnostics part of correlation matrix? shall we say
correlation matrix alleviate (reduce) correlation or simply detect
correlation among independent variables and the we use collinearity
diagnotics to see whether multicollinearity is within acceptable level? (my
questions)
Correlation matrix is for diagnosing collinearity. However, it is not a good
statistical metho |
|
g*******4 发帖数: 1889 | 5 "2。collinearity
collinearity是什么,对model有什么影响,怎么处理collinearity"
想请问比较好的回答方式是怎么样的?
谢谢 |
|
z******3 发帖数: 860 | 6 这是个BBS,有不同意见就举证,就说明。
全是问句?没有一个答案?这不就是纯粹拍砖头吗。你有数据,有理论,有说法,群众
眼睛自然是雪亮,自然明白你的本事。就像那位介绍自动对焦系统的大侠一样,我就佩
服的不行。
至于collinear是不是300lp/mm,我的确不知道,你如果自己测试过,那就说明你实测多
少,既然网上有人这么说,我就引用一下。你有不同意见,把你的实测亮出来。而且我
的帖子不过是说可以玩不带快门的老镜头,collinear到底多牛,跟SL66也没啥关系啊。 |
|
u******3 发帖数: 11 | 7 The second paragraph is from a research paper. Again, a question about the
correlation among indepedent variables:
Is collinearity diagnostics part of correlation matrix? shall we say
correlation matrix alleviate (reduce) correlation or simply detect
correlation among independent variables and the we use collinearity
diagnotics to see whether multicollinearity is within acceptable level? (my
questions)
Table 5 reports the correlation matrix for the independent variables. The
following discussion |
|
s******1 发帖数: 26 | 8 其实PCA 也不一定好,需要对新的变量有比较合理的解释。Ridge也要看。学回归的时
候好像也要看是否是 model based collinearity or variable based collinearity.
还有可以作中心差。总之 google也可以goo很多出来的。好运了。 |
|
u*****o 发帖数: 1224 | 9 11点的面试,10.30我就开始坐立不安,心也砰砰跳,我跟自己说不要紧张
跑去听龚琳娜的小河淌水,人家也在等待,比我幸福多了,人家等阿哥回来,我在等被
虐啊!!
混了半个小时过去,电话按时响起。。
下面是面经
1.research experience (讲了15分钟)
2.一堆data, Bernoulli distribution, 40% = 1, 60% = 0, design test to see if
40% is significantly less than expected?
我说用chi-square, 因为是non-parametric, expected frequency = 0.5, 他又问chi-
square的公式。
3. 另一堆data, 70% = 0, design a test to see if the two samples (和前面一
道题的60%) are different, 我说用two sample t test, 这个对不?
4. 3 columns of data, two continuous variable, one b... 阅读全帖 |
|
D**u 发帖数: 288 | 10 多谢分享,祝楼主好运!
再分析一下
2. 一堆data,是不是想让你用t-test for one sample proportion, 可能想考的概念是
binomial approximate normal?
3. 这回你倒是想到t-test for two sample proportion,good job
4.恩,要问response是不是linear的,一般问collinearity,VIF是要提到的,不过
ridge regression是可以处理collinearity的问题,而且既有binary也有linear,也算
是一个option |
|
u*****o 发帖数: 1224 | 11 11点的面试,10.30我就开始坐立不安,心也砰砰跳,我跟自己说不要紧张
跑去听龚琳娜的小河淌水,人家也在等待,比我幸福多了,人家等阿哥回来,我在等被
虐啊!!
混了半个小时过去,电话按时响起。。
下面是面经
1.research experience (讲了15分钟)
2.一堆data, Bernoulli distribution, 40% = 1, 60% = 0, design test to see if
40% is significantly less than expected?
我说用chi-square, 因为是non-parametric, expected frequency = 0.5, 他又问chi-
square的公式。
3. 另一堆data, 70% = 0, design a test to see if the two samples (和前面一
道题的60%) are different, 我说用two sample t test, 这个对不?
4. 3 columns of data, two continuous variable, one b... 阅读全帖 |
|
D**u 发帖数: 288 | 12 多谢分享,祝楼主好运!
再分析一下
2. 一堆data,是不是想让你用t-test for one sample proportion, 可能想考的概念是
binomial approximate normal?
3. 这回你倒是想到t-test for two sample proportion,good job
4.恩,要问response是不是linear的,一般问collinearity,VIF是要提到的,不过
ridge regression是可以处理collinearity的问题,而且既有binary也有linear,也算
是一个option |
|
f********8 发帖数: 5601 | 13 一周跑了两个onsite,上来回馈一下。
第一个是传统行业,目前只有几个DA做KPI reporting。打算开始建一个DS team. 所以
问题比较老套。过去经验呀,怎么approach我们的数据啊之类的。
第二个是tech startup,有好几个phd and MBA holders. onsite之前有两轮电话面试
,和一个限时作业题。onsite时基本不寒暄,上来就问几个sql, 然后问几个
predictive model的performance问题。其中一个是参数不稳定,希望你给个可能的原
因。回答是collinearity,然后他们追问怎么detect and address collinearity.
感觉实际操作经验还是很重要的。很多问题没有教科书式的答案。面试你的人也只是观
察你的思维是不是在同一个层次上。 |
|
r*****e 发帖数: 146 | 14 Given a very large data point represented as (x,y), how to find all
collinear? 有什么高效的方法么? |
|
p***0 发帖数: 233 | 15 NY的startup,问的都比较随意简单,今天去onsite了,大家就随便看看。。。
求过啊,,!
1. 我发现纽约的公司都喜欢考这道编程题么。。
given integer n, 写个函数如果是3的倍数输出fuzzy,如果是5的倍数输出buzzy,是
15的倍数输出fuzzybuzzy.
2. how do you build model? What will you think before build any models? Walk
me through the process you use.
3. How do you explain the difference between Bayesian inference and
regression to one who doesn't have any background?
4. How to handle collinearity?
5. In SQL. what's the difference between inner join, right join and left
join? Write your code.... 阅读全帖 |
|
z******3 发帖数: 860 | 16 禄来的单反当然要买带HFT镀膜的SL66 SL66E啦
理由
1.SL66的镜头是整体对焦的,在对焦的时候,没有镜片的相对移动,边边角角的结像要
容易处理的多,同样的planar, SL66上面的成像圈大过哈苏上面的planar。锐度嘛,
可以参考禄来双反上面的planar。双反的planar比哈苏的标头牛,就是因为双反的
planar也是整组对焦的。其他蔡司为SL66设计的头,也比哈苏同样的蔡司头好。无他,
结构使然。后期的HFT头更是个个精品,比6008上的蔡司做工好了不少。
2.SL66自带tilt功能,对景深的控制比不能tilt的哈苏强的多。
3.SL66是皮腔对焦加上幕帘快门,简直是通吃一切镜头,老式名头,很多都是不带快门
或者快门已经不能用的了,你去搞个300线分辨率的Collinear,都不知道怎么去用,
graflex的speed graphic 倒是有快门,不过那个效果完全不能依靠。市面上最好找到
的就是SL66,不管什么镜头,到ebay上买块镜头板,mount上去就搞定了。SL66还是单
反结构,拍起来轻松愉快。
SL66绝对是最好玩的中福机之一。当年干不过哈苏,还 |
|
s**********s 发帖数: 7387 | 17 这是你转载的还是你自己想当然的?
中幅手动标头里面有几个是镜片相对移动对焦的?
双反Planar比哈苏标头好是因为整组对焦的缘故?
成像圈和成像质量有必然联系?
光是第一点要想找句靠谱的话来都不容易。
后面Collinear "300 lp/mm"的东西是不是从无忌某老奸商那里的软文上抄的? |
|
w***n 发帖数: 1084 | 18 Their definitions are not limited to images.
Affine is basically Homography (Collinearity) + distance ratio preservation. |
|
t****t 发帖数: 6806 | 19 I don't know the answer.
but i remember someone asked a interview question, and mathematically, it is
if m==3, and A(1,:)==1
then it's equivalent to check whether any 3 points (in n points) are
collinear |
|
|
o******n 发帖数: 511 | 21 谢谢你的回复。
如果我们不加kinship到model里,那么genotype就是一个有27个level的factor,R会
assume这些level是一样的,但其实它们之间的genetic distance并不一样,所以我们
想把这个信息加到model里。
让我困惑的就是怎么加。我想到一个办法就是把每个plant genotype跟其它所有
genotype的total genetic distance作为一个新的covariate放到model里。但我又觉得
,这个covariate和genotype不是collinear的吗?
plant breeding的人有时会把kinship matrix加到model里做association analysis。
不过我们的trait不是传统意义上的phenotype,也没有每株植物的SNP data,所以很多
软件/package不能用…… |
|
l*l 发帖数: 149 | 22 看看这个
http://www.ccl.net/cgi-bin/ccl/message-new?2007+11+25+002+raw
"This is caused by collinearity in the overlap matrix. There are basis
functions that are too similar, and when the overlap matrix is diagonalized
there a re eigenvalues that are too close to being zero, and this leads to
large values when the inverse square roots are taken of the eigenvalues in
the process of computing the necessary S**(-1/2) matrix, which is then used
in computing the MO's in the original non-orthogonal basis |
|
b****e 发帖数: 906 | 23
.
be related to some known complete basis.
非常感谢您的回复。我在尝试着找能成为完备基的基本特征,所以考虑的是普遍的函数
,并没有特定的函数形式。看起来似乎这种完备性应该不难实现,只是难以证明吧,如
果采用有限空间的矢量分解,一般的矢量总是会和矢量基矢有重叠的,那种出现
collinear的情况总还是特例。
从几何上看,似乎一维空间的每一个地方都有那个连续函数族中的某一个加以特别的强
调(例如一堆的高斯,每个高斯出现的最大值的位置都不同),那么很有可能这个连续
函数族就是一维空间的完备基,只是怎么证明和数学表述呢?
同时以上说的情况太片面,譬如Fourier基矢就是在每个地方基本上相同大小,只是疏
密不同。那么,怎么将数学表述包括尽可能多的情况呢?
domain you want to prove completeness. Also, you have to specify the
functional space; for example, it only covers all the continuous functions,
or o |
|
y****d 发帖数: 432 | 24 ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
前面说明:
需要的童鞋请到我的签名档的博客查找!谢谢!发E-mail太累了!
觉得有价值的话可以顶一下,以便更多的人看到!谢谢!
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
详细介绍
1. Advanced Calculus with Applications in Statistics
2.A History of Probability and Statistics and Their Applications before 1750
3.Markov Decision Processes: Discrete Stochastic Dynamic Programming
4.Probability and Statistical Inference
5.Continuous Univariate Distributions, Vol. 1
6.Continuous Univariate Distributions, Vol. 2
7.The Theory of Measures and Integratio... 阅读全帖 |
|
r***a 发帖数: 58 | 25 //sigh
这问题问的太含糊
什么叫 X是在1/2附近?
要全是1/2 就 collinearity
这个beta_1 不要也罢
还请师兄指 |
|
p********a 发帖数: 5352 | 26 ☆─────────────────────────────────────☆
papertigra (长工胖头猪) 于 (Mon Dec 11 13:08:34 2006) 提到:
好几年没用了,挺糊涂的。现在着急要用,看得一点头绪都没。
1)Model assumption是什么。变量必须独立? log(pi/1-pi)必须normal?
2)如果有collinearity, 应该怎么办呢。做selection? 怎么才能提高R2.
谢谢
☆─────────────────────────────────────☆
qdzhang (Human Paladin) 于 (Mon Dec 11 15:10:33 2006) 提到:
1. normal distribution; 2. independent error
transform the variable
☆─────────────────────────────────────☆
cavine747 (痒痒挠) 于 (Mon Dec 11 17:33:26 2006) 提到:
除了tran |
|
p********a 发帖数: 5352 | 27 ☆─────────────────────────────────────☆
JungleMonkey (MonkeyInTheJungle) 于 (Thu Sep 11 23:11:10 2008) 提到:
有没有复习统计面试方面的参考书,能够帮我快速复习统计面试。
我有统计master, 但是课程内容almost全忘了。
比如概念如multi-collinearity,以及interaction等等,还有很多统计的专有术语,
都不甚了了,
大家快帮我想想办法吧。
☆─────────────────────────────────────☆
shac (Ben Derajoshi) 于 (Thu Sep 11 23:29:34 2008) 提到:
放狗
☆─────────────────────────────────────☆
JungleMonkey (MonkeyInTheJungle) 于 (Thu Sep 11 23:35:33 2008) 提到:
还是别开玩笑了,
请给我一些指点吧。
☆──────────────────────── |
|
w*********m 发帖数: 196 | 28 When doing a regression of Y and X1, the coefficient is positive significant
When doing a regression of Y and X2, the coefficient is positive significant
When doing a regression of Y and X1 and X2, the coefficient of X1 turns out
to be negative significant,and the coefficient of X2 remains positive significant.
What might be the reasons?
Is is because of collinearity?
Thanks:) |
|
T******r 发帖数: 265 | 29 1. You can calculate VIF to see how bad collinearity is, or a simple
correlation 'cause you only have two variables.
2. Maybe create the ratio and run
y ~ x1 + x2 +x1/x2 (or x2/x1) |
|
c******5 发帖数: 22 | 30 谢谢回答哈~但是我现在是在logistic regression 中modeling fitting时的问题:就
是说我想研究bim_change_class (categorical variable)与case 的关系,model中还
包含很多covariates(例如年龄,race什么的),还包括bmi_2yrs (这是个
continuous variable,把它变成categorical的就不一样了), 是为了排除它带来的
因素。
你用chi-square来检验两个categorical variable之间的相关性没有错,但我其实不是
想知道bim_change_class和bmi_2yrs之间的关系。我是想知道在研究bmi_change_class
与outcome 的关系的model里,要是加进去了bmi_2yrs,会不会有什么multi-
collinearity的问题。我现在先做了一个只有bmi_change_class, 其他covariates(
例如年龄,race什么的)和outcome的model,发现adjusted for other covariat |
|
C******y 发帖数: 2007 | 31 你看看你教科书上关于multicollinearity/collinearity这部分的解释吧。 |
|
q******n 发帖数: 272 | 32 check the correlation between a and b. It seems collinearity presents. |
|
t********y 发帖数: 469 | 33 one can check for multicollinearity by means of the correlation matrix. In
such a matrix when the correlation coefficient between two explanatory
variables is above 0.8 one needs to be aware of possible collinearity. If
the correlation coefficient is above 0.95 the problem is really serious.
A diagnostic approach to check for multicollinearity after performing
regression analysis is to display the Variance Inflation factor (VIF).
VIF is a measure of how much the variance of an estimated regressi |
|
T****n 发帖数: 2195 | 34 scatter matrix 可以很方便看pairwise的collinearity。 |
|
s*******e 发帖数: 1385 | 35 是不是可以直接根据BIC做model selection,BIC对增加parameter的penalty最大,增
加Multicollinearity 的predictor对SSE的影响比较小。用BIC是不是会剔除
collinearity的variables。
我也不是很懂,如果觉得没有道理,请不要见怪。 |
|
n*****s 发帖数: 10232 | 36 这个先forward然后再backward,跟stepwise有什么本质区别?理论上怎么解释的
看过sas-l的一些帖子,简单的对付multicollinearity就用proc reg的collin option
,不过在分析output的时候用vif还是condition index有些争论。vif比较简单,ci貌
似提供的信息更多一些(可以分析出具体每个变量的collinearity都是由其它哪些变量
贡献的)。不过具体应该如何应用这些信息确定每一步保留/去掉哪个变量,还是没有
个清晰明确的判别方法。。。 |
|
W**********E 发帖数: 242 | 37 是,但是模拟中加了PROPENSITY SCORE,TRT GROUP的系数变的非常离谱,本来是应该
REDUCE BIAS才对。所以非常费解,只能往HIGH COLLINEARITY上想. |
|
P****D 发帖数: 11146 | 38 我觉得陈大师的“一体的”的意思是它们是collinear的。
那我很想知道只祷告不割包皮而且吃猪肉的中国基督教徒怎么办,他们的祷告是否还有
用…… |
|
s**********y 发帖数: 38 | 39 请问:
1 如何找catigorical variables 的collinearity? such as race (white, black,
latino), sex(male,female), education(college or not college graduated),age(<20, 20-40, >40), income (below, above a level) etc.
2. 我在用logistic regression 时, test Deviance and Pearson Goodness-of-Fit
Statistics, the p-value of Deviance is 0.0037, and the p-value of Pearson is
0.0061. Do these mean that the logistic regression is not fitting the data well? What should I do next?
Thanks. |
|
a****m 发帖数: 693 | 40 collinearity 应当依据linear model, 他们有很多的技术指标,比如,VIF,或者是
correlation等等 |
|
d******o 发帖数: 59 | 41 see paper:
http://www.stat.lsu.edu/faculty/marx/CollinCSDA.pdf
Collinearity diagnostics for logistic regression can use condition index
with variance decomposition methods.
I have a paper discussing about VIF for GLMs It hasn't been published yet. |
|
A*******s 发帖数: 3942 | 42 depends on the problem and context.
for predictive modeling, if N>>P and training sample and test sample are
similar(same range, same collinearity), intermediate multicollinearity is
not problematic for prediction power, and regularization is not necessary.
here is the routine procedures for variable selection in credit scoring
models.
http://www.nesug.org/proceedings/nesug06/an/da23.pdf |
|
s*********e 发帖数: 944 | 43 早几个星期我发过一个帖子,大致是说在等面试结果之类的。果真如大多数人所说,应
该是没戏了。我前后发信给了面试官和HR询问面试结果,都没有回音。
现在来说说面经。面试的职位是一家保险公司的intern。
面试官是一男一女,两人都是硕士学历。我就凭着自己的记忆写面试的问题好了。
1,你怎么解释p-value给不懂统计术语的人?
2,什么是confidence interval?
3, 说一下你对linear regression的了解?
4, 什么是VIF?
5,r-square和ajusted r-square 的区别。
6,除了以上你讲的(backward, forward,r-square,ajusted r-square,mallow's
cp),你还知道别的linear regression的方法吗?
7,如果你有200个variable,你怎么筛选variable,除了以上你讲的方法?
8,你最proud的事情是什么?
9,你遇到的最困难的事情是什么,你是怎么克服的?
10,除了你刚才说的那件事情,还有什么困难的事情吗?
11,你的这个course project的预测结果是怎... 阅读全帖 |
|
y****d 发帖数: 432 | 44 ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
前面说明:
需要的童鞋请到我的签名档的博客查找!谢谢!发E-mail太累了!
觉得有价值的话可以顶一下,以便更多的人看到!谢谢!
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
详细介绍
1. Advanced Calculus with Applications in Statistics
2.A History of Probability and Statistics and Their Applications before 1750
3.Markov Decision Processes: Discrete Stochastic Dynamic Programming
4.Probability and Statistical Inference
5.Continuous Univariate Distributions, Vol. 1
6.Continuous Univariate Distributions, Vol. 2
7.The Theory of Measures and Integratio... 阅读全帖 |
|
a****m 发帖数: 693 | 45 stepwise can not detect the model complexity, here complexity means that the
amplitude or abundance of collinearity between variable. you may try some
information criteria, such as AIC or Bayesian IC. |
|
l******r 发帖数: 18699 | 46 从图三可见基本上X1=X2
估计X3和X4跟X1有很大的multi-collinearity
所以Y~X1+X2+X3+X4跟Y~X1的model fit结果差不多,故R^2差不多
当然full model不是个好model因为里面包含太多相关变量,
参数估计的准确度是个问题
这从图一X2,X3,X4的p-value比较大可以说明它们不是重要significant变量
of |
|
|
F****n 发帖数: 3271 | 48 This is a technique normally used to handle collinearity.
If X1 and X2 are highly correlated, the regression coefficients will be
messed up in a model that use them both, i.e. you cannot tell whether the
coefficient on X1 or X2 is the "true" effect.
On the other hand, in your example, you assume (by theory) that X1 always is
the primary effect and will exclusively explain as much original variance
as possible. X2 will only explain the leftovers.
X2).
regression.
one? |
|
r******m 发帖数: 369 | 49 恩,我就是觉得PCR看似很漂亮地解决了collinearity但是这个penalty其实转移了而已。
不过我还是比较肤浅地了解,有没有好的读物推荐一下?谢谢。
by
regression |
|
A*******s 发帖数: 3942 | 50 the most intuitive reason is that u happen to sample a subset in which those
variables are significant.
my further guess is smaller sample size brings in collinearity and it then
causes changes in coefficient estimates. |
|