q**j 发帖数: 10612 | 1 用普通的regresson来说:
差不差residual plot against dependent variables?
做不做test of normality?
找不找influential observation?
都做什么样的robustness check?
一般什么方式,步骤比较有效?取取经。 | s*r 发帖数: 2757 | 2 only do planned analyses
【在 q**j 的大作中提到】 : 用普通的regresson来说: : 差不差residual plot against dependent variables? : 做不做test of normality? : 找不找influential observation? : 都做什么样的robustness check? : 一般什么方式,步骤比较有效?取取经。
| s*****n 发帖数: 2174 | 3 在学校里写report都做.
工作中都不做, fit个lm()就不错了.
【在 q**j 的大作中提到】 : 用普通的regresson来说: : 差不差residual plot against dependent variables? : 做不做test of normality? : 找不找influential observation? : 都做什么样的robustness check? : 一般什么方式,步骤比较有效?取取经。
| q**j 发帖数: 10612 | 4 一?你们那里不是要求各种model的说?marketing里面的survey可以experiment。我以
为对各种technical的东西更注重细节。
【在 s*****n 的大作中提到】 : 在学校里写report都做. : 工作中都不做, fit个lm()就不错了.
| s*****n 发帖数: 2174 | 5 你说的这些 model diagnostics 和统计 model 本身关系不大,
主要是用于让 model 或者 conclusion 更可信, 属于典型
的"忽悠"的范畴. 如果工作中, 不用这些就能把别人忽悠住,
或者是没人 challenge 你的 finding, 就没必要做这些.
【在 q**j 的大作中提到】 : 一?你们那里不是要求各种model的说?marketing里面的survey可以experiment。我以 : 为对各种technical的东西更注重细节。
| q**j 发帖数: 10612 | 6 哈哈,我没有你cynical。我还是比较care的。我打算formalize一些列test。以后像例
行程序一样,每次过一遍。 | s*****n 发帖数: 2174 | 7 问题在于, formalize一系列diagnostics的意义在什么呢,
比如做了一个linear regression, 结果可以解释的通,
可是diagnostics里面有一(两)个test结果不理想,
是推翻原model呢, 还是将就凑合了呢.
如果不完美的diagnostics结果能推翻原model, 那么现实社会
中90%的model都得被推翻. 如果将就凑合了, 那做diagnostics
的意义在什么呢?
【在 q**j 的大作中提到】 : 哈哈,我没有你cynical。我还是比较care的。我打算formalize一些列test。以后像例 : 行程序一样,每次过一遍。
| q**j 发帖数: 10612 | 8 如果你发现不完美的东西是由于某几个有问题的observatoin造成的,或者是由于
heteroskysticity (sorry wrong spelling),而你把它们改正了,结果就变好了呢?
【在 s*****n 的大作中提到】 : 问题在于, formalize一系列diagnostics的意义在什么呢, : 比如做了一个linear regression, 结果可以解释的通, : 可是diagnostics里面有一(两)个test结果不理想, : 是推翻原model呢, 还是将就凑合了呢. : 如果不完美的diagnostics结果能推翻原model, 那么现实社会 : 中90%的model都得被推翻. 如果将就凑合了, 那做diagnostics : 的意义在什么呢?
| s*****n 发帖数: 2174 | 9 当然这种情况是有的, 不过绝大多数情况,
即使发现outliers也不好轻易改正吧.
毕竟data是真实的, model是假设的.
当然可以换model, 比如改用robust reg
最后的结果, 还未必哪个更有意义呢.
考虑的问题越多, 其实引入的noise就越多,
往往也会把问题不必要的复杂化. 我是觉得
做统计, 能简单的就不要复杂, 能做一步的
就别做两步, 能不用model的就不用model,
返璞归真最好.
如果有人challenge或者不相信你的结果, 那
是另一回事, 你可以摆事实讲道理, 做各种
diagnostics和test说, 看这个model是如何如
何valid. 一旦此人信服, 就结束了. 把diagnostics
给程序化, 我总觉得和统计的基本理念相违背.
【在 q**j 的大作中提到】 : 如果你发现不完美的东西是由于某几个有问题的observatoin造成的,或者是由于 : heteroskysticity (sorry wrong spelling),而你把它们改正了,结果就变好了呢?
| l******d 发帖数: 1633 | 10 en, 太cynical,outliers还是应该找的
我基本上就看看summery statistics,data没啥错就行了
normality check一般懒得弄,查出不是normal的不是白做了,嘿嘿
呢?
【在 s*****n 的大作中提到】 : 当然这种情况是有的, 不过绝大多数情况, : 即使发现outliers也不好轻易改正吧. : 毕竟data是真实的, model是假设的. : 当然可以换model, 比如改用robust reg : 最后的结果, 还未必哪个更有意义呢. : 考虑的问题越多, 其实引入的noise就越多, : 往往也会把问题不必要的复杂化. 我是觉得 : 做统计, 能简单的就不要复杂, 能做一步的 : 就别做两步, 能不用model的就不用model, : 返璞归真最好.
| s*****n 发帖数: 2174 | 11 呵呵, 我就是这个意思. 现实中, 做diagnostics的
可能不少, 但是做了以后真有actionable plan的并不多.
大多数情况, 如果结果不好, 也就凑合了. 如果结果好
更能自圆其说一些而已.
基本上还是要把握大方向. 做出来以后, 首先看看model是不是有
实际意义. 实际意义清晰且有用的, 做不做diagnostic都无所谓.
实际意义模糊, 矛盾, 或者不可用的, 统计上再怎么valid, 也是
没用. 只有在模棱两可的情况下, diagnostic才能在一定程度上
support统计结果.
【在 l******d 的大作中提到】 : en, 太cynical,outliers还是应该找的 : 我基本上就看看summery statistics,data没啥错就行了 : normality check一般懒得弄,查出不是normal的不是白做了,嘿嘿 : : 呢?
| f***a 发帖数: 329 | 12 How to determine "首先看看model是不是有实际意义. 实际意义清晰且有用的"?
Thanks~ :D | s*****n 发帖数: 2174 | 13 这个就"全凭一张嘴"了, 呵呵.
其实就是根据实际的问题, 看看能不能解释了.
大多数模型在fit之前, 脑子里就有一些实际解释吧.
【在 f***a 的大作中提到】 : How to determine "首先看看model是不是有实际意义. 实际意义清晰且有用的"? : Thanks~ :D
| f***a 发帖数: 329 | 14 ohh~ :)
【在 s*****n 的大作中提到】 : 这个就"全凭一张嘴"了, 呵呵. : 其实就是根据实际的问题, 看看能不能解释了. : 大多数模型在fit之前, 脑子里就有一些实际解释吧.
|
|