由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 讨论一个思路的问题吧
相关主题
外行请教:这个问题有没有答案?【求助】求帮忙下载一篇哈佛的博士论文
[合集] 有人知道causal inference吗?Google Statistician
Propensity score or Instrumental Variable?请教一个简单的统计学问题(补充了一些细节)
怎么理解structural equation model是个causal model?真诚求paper review的机会 (Statistics/Biostatistics)
那位高人给解释一下causal model偏门的统计学专业是不是很难进统计学的job market啊?
请大家推荐一本causal inference的书吧!今天Google QA/Data Scientist电面面经
学习统计的好处判断两个时间序列足够近似的方法
有同学了解causal inference么?求一本电子书 experimental and quasi-experimental design for generalized causal inference
相关话题的讨论汇总
话题: 习惯话题: causal话题: 找出话题: 贝叶斯话题: clustering
进入Statistics版参与讨论
1 (共1页)
R******d
发帖数: 1436
1
比如说:
有100个人,有50种不同的习惯。习惯可以用binary string来描述这个人有或者没有这
个习惯。也可以用个数值来表示这个人有这个习惯的倾向。数据结构就是个100*50的矩
阵。
用这样的数据可以做点什么分析呢?(我说几个,然后大家补充一下吧)
1,找出哪些可能的习惯的模式/组合
2,找出哪些习惯是导致另外习惯的causal的原因
3,根据习惯的模式把人分成几种类型
T*******I
发帖数: 5138
2
本数据内容应该不支持找相互间的causals, 但相互间的联系还是有可能的。

【在 R******d 的大作中提到】
: 比如说:
: 有100个人,有50种不同的习惯。习惯可以用binary string来描述这个人有或者没有这
: 个习惯。也可以用个数值来表示这个人有这个习惯的倾向。数据结构就是个100*50的矩
: 阵。
: 用这样的数据可以做点什么分析呢?(我说几个,然后大家补充一下吧)
: 1,找出哪些可能的习惯的模式/组合
: 2,找出哪些习惯是导致另外习惯的causal的原因
: 3,根据习惯的模式把人分成几种类型

R******d
发帖数: 1436
3
可以啊,贝叶斯网络不就是干这个的
s*****n
发帖数: 2174
4
2没戏. 1,3没问题.

【在 R******d 的大作中提到】
: 比如说:
: 有100个人,有50种不同的习惯。习惯可以用binary string来描述这个人有或者没有这
: 个习惯。也可以用个数值来表示这个人有这个习惯的倾向。数据结构就是个100*50的矩
: 阵。
: 用这样的数据可以做点什么分析呢?(我说几个,然后大家补充一下吧)
: 1,找出哪些可能的习惯的模式/组合
: 2,找出哪些习惯是导致另外习惯的causal的原因
: 3,根据习惯的模式把人分成几种类型

D******n
发帖数: 2836
5
clustering

【在 R******d 的大作中提到】
: 比如说:
: 有100个人,有50种不同的习惯。习惯可以用binary string来描述这个人有或者没有这
: 个习惯。也可以用个数值来表示这个人有这个习惯的倾向。数据结构就是个100*50的矩
: 阵。
: 用这样的数据可以做点什么分析呢?(我说几个,然后大家补充一下吧)
: 1,找出哪些可能的习惯的模式/组合
: 2,找出哪些习惯是导致另外习惯的causal的原因
: 3,根据习惯的模式把人分成几种类型

R******d
发帖数: 1436
6
这个比较常规啊,还有什么有意思点的?
A*******s
发帖数: 3942
7
你的第一个思路是association rule mining,我觉得就挺有意思的,不过100的sample
size可能小了点

【在 R******d 的大作中提到】
: 这个比较常规啊,还有什么有意思点的?
R******d
发帖数: 1436
8
any idea?
R******d
发帖数: 1436
9
第二个俺已经做出来了,能做的
s*******g
发帖数: 483
10
co-clustering
相关主题
请大家推荐一本causal inference的书吧!【求助】求帮忙下载一篇哈佛的博士论文
学习统计的好处Google Statistician
有同学了解causal inference么?请教一个简单的统计学问题(补充了一些细节)
进入Statistics版参与讨论
s*****n
发帖数: 2174
11
you sure?

【在 R******d 的大作中提到】
: 第二个俺已经做出来了,能做的
c*******o
发帖数: 8869
12
google correspondence analysis

【在 R******d 的大作中提到】
: 比如说:
: 有100个人,有50种不同的习惯。习惯可以用binary string来描述这个人有或者没有这
: 个习惯。也可以用个数值来表示这个人有这个习惯的倾向。数据结构就是个100*50的矩
: 阵。
: 用这样的数据可以做点什么分析呢?(我说几个,然后大家补充一下吧)
: 1,找出哪些可能的习惯的模式/组合
: 2,找出哪些习惯是导致另外习惯的causal的原因
: 3,根据习惯的模式把人分成几种类型

R******d
发帖数: 1436
13
样本量1000

【在 s*****n 的大作中提到】
: you sure?
s*****n
发帖数: 2174
14
这和样本量有什么关系, 我看样本量1000万, 也弄不出causal来吧?

【在 R******d 的大作中提到】
: 样本量1000
R******d
发帖数: 1436
15
用贝叶斯网络来做

【在 s*****n 的大作中提到】
: 这和样本量有什么关系, 我看样本量1000万, 也弄不出causal来吧?
D******n
发帖数: 2836
16
你先google一下causation吧
cum hoc ergo propter hoc is a fallacy.

【在 R******d 的大作中提到】
: 用贝叶斯网络来做
T*******I
发帖数: 5138
17
你的原始数据没有关于哪个或哪几个是哪个或哪几个的cause, 你有何能耐搞出causal
模型?
莫不是把相关性联系误解为因果关系了吧?

【在 R******d 的大作中提到】
: 用贝叶斯网络来做
R******d
发帖数: 1436
18
我不觉得这个有很大问题。
贝叶斯网络(k2)根据概率分布找出各习惯之间的关系。如果知道习惯之间的先后顺序
,或者能有别的 story,为什么不能说找出了causality ?
T*******I
发帖数: 5138
19
问题是,你的原始数据中并没有“习惯之间的先后顺序,或者能有别的 story”等等之
类的样本信息。更何况“先后顺序”并非是一个因果关系成立的唯一的或充分的和必要
的条件。既然如此,你又怎么能得到你想要的causal模型?
这其实是个再简单不过的常识,即有方法但没有数据,从而也就不会有结果。
看起来你似乎需要补习一点哲学或逻辑学知识。

【在 R******d 的大作中提到】
: 我不觉得这个有很大问题。
: 贝叶斯网络(k2)根据概率分布找出各习惯之间的关系。如果知道习惯之间的先后顺序
: ,或者能有别的 story,为什么不能说找出了causality ?

1 (共1页)
进入Statistics版参与讨论
相关主题
求一本电子书 experimental and quasi-experimental design for generalized causal inference那位高人给解释一下causal model
Google Data Scientist/Statistician Recruiting请大家推荐一本causal inference的书吧!
[合集] k-mean clustering学习统计的好处
请教一个R:K-means的问题有同学了解causal inference么?
外行请教:这个问题有没有答案?【求助】求帮忙下载一篇哈佛的博士论文
[合集] 有人知道causal inference吗?Google Statistician
Propensity score or Instrumental Variable?请教一个简单的统计学问题(补充了一些细节)
怎么理解structural equation model是个causal model?真诚求paper review的机会 (Statistics/Biostatistics)
相关话题的讨论汇总
话题: 习惯话题: causal话题: 找出话题: 贝叶斯话题: clustering