由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 说个面试题,大家讨论一下
相关主题
一个混合型联合分布的问题R code question
请教一道面试题请教一个SIMULATION的问题
脑筋急转弯的面试题Object oriented programming in SAS
quant analyst 一道概率的面试题请问:simulation tool for haplotype with LD
请教一道simulation的问题问一个用simulation的问题
##如果logistic回归自变量x不是线性的,怎么办?##sas simulation big dataset problem
[合集] simulation in SAS in Clinical trialsimulation问题请指教
a simulation problemsimulation for longitudinal data
相关话题的讨论汇总
话题: 100话题: unique话题: numbers话题: beans话题: unik
进入Statistics版参与讨论
1 (共1页)
I*****a
发帖数: 5425
1
1 到 100 , sample with replacement n 个数
问 on average 有多少个数是 unique 的。
k*******a
发帖数: 772
2
我觉得是
n*(1-(1-1/100)^n)
如果 n =100
= 100*(1-1/e) =63
n*****n
发帖数: 3123
3
n*(0.99)^(n-1)
b*****h
发帖数: 95
4
P^n_100/100^n?
l****u
发帖数: 529
5
n*100*(100-1)*(100-2)*....*(100-n+1)/100^n
D******n
发帖数: 2836
6
this is correct.

【在 k*******a 的大作中提到】
: 我觉得是
: n*(1-(1-1/100)^n)
: 如果 n =100
: = 100*(1-1/e) =63

n*****n
发帖数: 3123
7
你算下n=1,2,3的情况,就知道是不是正确了

【在 D******n 的大作中提到】
: this is correct.
I*****a
发帖数: 5425
8
nice

【在 k*******a 的大作中提到】
: 我觉得是
: n*(1-(1-1/100)^n)
: 如果 n =100
: = 100*(1-1/e) =63

D******n
发帖数: 2836
9
Given:
1:m numbers, with n draws, k is the unique number of numbers.
Question: E(K)=?
E(K)= E(I_1)+E(I_2) ... + E(I_m) = m*(1-((m-1)/m)^n)

【在 I*****a 的大作中提到】
: 1 到 100 , sample with replacement n 个数
: 问 on average 有多少个数是 unique 的。

n*****n
发帖数: 3123
10
n*(1-1/m)^(n-1)
你再想想。

【在 D******n 的大作中提到】
: Given:
: 1:m numbers, with n draws, k is the unique number of numbers.
: Question: E(K)=?
: E(K)= E(I_1)+E(I_2) ... + E(I_m) = m*(1-((m-1)/m)^n)

相关主题
##如果logistic回归自变量x不是线性的,怎么办?##R code question
[合集] simulation in SAS in Clinical trial请教一个SIMULATION的问题
a simulation problemObject oriented programming in SAS
进入Statistics版参与讨论
n*****n
发帖数: 3123
11
让n=1, 最后结果不是1的都是错的。
l*******r
发帖数: 28
12
correct

【在 n*****n 的大作中提到】
: n*(1-1/m)^(n-1)
: 你再想想。

k*******a
发帖数: 772
13
Agree, this is correct
We can easily verify using simulation
m=100 n=100: simulation: 63 prediction: 63
m=100 n=50 : simulation: 39 prediction: 39
m=100 n=25 : simulation: 22 prediction: 22
R code for simulation:
unik <- function(m, n) mean(sapply(1:1000, function(x) length(unique(sample(
1:m, n, replace=T)))))
unik(100, 100)
unik(100, 50)
unik(100, 25)

【在 D******n 的大作中提到】
: Given:
: 1:m numbers, with n draws, k is the unique number of numbers.
: Question: E(K)=?
: E(K)= E(I_1)+E(I_2) ... + E(I_m) = m*(1-((m-1)/m)^n)

k*******a
发帖数: 772
14
也可以说让m=1 n=1 结果不是1的都是错的
你的给的结果是0

【在 n*****n 的大作中提到】
: 让n=1, 最后结果不是1的都是错的。
n*****n
发帖数: 3123
15
这是对unique的理解不一样了
如果sampling的结果是 1,2,2 我认为unique的数只有1;你认为是1,2.

sample(

【在 k*******a 的大作中提到】
: Agree, this is correct
: We can easily verify using simulation
: m=100 n=100: simulation: 63 prediction: 63
: m=100 n=50 : simulation: 39 prediction: 39
: m=100 n=25 : simulation: 22 prediction: 22
: R code for simulation:
: unik <- function(m, n) mean(sapply(1:1000, function(x) length(unique(sample(
: 1:m, n, replace=T)))))
: unik(100, 100)
: unik(100, 50)

n*****n
发帖数: 3123
16
你知道 0^0等于多少吗?

【在 k*******a 的大作中提到】
: 也可以说让m=1 n=1 结果不是1的都是错的
: 你的给的结果是0

D******n
发帖数: 2836
17
yes,yes, two tricks here,
1) n draws of m numbers is equivalent to "n beans randomly distribute to m
bins". Unique number of numbers, therefore, is equivalent to "number of bins
with beans".
2) Construct Indicator Variables:
I_i, where
I_i = 1 when ith bin is with beans, and 0 if it is not,
so the number of bins with beans (K) is equal to
K = I_1 + I_2 + .... I_m
so, E(K) = E(I_1) + ... E(I_m) = m (1- ((m-1)/m)^n )

sample(

【在 k*******a 的大作中提到】
: Agree, this is correct
: We can easily verify using simulation
: m=100 n=100: simulation: 63 prediction: 63
: m=100 n=50 : simulation: 39 prediction: 39
: m=100 n=25 : simulation: 22 prediction: 22
: R code for simulation:
: unik <- function(m, n) mean(sapply(1:1000, function(x) length(unique(sample(
: 1:m, n, replace=T)))))
: unik(100, 100)
: unik(100, 50)

D******n
发帖数: 2836
18
你这个理解就比较奇异了,很多语言里面的function,譬如R或者linux command都是我
们那样的理解。

【在 n*****n 的大作中提到】
: 这是对unique的理解不一样了
: 如果sampling的结果是 1,2,2 我认为unique的数只有1;你认为是1,2.
:
: sample(

k*******a
发帖数: 772
19
原来是这样子的
那我们考虑的问题不同
你的要难些

这是对unique的理解不一样了如果sampling的结果是 1,2,2

【在 n*****n 的大作中提到】
: 这是对unique的理解不一样了
: 如果sampling的结果是 1,2,2 我认为unique的数只有1;你认为是1,2.
:
: sample(

n*****n
发帖数: 3123
20
好吧,奇异就奇异吧。

【在 D******n 的大作中提到】
: 你这个理解就比较奇异了,很多语言里面的function,譬如R或者linux command都是我
: 们那样的理解。

D******n
发帖数: 2836
21
没有啊,用我那个framework一样的容易推导
E(K) = m{ n [ (1/m) * ((m-1)/m)^(n-1) ] }
= n*((m-1)/m)^(n-1)

【在 k*******a 的大作中提到】
: 原来是这样子的
: 那我们考虑的问题不同
: 你的要难些
:
: 这是对unique的理解不一样了如果sampling的结果是 1,2,2

l*******r
发帖数: 28
22
我也是你那么理解的。没觉着有什么奇异的。

【在 n*****n 的大作中提到】
: 好吧,奇异就奇异吧。
1 (共1页)
进入Statistics版参与讨论
相关主题
simulation for longitudinal data请教一道simulation的问题
怎样照这样一个归一化函数。##如果logistic回归自变量x不是线性的,怎么办?##
一般的统计仿真实验和monte carlo simulation是一回事吗?[合集] simulation in SAS in Clinical trial
怎么做a/b simulationa simulation problem
一个混合型联合分布的问题R code question
请教一道面试题请教一个SIMULATION的问题
脑筋急转弯的面试题Object oriented programming in SAS
quant analyst 一道概率的面试题请问:simulation tool for haplotype with LD
相关话题的讨论汇总
话题: 100话题: unique话题: numbers话题: beans话题: unik