I*****a 发帖数: 5425 | 1 1 到 100 , sample with replacement n 个数
问 on average 有多少个数是 unique 的。 |
k*******a 发帖数: 772 | 2 我觉得是
n*(1-(1-1/100)^n)
如果 n =100
= 100*(1-1/e) =63 |
n*****n 发帖数: 3123 | |
b*****h 发帖数: 95 | |
l****u 发帖数: 529 | 5 n*100*(100-1)*(100-2)*....*(100-n+1)/100^n |
D******n 发帖数: 2836 | 6 this is correct.
【在 k*******a 的大作中提到】 : 我觉得是 : n*(1-(1-1/100)^n) : 如果 n =100 : = 100*(1-1/e) =63
|
n*****n 发帖数: 3123 | 7 你算下n=1,2,3的情况,就知道是不是正确了
【在 D******n 的大作中提到】 : this is correct.
|
I*****a 发帖数: 5425 | 8 nice
【在 k*******a 的大作中提到】 : 我觉得是 : n*(1-(1-1/100)^n) : 如果 n =100 : = 100*(1-1/e) =63
|
D******n 发帖数: 2836 | 9 Given:
1:m numbers, with n draws, k is the unique number of numbers.
Question: E(K)=?
E(K)= E(I_1)+E(I_2) ... + E(I_m) = m*(1-((m-1)/m)^n)
【在 I*****a 的大作中提到】 : 1 到 100 , sample with replacement n 个数 : 问 on average 有多少个数是 unique 的。
|
n*****n 发帖数: 3123 | 10 n*(1-1/m)^(n-1)
你再想想。
【在 D******n 的大作中提到】 : Given: : 1:m numbers, with n draws, k is the unique number of numbers. : Question: E(K)=? : E(K)= E(I_1)+E(I_2) ... + E(I_m) = m*(1-((m-1)/m)^n)
|
|
|
n*****n 发帖数: 3123 | |
l*******r 发帖数: 28 | 12 correct
【在 n*****n 的大作中提到】 : n*(1-1/m)^(n-1) : 你再想想。
|
k*******a 发帖数: 772 | 13 Agree, this is correct
We can easily verify using simulation
m=100 n=100: simulation: 63 prediction: 63
m=100 n=50 : simulation: 39 prediction: 39
m=100 n=25 : simulation: 22 prediction: 22
R code for simulation:
unik <- function(m, n) mean(sapply(1:1000, function(x) length(unique(sample(
1:m, n, replace=T)))))
unik(100, 100)
unik(100, 50)
unik(100, 25)
【在 D******n 的大作中提到】 : Given: : 1:m numbers, with n draws, k is the unique number of numbers. : Question: E(K)=? : E(K)= E(I_1)+E(I_2) ... + E(I_m) = m*(1-((m-1)/m)^n)
|
k*******a 发帖数: 772 | 14 也可以说让m=1 n=1 结果不是1的都是错的
你的给的结果是0
【在 n*****n 的大作中提到】 : 让n=1, 最后结果不是1的都是错的。
|
n*****n 发帖数: 3123 | 15 这是对unique的理解不一样了
如果sampling的结果是 1,2,2 我认为unique的数只有1;你认为是1,2.
sample(
【在 k*******a 的大作中提到】 : Agree, this is correct : We can easily verify using simulation : m=100 n=100: simulation: 63 prediction: 63 : m=100 n=50 : simulation: 39 prediction: 39 : m=100 n=25 : simulation: 22 prediction: 22 : R code for simulation: : unik <- function(m, n) mean(sapply(1:1000, function(x) length(unique(sample( : 1:m, n, replace=T))))) : unik(100, 100) : unik(100, 50)
|
n*****n 发帖数: 3123 | 16 你知道 0^0等于多少吗?
【在 k*******a 的大作中提到】 : 也可以说让m=1 n=1 结果不是1的都是错的 : 你的给的结果是0
|
D******n 发帖数: 2836 | 17 yes,yes, two tricks here,
1) n draws of m numbers is equivalent to "n beans randomly distribute to m
bins". Unique number of numbers, therefore, is equivalent to "number of bins
with beans".
2) Construct Indicator Variables:
I_i, where
I_i = 1 when ith bin is with beans, and 0 if it is not,
so the number of bins with beans (K) is equal to
K = I_1 + I_2 + .... I_m
so, E(K) = E(I_1) + ... E(I_m) = m (1- ((m-1)/m)^n )
sample(
【在 k*******a 的大作中提到】 : Agree, this is correct : We can easily verify using simulation : m=100 n=100: simulation: 63 prediction: 63 : m=100 n=50 : simulation: 39 prediction: 39 : m=100 n=25 : simulation: 22 prediction: 22 : R code for simulation: : unik <- function(m, n) mean(sapply(1:1000, function(x) length(unique(sample( : 1:m, n, replace=T))))) : unik(100, 100) : unik(100, 50)
|
D******n 发帖数: 2836 | 18 你这个理解就比较奇异了,很多语言里面的function,譬如R或者linux command都是我
们那样的理解。
【在 n*****n 的大作中提到】 : 这是对unique的理解不一样了 : 如果sampling的结果是 1,2,2 我认为unique的数只有1;你认为是1,2. : : sample(
|
k*******a 发帖数: 772 | 19 原来是这样子的
那我们考虑的问题不同
你的要难些
这是对unique的理解不一样了如果sampling的结果是 1,2,2
【在 n*****n 的大作中提到】 : 这是对unique的理解不一样了 : 如果sampling的结果是 1,2,2 我认为unique的数只有1;你认为是1,2. : : sample(
|
n*****n 发帖数: 3123 | 20 好吧,奇异就奇异吧。
【在 D******n 的大作中提到】 : 你这个理解就比较奇异了,很多语言里面的function,譬如R或者linux command都是我 : 们那样的理解。
|
D******n 发帖数: 2836 | 21 没有啊,用我那个framework一样的容易推导
E(K) = m{ n [ (1/m) * ((m-1)/m)^(n-1) ] }
= n*((m-1)/m)^(n-1)
【在 k*******a 的大作中提到】 : 原来是这样子的 : 那我们考虑的问题不同 : 你的要难些 : : 这是对unique的理解不一样了如果sampling的结果是 1,2,2
|
l*******r 发帖数: 28 | 22 我也是你那么理解的。没觉着有什么奇异的。
【在 n*****n 的大作中提到】 : 好吧,奇异就奇异吧。
|