z****e 发帖数: 702 | 1 有p+1个R^p空间的单位矢量{x_k}_{k=1}^{p+1},彼此之间有相同的内积(夹角),
以此K个矢量构成矩阵:\sum_{k=1}^{p+1} x_k (x_k)_^T,则此矩阵的行列式是多少?
这个看上去是个挺有意思的问题,但是我没有办法想清楚。 |
x******a 发帖数: 6336 | 2 那个求和表达式是个什么?K在哪?
【在 z****e 的大作中提到】 : 有p+1个R^p空间的单位矢量{x_k}_{k=1}^{p+1},彼此之间有相同的内积(夹角), : 以此K个矢量构成矩阵:\sum_{k=1}^{p+1} x_k (x_k)_^T,则此矩阵的行列式是多少? : 这个看上去是个挺有意思的问题,但是我没有办法想清楚。
|
z****e 发帖数: 702 | 3 3维空间里夹角两两相同的矢量有4个(正四面体的顶点们),2维空间里是3个,对吧。
想象一下,这些矢量都从原点出发,长度都为1,彼此夹角相同,
对于每个矢量,x, xx'是一个秩为一的矩阵,把这些秩为一的矩阵相加得到一个和矩阵
,则此和
矩阵的行列式是什么?假设不一定在3维空间,可以是在p维空间。
我算了2、3维的情况,答案似乎是: [(p+1)/p]^p,也就是说这个和矩阵是对角线元素
为(p+1)/p,其他元素为0的矩阵。但不知道怎么得到任意p维的解。
【在 x******a 的大作中提到】 : 那个求和表达式是个什么?K在哪?
|
x******a 发帖数: 6336 | 4 一维矩阵的和还应该是一维矩阵吧?和矩阵难道不是一个数?
如果和矩阵是1*p的,行列式是怎么定义的?
【在 z****e 的大作中提到】 : 3维空间里夹角两两相同的矢量有4个(正四面体的顶点们),2维空间里是3个,对吧。 : 想象一下,这些矢量都从原点出发,长度都为1,彼此夹角相同, : 对于每个矢量,x, xx'是一个秩为一的矩阵,把这些秩为一的矩阵相加得到一个和矩阵 : ,则此和 : 矩阵的行列式是什么?假设不一定在3维空间,可以是在p维空间。 : 我算了2、3维的情况,答案似乎是: [(p+1)/p]^p,也就是说这个和矩阵是对角线元素 : 为(p+1)/p,其他元素为0的矩阵。但不知道怎么得到任意p维的解。
|
r**q 发帖数: 251 | 5 确定3维算的是对的?
跟据对称性, 这p+1个中每个向量都是和矩阵的特征向量, 然后你算下特征值, 特征值的p次方
就是了
【在 z****e 的大作中提到】 : 3维空间里夹角两两相同的矢量有4个(正四面体的顶点们),2维空间里是3个,对吧。 : 想象一下,这些矢量都从原点出发,长度都为1,彼此夹角相同, : 对于每个矢量,x, xx'是一个秩为一的矩阵,把这些秩为一的矩阵相加得到一个和矩阵 : ,则此和 : 矩阵的行列式是什么?假设不一定在3维空间,可以是在p维空间。 : 我算了2、3维的情况,答案似乎是: [(p+1)/p]^p,也就是说这个和矩阵是对角线元素 : 为(p+1)/p,其他元素为0的矩阵。但不知道怎么得到任意p维的解。
|
z****e 发帖数: 702 | 6 你说的是对的,能推出[(p+1)/p]^p是对的。谢谢。
征值的p次方
【在 r**q 的大作中提到】 : 确定3维算的是对的? : 跟据对称性, 这p+1个中每个向量都是和矩阵的特征向量, 然后你算下特征值, 特征值的p次方 : 就是了
|
c*******h 发帖数: 1096 | 7 X = [x_1, ... x_{p+1}]
你那个矩阵是 XX',它的特征根和 X'X 的一样,除了特征根为 0 的情况
后面那个矩阵出来对角线是 1,非对角线的元素都是内积,假设是 a
因为 X'X 有一个特征根是 0,其它的都是 1-a,
所以 XX' 的行列式是 (1-a)^p
因为所有 x 加起来是 0,所以 X'X 的每行和都是 0,所以 a = -1/p
搞定
【在 z****e 的大作中提到】 : 有p+1个R^p空间的单位矢量{x_k}_{k=1}^{p+1},彼此之间有相同的内积(夹角), : 以此K个矢量构成矩阵:\sum_{k=1}^{p+1} x_k (x_k)_^T,则此矩阵的行列式是多少? : 这个看上去是个挺有意思的问题,但是我没有办法想清楚。
|
z****e 发帖数: 702 | 8 你这个也是对的,多谢了。但是实际上我的问题比这个更复杂:
有K*p维矩阵A(K<=p),行向量记为a_k,k=1,2,...,K。和p维列向量x。(a_k,和x都
为单位向量)。
先由A和x生成一个(用Logit function)K个分量的离散概率分布:
P(k)=exp(a_k*x)/\sum_{k=1}^K exp(a_k*x),k=1,2,...,p。
再由P(k)和A生成两个矩阵,一个是B,B是K个矩阵a_k'a_k用P(k)取期望;
另一个是C,C是先用P(k)对A的行向量取期望得到行向量a,C=a'a;
然后B-C,其实是一个Fisher信息矩阵,我希望找到使行列式|B-C|最大的那个矩阵A。
(即用行列式来衡量Fisher信息矩阵的大小,我不知道还有没有其他的衡量方法。)。
因为a_k,k=1,2,...,p 和x 都是在R^p空间内的单位向量,我自己从直观上认为使|B-C|
最大那个矩阵A,应是和x正交的子空间内,a_k之间有相等的最大夹角。这也就是我开
始提出的问题。这个问题的题设并不难,但是因为P(k)的引入,不知道该怎么解?
少?
【在 c*******h 的大作中提到】 : X = [x_1, ... x_{p+1}] : 你那个矩阵是 XX',它的特征根和 X'X 的一样,除了特征根为 0 的情况 : 后面那个矩阵出来对角线是 1,非对角线的元素都是内积,假设是 a : 因为 X'X 有一个特征根是 0,其它的都是 1-a, : 所以 XX' 的行列式是 (1-a)^p : 因为所有 x 加起来是 0,所以 X'X 的每行和都是 0,所以 a = -1/p : 搞定
|
c*******h 发帖数: 1096 | 9 什么叫K个矩阵用P(k)取期望
我的理解是P(k)是x的函数,而x是向量
C|
【在 z****e 的大作中提到】 : 你这个也是对的,多谢了。但是实际上我的问题比这个更复杂: : 有K*p维矩阵A(K<=p),行向量记为a_k,k=1,2,...,K。和p维列向量x。(a_k,和x都 : 为单位向量)。 : 先由A和x生成一个(用Logit function)K个分量的离散概率分布: : P(k)=exp(a_k*x)/\sum_{k=1}^K exp(a_k*x),k=1,2,...,p。 : 再由P(k)和A生成两个矩阵,一个是B,B是K个矩阵a_k'a_k用P(k)取期望; : 另一个是C,C是先用P(k)对A的行向量取期望得到行向量a,C=a'a; : 然后B-C,其实是一个Fisher信息矩阵,我希望找到使行列式|B-C|最大的那个矩阵A。 : (即用行列式来衡量Fisher信息矩阵的大小,我不知道还有没有其他的衡量方法。)。 : 因为a_k,k=1,2,...,p 和x 都是在R^p空间内的单位向量,我自己从直观上认为使|B-C|
|
z****e 发帖数: 702 | 10 x是个定值,而A是变化的。
K个矩阵用P(k)取期望是指:\sum_{k=1}^K P(k)a_k'a_k。
即每个A的行向量得到的秩为一的矩阵a_k'a_k,用P(k)的加权和。即B。
而C是先用P(k)对A的行向量取平均,得到一个均值行向量a,然后C=a'a。
即B是先求矩阵,再求期望;C是先求期望,再得到矩阵。
x都
A。
)。
B-
【在 c*******h 的大作中提到】 : 什么叫K个矩阵用P(k)取期望 : 我的理解是P(k)是x的函数,而x是向量 : : C|
|
c*******h 发帖数: 1096 | 11 K
【在 z****e 的大作中提到】 : x是个定值,而A是变化的。 : K个矩阵用P(k)取期望是指:\sum_{k=1}^K P(k)a_k'a_k。 : 即每个A的行向量得到的秩为一的矩阵a_k'a_k,用P(k)的加权和。即B。 : 而C是先用P(k)对A的行向量取平均,得到一个均值行向量a,然后C=a'a。 : 即B是先求矩阵,再求期望;C是先求期望,再得到矩阵。 : : x都 : A。 : )。 : B-
|
z****e 发帖数: 702 | 12 那应该用行列式以外的东西来衡量B-C的“大小”了,
但是除了行列式,我不知道还有什么可以用来衡量Fisher信息矩阵了。
【在 c*******h 的大作中提到】 : K
|
z****e 发帖数: 702 | 13 谢谢各位,我终于完整地解决了这个问题,谢谢。
C|
【在 z****e 的大作中提到】 : 你这个也是对的,多谢了。但是实际上我的问题比这个更复杂: : 有K*p维矩阵A(K<=p),行向量记为a_k,k=1,2,...,K。和p维列向量x。(a_k,和x都 : 为单位向量)。 : 先由A和x生成一个(用Logit function)K个分量的离散概率分布: : P(k)=exp(a_k*x)/\sum_{k=1}^K exp(a_k*x),k=1,2,...,p。 : 再由P(k)和A生成两个矩阵,一个是B,B是K个矩阵a_k'a_k用P(k)取期望; : 另一个是C,C是先用P(k)对A的行向量取期望得到行向量a,C=a'a; : 然后B-C,其实是一个Fisher信息矩阵,我希望找到使行列式|B-C|最大的那个矩阵A。 : (即用行列式来衡量Fisher信息矩阵的大小,我不知道还有没有其他的衡量方法。)。 : 因为a_k,k=1,2,...,p 和x 都是在R^p空间内的单位向量,我自己从直观上认为使|B-C|
|