t***a 发帖数: 68 | 1 能说的在详细点么?
比如: 合并Y1=a1X1+a2X2+a3X3+a4X4+a5X5 和Y2=b1Z1+b2Z2+b3Z3+b4Z4.
Y=a1X1+a2X2+a3X3+a4X4+a5X5+b1Z1+b2Z2+b3Z3+b4Z4, 然后怎么写contraints呢?
多谢.
the |
|
g****t 发帖数: 31659 | 2 这就是linear regression
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5........
比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢. |
|
i*****r 发帖数: 318 | 3 关于做K fold Cross validation。
1:
在SVM 中,SVM()命令里直接有一个cross=K,也可以做K折交叉验证。
问题是做完以后,svm可以显示预测值,比如
A.svm=svm(y~.,data=XYZ,cross=10)
A.predict=predict(svm)
R问题:在logistic回归,神经网络和SVM中做交叉验证
请问这个拟合的预测值是10折交叉验证里面哪一个预测模型的预测值?
2:在做logistic 回归中,R提供一个cv.glm()指令可以做K折交叉验证,然后显示准确
率是多少。cv.glm()只可以显示预测准确率是多少,请问我在哪里可以看到这个预测模
型的拟合预测值,还有这个模型里面各个变量的参数是多少呢? 比如
A.glm=glm(y~.,data=XYZ,family=binomial)
A.cv.glm=cv.glm(XYZ, A)
这里A.cv.glm只能预测准确率是多少,但我不知道模型的拟合预测值,也不知道公式P=
exp(a1X1+a2X2+...anXn)/(1+exp(a1X1+a2X2+...anXn))里面a1.. |
|
C********n 发帖数: 6682 | 4 http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告
中喜马拉雅山的冰川消退耸人听闻的预测作为丑闻进行报道,就可以认为一个是标志性
事件
当然这个大厦的基础部分也是很庞大的,怎么入手也是个问题。不过最合适的题目其
实是比较好确定的,就是关于“Hockey Stick”的问题,因为围绕这个问题的斗争最为
精彩,材料最为充分,同时也是气候变化的核心问题之... 阅读全帖 |
|
I*a 发帖数: 297 | 5 你在国内读过数学吗,我知道叫simplex,在国内,这种东西就叫n维空间的超平面。
基本上在一个线形空间x1, x2, ..., xn
形如
a1x1+..,+anxn=c
就定义了n维空间的一个(超)平面 |
|
z*h 发帖数: 773 | 6 【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖 |
|
z*h 发帖数: 773 | 7 【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖 |
|
w*r 发帖数: 64 | 8 需要用一个简单的math expression parser。类似于做:
f(x1, x2,... xn) = (a1x1 + x2 *x3)*a2 -x4 ..
基本上都是四则运算。有没有什么open source的上手就可以用的library?谢谢! |
|
r**********e 发帖数: 587 | 9 最近在做一些machine learning/data science的工作。
因为过去做过很多genomics,突然有一个想法,比如GWAS里top candidate的解释很困
难,或者基于top candidate来预测疾病几乎不可能。
那么是不是可以用各种machine learning办法来training比如几万个SNP;得到这几万
个SNP和疾病状态的关系呢?
Y = a1x1 + a2x2 + a3x3 + ....anxn (n = SNP number比如几万个)
比如这种最简单的线性关系,然后来寻找W=(a1,a2,a3,...an)这个vector的最优解
去搜了一下,有一些这样的paper,但并不是很多。大量GWAS data都是online
available的,而用python的机器学习package的运算量,也不会太大吧?反正比我们分
析WGS要小很多吧?所以我觉得每一种疾病的GWAS都可以拿来做modeling,看是否可以
得到good estimate of parameters
但为何看到的文章这么少(或许是我孤陋寡闻)?然后也没有看到有很好的ge... 阅读全帖 |
|
t***a 发帖数: 68 | 10 比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢. |
|
f**e 发帖数: 350 | 11 [Y1-(a1X1+a2X2+a3X3+a4X4+a5X5)]^2 + [Y2-(a1Z1+b2Z2+a2Z3+a3Z4)]^2. |
|
t***a 发帖数: 68 | 12 没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?
b1, |
|
g****t 发帖数: 31659 | 13 你别用b1,b3,b4就行了.
未知数就那几个a1,a2,a3,a4,a5,b2
没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?
b1, |
|
C********n 发帖数: 6682 | 14 【 以下文字转载自 Science 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Science
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:09:21 2011, 美东)
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域... 阅读全帖 |
|
C******a 发帖数: 115 | 15 假设顶点按某方向排列是(x1,y1),(x2,y2),...,(xn,yn).
令ai=xi*y(i+1)-x(i+1)*yi, Xi=(xi+x(i+1))/3, Yi=(yi+y(i+1))/3.
其中x(n+1)=x1, y(n+1)=y1.
则重心可能是((a1X1+...+anXn)/(a1+...+an), (a1Y1+...+anYn)/(a1+...+an))。
至少在凸多边形且原点在形内时这是正确的。一般情形可能也对,还没证明。 |
|
C********n 发帖数: 6682 | 16 【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖 |
|
h***i 发帖数: 3844 | 17 。。。。。。
A random vector X = (X1, …, Xk)′ is said to have the multivariate normal
distribution if it satisfies the following equivalent conditions
[1]:
* Every linear combination of its components Y = a1X1 + … + akXk is
normally distributed. That is, for any constant vector a ∈ Rk, the random
variable Y = a′X has a univariate normal distribution. |
|
l*****e 发帖数: 701 | 18 现要做个regression
y1 = a0 + a1x1 + a2x2
y2 = a3 + a1x2 + a3x1
主要问题是两个equation中,a1是common factor,改怎么操作...谢谢 |
|
h***i 发帖数: 3844 | 19 argmin sum (y1-a0-a1x1-a2x2)^2+sum(y2-a3-a1x2-a3x1)^2
a0,a1,a2,a3 |
|
s**e 发帖数: 1523 | 20 有一个问题请教:我现在知道一组基因(N个)在两组病人里面的突变率,能不能用这
些数据构建一个模型,y=a0+a1X1+a2X2+a3X3+...+anXn?然后用这个模型判断第三组人
群发病的可能性?谢谢! |
|
n*******y 发帖数: 437 | 21 我也在学统计,第一题我刚刚看书看到,跟大家交流一下,希望指正~
把数据copy几次得到更多数据,但是redundent数据,不能提供更多的信息。所以得到
的模型式子不变(y = a1x1 + a2x2 + ...),但是我们会误以为这个模型的
confidence level很高,也就是误以为参数ai的standard error很小,confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant,现
在你会误以为它significant。
比如想知道全美男子的平均身高,但是只量了一个人科比,然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"... |
|
n*******y 发帖数: 437 | 22 我也在学统计,第一题我刚刚看书看到,跟大家交流一下,希望指正~
把数据copy几次得到更多数据,但是redundent数据,不能提供更多的信息。所以得到
的模型式子不变(y = a1x1 + a2x2 + ...),但是我们会误以为这个模型的
confidence level很高,也就是误以为参数ai的standard error很小,confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant,现
在你会误以为它significant。
比如想知道全美男子的平均身高,但是只量了一个人科比,然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"... |
|