t***a 发帖数: 68 | 1 能说的在详细点么?
比如: 合并Y1=a1X1+a2X2+a3X3+a4X4+a5X5 和Y2=b1Z1+b2Z2+b3Z3+b4Z4.
Y=a1X1+a2X2+a3X3+a4X4+a5X5+b1Z1+b2Z2+b3Z3+b4Z4, 然后怎么写contraints呢?
多谢.
the |
|
g****t 发帖数: 31659 | 2 这就是linear regression
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5........
比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢. |
|
i*****r 发帖数: 318 | 3 关于做K fold Cross validation。
1:
在SVM 中,SVM()命令里直接有一个cross=K,也可以做K折交叉验证。
问题是做完以后,svm可以显示预测值,比如
A.svm=svm(y~.,data=XYZ,cross=10)
A.predict=predict(svm)
R问题:在logistic回归,神经网络和SVM中做交叉验证
请问这个拟合的预测值是10折交叉验证里面哪一个预测模型的预测值?
2:在做logistic 回归中,R提供一个cv.glm()指令可以做K折交叉验证,然后显示准确
率是多少。cv.glm()只可以显示预测准确率是多少,请问我在哪里可以看到这个预测模
型的拟合预测值,还有这个模型里面各个变量的参数是多少呢? 比如
A.glm=glm(y~.,data=XYZ,family=binomial)
A.cv.glm=cv.glm(XYZ, A)
这里A.cv.glm只能预测准确率是多少,但我不知道模型的拟合预测值,也不知道公式P=
exp(a1X1+a2X2+...anXn)/(1+exp(a1X1+a2X2+...anXn))里面a1.. |
|
C********n 发帖数: 6682 | 4 http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告
中喜马拉雅山的冰川消退耸人听闻的预测作为丑闻进行报道,就可以认为一个是标志性
事件
当然这个大厦的基础部分也是很庞大的,怎么入手也是个问题。不过最合适的题目其
实是比较好确定的,就是关于“Hockey Stick”的问题,因为围绕这个问题的斗争最为
精彩,材料最为充分,同时也是气候变化的核心问题之... 阅读全帖 |
|
z*h 发帖数: 773 | 5 【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖 |
|
z*h 发帖数: 773 | 6 【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖 |
|
r**********e 发帖数: 587 | 7 最近在做一些machine learning/data science的工作。
因为过去做过很多genomics,突然有一个想法,比如GWAS里top candidate的解释很困
难,或者基于top candidate来预测疾病几乎不可能。
那么是不是可以用各种machine learning办法来training比如几万个SNP;得到这几万
个SNP和疾病状态的关系呢?
Y = a1x1 + a2x2 + a3x3 + ....anxn (n = SNP number比如几万个)
比如这种最简单的线性关系,然后来寻找W=(a1,a2,a3,...an)这个vector的最优解
去搜了一下,有一些这样的paper,但并不是很多。大量GWAS data都是online
available的,而用python的机器学习package的运算量,也不会太大吧?反正比我们分
析WGS要小很多吧?所以我觉得每一种疾病的GWAS都可以拿来做modeling,看是否可以
得到good estimate of parameters
但为何看到的文章这么少(或许是我孤陋寡闻)?然后也没有看到有很好的ge... 阅读全帖 |
|
t***a 发帖数: 68 | 8 比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢. |
|
f**e 发帖数: 350 | 9 [Y1-(a1X1+a2X2+a3X3+a4X4+a5X5)]^2 + [Y2-(a1Z1+b2Z2+a2Z3+a3Z4)]^2. |
|
t***a 发帖数: 68 | 10 没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?
b1, |
|
g****t 发帖数: 31659 | 11 你别用b1,b3,b4就行了.
未知数就那几个a1,a2,a3,a4,a5,b2
没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?
b1, |
|
C********n 发帖数: 6682 | 12 【 以下文字转载自 Science 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Science
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:09:21 2011, 美东)
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域... 阅读全帖 |
|
C********n 发帖数: 6682 | 13 【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖 |
|
l*****e 发帖数: 701 | 14 现要做个regression
y1 = a0 + a1x1 + a2x2
y2 = a3 + a1x2 + a3x1
主要问题是两个equation中,a1是common factor,改怎么操作...谢谢 |
|
h***i 发帖数: 3844 | 15 argmin sum (y1-a0-a1x1-a2x2)^2+sum(y2-a3-a1x2-a3x1)^2
a0,a1,a2,a3 |
|
s**e 发帖数: 1523 | 16 有一个问题请教:我现在知道一组基因(N个)在两组病人里面的突变率,能不能用这
些数据构建一个模型,y=a0+a1X1+a2X2+a3X3+...+anXn?然后用这个模型判断第三组人
群发病的可能性?谢谢! |
|
n*******y 发帖数: 437 | 17 我也在学统计,第一题我刚刚看书看到,跟大家交流一下,希望指正~
把数据copy几次得到更多数据,但是redundent数据,不能提供更多的信息。所以得到
的模型式子不变(y = a1x1 + a2x2 + ...),但是我们会误以为这个模型的
confidence level很高,也就是误以为参数ai的standard error很小,confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant,现
在你会误以为它significant。
比如想知道全美男子的平均身高,但是只量了一个人科比,然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"... |
|
n*******y 发帖数: 437 | 18 我也在学统计,第一题我刚刚看书看到,跟大家交流一下,希望指正~
把数据copy几次得到更多数据,但是redundent数据,不能提供更多的信息。所以得到
的模型式子不变(y = a1x1 + a2x2 + ...),但是我们会误以为这个模型的
confidence level很高,也就是误以为参数ai的standard error很小,confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant,现
在你会误以为它significant。
比如想知道全美男子的平均身高,但是只量了一个人科比,然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"... |
|