由买买提看人间百态

topics

全部话题 - 话题: a2x2
(共0页)
t***a
发帖数: 68
1
来自主题: Mathematics版 - 关于多个regression的问题.
能说的在详细点么?
比如: 合并Y1=a1X1+a2X2+a3X3+a4X4+a5X5 和Y2=b1Z1+b2Z2+b3Z3+b4Z4.
Y=a1X1+a2X2+a3X3+a4X4+a5X5+b1Z1+b2Z2+b3Z3+b4Z4, 然后怎么写contraints呢?
多谢.

the
g****t
发帖数: 31659
2
来自主题: Mathematics版 - 关于多个regression的问题.
这就是linear regression
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5........

比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢.
i*****r
发帖数: 318
3
关于做K fold Cross validation。
1:
在SVM 中,SVM()命令里直接有一个cross=K,也可以做K折交叉验证。
问题是做完以后,svm可以显示预测值,比如
A.svm=svm(y~.,data=XYZ,cross=10)
A.predict=predict(svm)
R问题:在logistic回归,神经网络和SVM中做交叉验证
请问这个拟合的预测值是10折交叉验证里面哪一个预测模型的预测值?
2:在做logistic 回归中,R提供一个cv.glm()指令可以做K折交叉验证,然后显示准确
率是多少。cv.glm()只可以显示预测准确率是多少,请问我在哪里可以看到这个预测模
型的拟合预测值,还有这个模型里面各个变量的参数是多少呢? 比如
A.glm=glm(y~.,data=XYZ,family=binomial)
A.cv.glm=cv.glm(XYZ, A)
这里A.cv.glm只能预测准确率是多少,但我不知道模型的拟合预测值,也不知道公式P=
exp(a1X1+a2X2+...anXn)/(1+exp(a1X1+a2X2+...anXn))里面a1..
C********n
发帖数: 6682
4
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告
中喜马拉雅山的冰川消退耸人听闻的预测作为丑闻进行报道,就可以认为一个是标志性
事件
当然这个大厦的基础部分也是很庞大的,怎么入手也是个问题。不过最合适的题目其
实是比较好确定的,就是关于“Hockey Stick”的问题,因为围绕这个问题的斗争最为
精彩,材料最为充分,同时也是气候变化的核心问题之... 阅读全帖
z*h
发帖数: 773
5
【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖
z*h
发帖数: 773
6
【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖
r**********e
发帖数: 587
7
来自主题: Biology版 - machine learning来对GWAS结果建模
最近在做一些machine learning/data science的工作。
因为过去做过很多genomics,突然有一个想法,比如GWAS里top candidate的解释很困
难,或者基于top candidate来预测疾病几乎不可能。
那么是不是可以用各种machine learning办法来training比如几万个SNP;得到这几万
个SNP和疾病状态的关系呢?
Y = a1x1 + a2x2 + a3x3 + ....anxn (n = SNP number比如几万个)
比如这种最简单的线性关系,然后来寻找W=(a1,a2,a3,...an)这个vector的最优解
去搜了一下,有一些这样的paper,但并不是很多。大量GWAS data都是online
available的,而用python的机器学习package的运算量,也不会太大吧?反正比我们分
析WGS要小很多吧?所以我觉得每一种疾病的GWAS都可以拿来做modeling,看是否可以
得到good estimate of parameters
但为何看到的文章这么少(或许是我孤陋寡闻)?然后也没有看到有很好的ge... 阅读全帖
t***a
发帖数: 68
8
来自主题: Mathematics版 - 关于多个regression的问题.
比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢.
f**e
发帖数: 350
9
来自主题: Mathematics版 - 关于多个regression的问题.
[Y1-(a1X1+a2X2+a3X3+a4X4+a5X5)]^2 + [Y2-(a1Z1+b2Z2+a2Z3+a3Z4)]^2.
t***a
发帖数: 68
10
来自主题: Mathematics版 - 关于多个regression的问题.
没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?

b1,
g****t
发帖数: 31659
11
来自主题: Mathematics版 - 关于多个regression的问题.
你别用b1,b3,b4就行了.
未知数就那几个a1,a2,a3,a4,a5,b2

没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?
b1,
C********n
发帖数: 6682
12
【 以下文字转载自 Science 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Science
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:09:21 2011, 美东)
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域... 阅读全帖
C********n
发帖数: 6682
13
【 以下文字转载自 Military 讨论区 】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标 题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开,主流气候变化学术共同体遇到了历史上一个
真正的挑战,而一个月后哥本哈根本会议的“重大挫折”,又使得近年来气候政治的强
劲势头出现了严重困难,这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同,但总体看,气候科学是气候政治的基础,所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会(
IPCC)的强烈质疑,很多之前言之凿凿的神话正在倒塌,如长期鼓吹“人类造成的地球
变暖”(Anthropogenic Global Warming, AGW)的顶级科学期刊《自然》对IPCC报告... 阅读全帖
l*****e
发帖数: 701
14
来自主题: Statistics版 - 求教个regression问题
现要做个regression
y1 = a0 + a1x1 + a2x2
y2 = a3 + a1x2 + a3x1
主要问题是两个equation中,a1是common factor,改怎么操作...谢谢
h***i
发帖数: 3844
15
来自主题: Statistics版 - 求教个regression问题
argmin sum (y1-a0-a1x1-a2x2)^2+sum(y2-a3-a1x2-a3x1)^2
a0,a1,a2,a3
s**e
发帖数: 1523
16
有一个问题请教:我现在知道一组基因(N个)在两组病人里面的突变率,能不能用这
些数据构建一个模型,y=a0+a1X1+a2X2+a3X3+...+anXn?然后用这个模型判断第三组人
群发病的可能性?谢谢!
n*******y
发帖数: 437
17
来自主题: DataSciences版 - 大家电话面试都怎么准备的啊
我也在学统计,第一题我刚刚看书看到,跟大家交流一下,希望指正~
把数据copy几次得到更多数据,但是redundent数据,不能提供更多的信息。所以得到
的模型式子不变(y = a1x1 + a2x2 + ...),但是我们会误以为这个模型的
confidence level很高,也就是误以为参数ai的standard error很小,confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant,现
在你会误以为它significant。
比如想知道全美男子的平均身高,但是只量了一个人科比,然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"...
n*******y
发帖数: 437
18
来自主题: DataSciences版 - 大家电话面试都怎么准备的啊
我也在学统计,第一题我刚刚看书看到,跟大家交流一下,希望指正~
把数据copy几次得到更多数据,但是redundent数据,不能提供更多的信息。所以得到
的模型式子不变(y = a1x1 + a2x2 + ...),但是我们会误以为这个模型的
confidence level很高,也就是误以为参数ai的standard error很小,confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant,现
在你会误以为它significant。
比如想知道全美男子的平均身高,但是只量了一个人科比,然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"...
(共0页)