关于a2x2的讨论汇总 - 话题女王

t***a
发帖数: 68

能说的在详细点么?
比如: 合并Y1=a1X1+a2X2+a3X3+a4X4+a5X5 和Y2=b1Z1+b2Z2+b3Z3+b4Z4.
Y=a1X1+a2X2+a3X3+a4X4+a5X5+b1Z1+b2Z2+b3Z3+b4Z4, 然后怎么写contraints呢?
多谢.

the

g****t
发帖数: 31659

来自主题: Mathematics版 - 关于多个regression的问题.

这就是linear regression
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5........

比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢.

i*****r
发帖数: 318

来自主题: Statistics版 - R问题，logistic回归，神经网络，SVM中做交叉验证

关于做K fold Cross validation。
1：
在SVM 中，SVM()命令里直接有一个cross=K，也可以做K折交叉验证。
问题是做完以后，svm可以显示预测值，比如
A.svm=svm(y~.,data=XYZ,cross=10)
A.predict=predict(svm)
R问题：在logistic回归，神经网络和SVM中做交叉验证
请问这个拟合的预测值是10折交叉验证里面哪一个预测模型的预测值？
2：在做logistic 回归中，R提供一个cv.glm()指令可以做K折交叉验证，然后显示准确
率是多少。cv.glm()只可以显示预测准确率是多少，请问我在哪里可以看到这个预测模
型的拟合预测值，还有这个模型里面各个变量的参数是多少呢？比如
A.glm=glm(y~.,data=XYZ,family=binomial)
A.cv.glm=cv.glm(XYZ, A)
这里A.cv.glm只能预测准确率是多少，但我不知道模型的拟合预测值，也不知道公式P=
exp(a1X1+a2X2+...anXn)/(1+exp(a1X1+a2X2+...anXn))里面a1..

C********n
发帖数: 6682

来自主题: Military版 - “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz

http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开，主流气候变化学术共同体遇到了历史上一个
真正的挑战，而一个月后哥本哈根本会议的“重大挫折”，又使得近年来气候政治的强
劲势头出现了严重困难，这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同，但总体看，气候科学是气候政治的基础，所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会（
IPCC）的强烈质疑，很多之前言之凿凿的神话正在倒塌，如长期鼓吹“人类造成的地球
变暖”（Anthropogenic Global Warming, AGW）的顶级科学期刊《自然》对IPCC报告
中喜马拉雅山的冰川消退耸人听闻的预测作为丑闻进行报道，就可以认为一个是标志性
事件
当然这个大厦的基础部分也是很庞大的，怎么入手也是个问题。不过最合适的题目其
实是比较好确定的，就是关于“Hockey Stick”的问题，因为围绕这个问题的斗争最为
精彩，材料最为充分，同时也是气候变化的核心问题之... 阅读全帖

z*h
发帖数: 773

来自主题: Faculty版 - “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz (转载)

【以下文字转载自 Military 讨论区】
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开，主流气候变化学术共同体遇到了历史上一个
真正的挑战，而一个月后哥本哈根本会议的“重大挫折”，又使得近年来气候政治的强
劲势头出现了严重困难，这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同，但总体看，气候科学是气候政治的基础，所以后哥本哈根时
代的焦点仍然在气候科学领域。随着“气候门”带来的对政府间气候变化专门委员会（
IPCC）的强烈质疑，很多之前言之凿凿的神话正在倒塌，如长期鼓吹“人类造成的地球
变暖”（Anthropogenic Global Warming, AGW）的顶级科学期刊《自然》对IPCC报告... 阅读全帖

z*h
发帖数: 773

来自主题: ECUST版 - “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz (转载)

r**********e
发帖数: 587

来自主题: Biology版 - machine learning来对GWAS结果建模

最近在做一些machine learning/data science的工作。
因为过去做过很多genomics，突然有一个想法，比如GWAS里top candidate的解释很困
难，或者基于top candidate来预测疾病几乎不可能。
那么是不是可以用各种machine learning办法来training比如几万个SNP；得到这几万
个SNP和疾病状态的关系呢？
Y = a1x1 + a2x2 + a3x3 + ....anxn (n = SNP number比如几万个)
比如这种最简单的线性关系，然后来寻找W=(a1,a2,a3,...an)这个vector的最优解
去搜了一下，有一些这样的paper，但并不是很多。大量GWAS data都是online
available的，而用python的机器学习package的运算量，也不会太大吧？反正比我们分
析WGS要小很多吧？所以我觉得每一种疾病的GWAS都可以拿来做modeling，看是否可以
得到good estimate of parameters
但为何看到的文章这么少（或许是我孤陋寡闻）？然后也没有看到有很好的ge... 阅读全帖

t***a
发帖数: 68

来自主题: Mathematics版 - 关于多个regression的问题.

比如第一个regression有5个coefficient.
Y1=a1X1+a2X2+a3X3+a4X4+a5X5.
第二个regresion 有4个coefficient.
Y2=b1Z1+b2Z2+b3Z3+b4Z4.
X 和Z 之间没啥关系. 是不同的变量.
前提条件是a1=b1, a2=b3, a3=b4. 然后做regression, 求a1, a2, a3, a4, a5 和 b1,
b2, b3 和 b4. 当然结果应该a1=b1, a2=b3, a3=b4.
这种怎么求? 是叫啥regression?
谢谢.

f**e
发帖数: 350

来自主题: Mathematics版 - 关于多个regression的问题.

[Y1-(a1X1+a2X2+a3X3+a4X4+a5X5)]^2 + [Y2-(a1Z1+b2Z2+a2Z3+a3Z4)]^2.

t***a
发帖数: 68

来自主题: Mathematics版 - 关于多个regression的问题.

没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?

b1,

g****t
发帖数: 31659

来自主题: Mathematics版 - 关于多个regression的问题.

你别用b1,b3,b4就行了.
未知数就那几个a1,a2,a3,a4,a5,b2

没明白.
Y1=a1X1+a2X2+..a5X5+0*b2
Y2=0*a4+0*a5 + b1Z1+b2Z2+b3Z3+b4Z4 么?
那怎么体现a1=b1, a2=b3, a3=b4 呢?
b1,

C********n
发帖数: 6682

来自主题: Physics版 - “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz (转载)

【以下文字转载自 Science 讨论区】
发信人: Corinthian (Diogenes门下一走狗), 信区: Science
标题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:09:21 2011, 美东)
发信人: Corinthian (Diogenes门下一走狗), 信区: Military
标题: “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz
发信站: BBS 未名空间站 (Sat Jan 1 14:00:40 2011, 美东)
http://www.21bcr.com/a/shiye/yuwai/2010/0907/1563.html
随着2009年11月 “气候门”邮件的公开，主流气候变化学术共同体遇到了历史上一个
真正的挑战，而一个月后哥本哈根本会议的“重大挫折”，又使得近年来气候政治的强
劲势头出现了严重困难，这都是近二十年来“气候变化”界未遇到过的。这两条战线的
机制和规则自然有所不同，但总体看，气候科学是气候政治的基础，所以后哥本哈根时
代的焦点仍然在气候科学领域... 阅读全帖

C********n
发帖数: 6682

来自主题: Science版 - “曲棍球杆曲线”丑闻、气候泡沫与气候政治的未来 zz

l*****e
发帖数: 701

来自主题: Statistics版 - 求教个regression问题

现要做个regression
y1 = a0 + a1x1 + a2x2
y2 = a3 + a1x2 + a3x1
主要问题是两个equation中，a1是common factor，改怎么操作...谢谢

h***i
发帖数: 3844

来自主题: Statistics版 - 求教个regression问题

argmin sum (y1-a0-a1x1-a2x2)^2+sum(y2-a3-a1x2-a3x1)^2
a0,a1,a2,a3

s**e
发帖数: 1523

来自主题: Statistics版 - 构建模型的问题请教（可能用到lasso）

有一个问题请教：我现在知道一组基因（N个）在两组病人里面的突变率，能不能用这
些数据构建一个模型，y=a0+a1X1+a2X2+a3X3+...+anXn？然后用这个模型判断第三组人
群发病的可能性？谢谢！

n*******y
发帖数: 437

来自主题: DataSciences版 - 大家电话面试都怎么准备的啊

我也在学统计，第一题我刚刚看书看到，跟大家交流一下，希望指正～
把数据copy几次得到更多数据，但是redundent数据，不能提供更多的信息。所以得到
的模型式子不变（y = a1x1 + a2x2 + ...），但是我们会误以为这个模型的
confidence level很高，也就是误以为参数ai的standard error很小，confident
interval很窄。可能本来一个参数会在hypothesis test里边被认为insignificant，现
在你会误以为它significant。
比如想知道全美男子的平均身高，但是只量了一个人科比，然后把data复制10000次。
看data的人发现哇靠量了10000人全是6'6"...

n*******y
发帖数: 437

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天