由买买提看人间百态

topics

全部话题 - 话题: 拟合
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
o******e
发帖数: 1001
1
来自主题: Quant版 - 拟合mean reverting process
现在手头有一堆数据,想要用统计的方法拟合成mean reverting process。从来没有做
过这个事情,大家能不能提供一些关键词啊?谢了!
s***e
发帖数: 911
2
来自主题: Science版 - Re: how to 数值拟合?

这个非线性拟合的理论我不清楚, 但是有点想法或许可以用得上:利用其中任意四个点
定出一组{a,b,c,d}来. 这是个点的选择可以有C_6^4种. 于是你就得到一系列可能
的{a,b,c,d}_i. 最后对个个a_i, b_i, c_i,d_i求平均.
直觉上这个求法应该不错, 是否最优就不清楚了.我在想想有没有别的办法.
s***e
发帖数: 911
3
来自主题: Science版 - Re: how to 数值拟合?

主要不知道啥工具作这种非线性回归厉害啊...
我想偶们作物理的, 要用一个模型来拟合数据, 其实心里多半已经知道可行了. 要的只是
真正看看究竟贴近不贴近, 然后画图给别人看: 你看看, 在这组参数下就很不错.
酱子的话偶的办法就可以操作乐...
s***e
发帖数: 911
4
来自主题: Science版 - Re: how to 数值拟合?

我这个办法肯定不很好,不过你这个例子不对, hehe...针对你这个例子我的办法一定
给出a=1. 这个问题里面你有三个实验点. 其中任取两个都可以定出a,b. 你这个例子
无论取那两个都是a=1, b=0.于是最后平均还是a=1, b=0.
我猜是我没说清楚,你误解了我的算法. 我这个算法的思想是:
平面上有N个点, 我用一个曲线模型R(t,P)来拟合.加入n P, 则我们根据实验点共可以产生C_N^n条可能的曲线. 最后对参数平均, 其实就是对这个
C_N^n条曲线作了平均.
假如我们的曲线根据的model是正确的, 假设真正的那个曲线是R(t,P0). 那么实验点
确定出来了曲线系宗就看成围绕R(t,P0)的随机波动. 假设这个分布是Gaussian的,
那么你知道平均正好对应最可几.
以上是偶的办法根据的一点儿道理乐:P
c*****m
发帖数: 4817
5
来自主题: Statistics版 - 突然对直线拟合的R不明白起来了
分布一样,但error项的相对大小(相对measurement y的大小)就不一样了,你怎么能说
测量的准确性是一样呢?
当然,你最后的结论是对的, R^2不能衡量一个linear model拟合的好坏,但那已经是
另外一个问题了。
c*u
发帖数: 916
6
来自主题: Statistics版 - 突然对直线拟合的R不明白起来了
比如说一组数据在x-y坐标上是完全水平的,那么我认为画一条水平直线,应当是很好的
线性拟合, 但是这个时候算出来的R^2却很差,
o******e
发帖数: 1001
7
来自主题: Statistics版 - 一个统计拟合问题
有这样一个方程:
Y=e^(a*t)X+e^(b*t)+e^(c*a)*d, d是标准正态分布。
Y是t和X的方程,已知道Y,t,X,怎么拟合方程得到参数a,b,c。
谢谢!
o******e
发帖数: 1001
8
来自主题: Statistics版 - 一个统计拟合问题
fanta,你很内行啊!
这个方程是从stochastic differential equation 过来的。原始的模型是Ornstein–
Uhlenbeck process.通常OU模型假定时间步长一样,所有随机项是IID分布,可以用OLS或MLE解决,我现在时
间步长不一样,所以时间也是一个变量。
其实这就是非线性拟合问题,但是随机项不是IID,是独立但不同分布。
我还不知道MLE能不能处理不同分布的随机项。你有什么idea吗?
R******d
发帖数: 1436
9
来自主题: Statistics版 - sas直方图+拟合power-law
我想用sas画个直方图,并拟合power-law distribution,应该怎么做?
之前用正态分布proc univariate直接可以出来的。
多谢了。
o******e
发帖数: 1001
10
来自主题: Statistics版 - 还是MLE分布拟合问题
akoug,谢谢你那么长的回复!
这个问题具体是这样的,数据A包括好几列,a_1,a_2,a_3. 根据物理原因我们分别用
stochastic differential equations建立了两个模型X,Y,解这两个模型后,我们得到
的方程式有这样的关系:
X: a_3=e_x*a_1+f_x*a_2+g_x*N(0,1)
Y: a_3=e_y*a_1+f_y*a_1*a_2+g_y*N(0,1)
我们的目标是用数据A去拟合模型X和Y,求参数e_x,f_x,g_x,e_y,f_y,g_y,并且分析那
个模型更好。
你说的是有一定的道理,有这样的可能,X的likelihood值大,但是它的 (a_3-e_x*a_
1-f_x*a_2)/g_x的normality不好。在这种情况下,你觉得如何去评价模型的好于差?

F)
始用
a***g
发帖数: 2761
11
来自主题: Statistics版 - 还是MLE分布拟合问题
我有两个思路不知道可行不可行
第一个就是如果你们平时处理数据的时候就是习惯做正态假设,同时好像这种假设影响
也不大。你们为什么不把两个模型写在一起,先拟合一下全模型,再检验各项显著性。
这样就可能有所取舍。
第二个是你们也对假设正态比较不放心,这么用只是对余项还没有认识更深入。那么我
就是随嘴这么一说啊,可不可以试试混合模型,全是用正态也无所谓。这里有两点,第
一就是mle也是混合模型的基本手段,你又熟悉很好用起来。第二就是你的数据比较大
,就是混合模型的复杂度上去了也能支持。
一点闭门造车的建议,你就权当参考吧。

a_
u********y
发帖数: 164
12
来自主题: Statistics版 - 问一个模型拟合问题
有这么一个公式:
ai=R*bi*ci/(M+bi)/(N+ci)
ai,bi,ci都是已知数,表示我实验的参数变化,同时i表示是第几个式子,每个式子有
对应的a,b,c, 比如i=2时,有a2=R*b2*c2/(M+b2)/(N+c2)
R,M,N是不变的未知数,这个是我要求的。
那么我要变换多少次实验参数才能较准确的把R,M,N近似出来?需要用什么方法拟合?
因为实验有误差,不能直接列几个式子然后减来减去求出几个未知数的关系然后再求解。
有点像多元回归,但不知道怎么弄,请高人指点~
e*********g
发帖数: 77
13
来自主题: Statistics版 - PCA拟合问题
不大了解PCA
想用一堆变量拟合一堆数据,结果电脑几天反应不过来。
于是考虑减少变量,似乎得用PCA,
但看过来怎么都是在变量空间里面找主轴?而我的函数就一个,对各个变量的依赖(导
数)不同,
怎样才能剔除假的变量,而找到函数依赖性最大的那几个变量?
e*********g
发帖数: 77
14
来自主题: Statistics版 - PCA拟合问题
如果有可能可以非线性地组合成新的维度吗?
就拟合而言,不知哪个基于python的效率高一些,mcmc什么收敛太慢,像是scipy.
optimize.minimize 里的Nelder-Mead选项运行两天结果和初始值没什么变化,压根不
收敛。
W********g
发帖数: 346
15
来自主题: Mod_CHN_Hist版 - 盖一个大楼,名字还没想好
第二篇 所有模型都是错的
从高华的《红太阳》聊起
因为无法在大陆出版,高华的《紅太陽是怎樣升起的——延安整风的来龙去脉》(后面
简称《红太阳》)有一种禁书的神秘色彩。在吸引了关注的同时,在学术界和不是五毛
就是美分的网络世界引起了诸多争议。2011年12月26日高华先生离去,伴随着随着悼念
活动,争论又热闹起来。对于挺高的人,高和他的《红太阳》已经超越历史研究成为某
种象征,以至于在高的追悼会上喊出了“天会亮的!”。而反高的人则认为《红太阳》
一书硬伤太多,高华满嘴跑火车。
在对《红太阳》一书的众多评论中,个人觉得最有意思的是萧延中的[2]。在肯
定“这部学术著作仍有进一步规范和提炼的空间”的同时,萧又点出:“高华这部著作
真正的价值,与其说在于史料的细腻整理,不如说其更重要的意义在于修正、摆脱,甚
至颠覆了自40年代陈伯达、胡乔木以来已固化了的意识形态解释框架和话语表达,而独
创了一套崭新的历史叙述模式。”
所有模型都是错的
模式这个词用的很有趣,而我认为再进一步,叫“模型”或许更准确。根据牛津字典,
所谓模型(model)是一种简化的描述(a simplified descript... 阅读全帖
M******8
发帖数: 10589
16
http://my.cnd.org/modules/wfsection/article.php?articleid=33459

叶檀女士多次发表文章,呼吁中国继续实行计划生育。很多网友要我反驳她,我一笑了
之。2012年08月14日叶檀再次在英国《金融时报》中文网上发表文章《反智的人口增长
理论可以休矣(一)》。在文章结尾说:“我们不能指望美国那些生活在人口稀少的州
、对中国人口问题无关痛痒、主张放开生育的人”。既然叶女士挑上门了,来而不往非
礼也。我也只好写几句。
叶檀是复旦大学历史系博士毕业,受该校人口史教授葛剑雄、曹树基的影响很大,比如
她最近这篇文章中说:“葛剑雄先生主编的六卷本《中国人口史》(复旦大学出版社,
2000)是当代中国研究人口史最权威的著作,曹树基先生撰写其中四、五卷讨论明清时
期人口,可以窥斑见豹。”她引用葛、曹的人口资料以说明继续计划生育的必要性。
曹树基认为明清时已陷入马尔萨斯陷阱。为避免马尔萨斯陷阱,中国就应实行计划生育
。李中清和王丰教授不认为中国清朝陷入马尔萨斯陷阱。曹树基反驳说:“面对李中清
等的新理论,学者们不仅需要重写清代以来的中国人口史、经... 阅读全帖
c****3
发帖数: 10787
17
来自主题: Military版 - LIGO真的探测到引力波了吗?
梅晓春(1) 俞平(2)
(1)福州原创物理研究所 (2)美国Cognitech计算技术研究所
2016年2月11日,美国激光干涉引力波天文台(LIGO)的负责人,加州理工学院的
David Reitze教授向全世界宣布:人类首次直接探测到引力波,同时首次观测到双黑洞
的碰撞与并合。
这个实验结果轰动全球,成为各种媒体的热点新闻,在科学界被广泛讨论和高度推
崇。它意味着物理学界苦苦追寻几十年之后,爱因斯坦广义相对论关于引力波的预言最
终获得验证。标志着天文学已经进入新的时代,人类从此打开了一扇观测宇宙的全新窗
口。
事情追溯述到北京时间2015年9月14日17点50分45秒,位于美国路易斯安那州利文
斯顿和华盛顿州汉福德的激光干涉仪引力波天文台的两个探测器,在相差千分之7秒的
时间内观测到了一次引力波事件:GW150914。根据LIGO的数据,该引力波事件发生于距
离地球13亿光年之外的一个遥远星系中。两个分别为36和29太阳质量的黑洞并合为62太
阳质量的黑洞,3个太阳质量的物质被转化成引力波辐射到太空。在双黑洞并合最后时
刻,引力波辐射的峰值比整个可观测宇宙的电磁辐射强度还要高10... 阅读全帖

发帖数: 1
18
你这帖子里后面的讨论我接受你的批评,我在前一帖的回帖里确实有失“就事论事”的
原则,我接下来会详细分析为什么会有失“就事论事”原则。。。。。。。
-------------------------------------------------------------------
首先学商和管理都纳入文科范畴。。。理工文科的分界向来以需要数学知识的多少来衡
量。就拿统计做个例子。。。
纯文科的统计知识是高中文科数学底子,知道个图表怎么出来,稍微学习好的,差不多
能分清各种图表的关系和不同。。。知道些个平均值/方差/标准差的概念了。。。
文科偏样本调查类学科(为代表的就是心理学/部分商科)需要掌握如何熟练应用 方
差/标准差,正态分布的概念了。。。
工科除了基本统计学知识以外,开始就学习拟合及应用了,由拟合得出的函数来建模,
稍微高级点就偏向于用拟合出的数据通过建模来写模拟了。。。
理科的基础开始停留在如何理解拟合本身的含义,如何通过各种已有的统计模型来拟合
数据,从而建立自己的模型,然后熟练应用已有统计算法来建模拟程序,调试参数,预
测模型结果,比对实验数据。。。。。。
从工科开始,逻... 阅读全帖
b*w
发帖数: 19
19
来自主题: USTC版 - Very Frustrated from APS
三个星期前,我的officemate跟我说,你怎么没准备APS会议啊.我很惊讶,没人跟我说要
参加这个啊.他很同情的看着我说,老板给你报名参加了,他肯定忘记跟你说了.当时简直
不敢相信,老板一共就两个学生,这也能忘记.结果跑去一问,果然是他忘记了.再下来,连怎
么去,怎么住,都得我自己找办法解决.而我的实验根本就没有出结果,上个星期三,老板给
我一篇文章,让我按他们的去拟合数据.我们到现在为止刚做了一个样品(用来拟合的样品)
,明显的是不好.拟合就拟合吧,明明我已经得到最后的参数不对,老板总是不相信,一定要
给我贯彻他的那套想法,其实和我做的一样啊.最后一定要我按着他想的那么说.说什么呢,
就是说我们觉得我们这个想法能有多大多大作用,但实际上我们连自己的参数都拟合不出
来呢.
结果去了Indianapolis一看册子,简直都快晕倒了.老板替我交的abstract里说我们要说的
东西,我们现在根本就没有做呢.而我们牵强解释的东西,别人在1996年就做得不错了.唉,
我都不知道怎么敢站在台上跟那些行家鼓吹我们的模型的.最后说完了,给一个韩国学生追
问我们模型的明显的问题.感觉真是糟透了.那

发帖数: 1
20
导语:回观国内市场,这些不靠谱、不合医学逻辑和没有临床价值的事情反而愈演愈烈
,耗费了大量的资本和医疗资源,可谓几大乱象
本文作者代号HHH,目前为一家人工智能医疗创业公司的CEO,有10多年硅谷的高科技公
司的工作经历(Google, Cisco等),斯坦福商学院Sloan Fellow。
业内人的“针砭时弊”:AI医疗界的3大乱象以及如何评价医学人工智能的成果?
With machine learning situated at the peak of inflated expectations, we
can soften a subsequent crash into a “trough of disillusionment” by
fostering a stronger appreciation of the technology’s capabilities and
limitations.
今年6月底的《新英格兰》刊出了一篇观点文章《Machine Learning and Prediction
in Medicine — Beyond the Peak of ... 阅读全帖
i**o
发帖数: 1161
21
来自主题: ChineseMed版 - 给木鱼支招,如何灭亡中医
现在有一种流行观点,中医西医是在实践中对同一病情的不同理解,西医用血压血糖
激素,而中医不懂这些,对同样的东西用经络气血阴阳解释。 打个比方,西医是用直
角坐标(XY)来描述位置,中医用极坐标(角度,模)来描述同样的东西,如果这个观
点成立,那么中医一定会被西医替代掉,因为现在的XY极其精确,而极坐标很模糊,没
有存在的必要,反正二者都是在描述同样的东西,有一个坐标系足够了。

如果是这样,那么灭亡中医的步骤很明确,用现有的西医观测方式指标拟合出中医经
络现象,比如血压+血糖的平方-体重+胰岛素的二价求导,得出的模型刚好跟中医经络
脏腑脉象模型匹配,冰狗!中医可以废除了,以后就成为西医里的一个科就行了。
但是还有第二种可能,中医是在描述与西医不同的纬度,比如Z;西医观测苹果的的纬
度是大小重量,而中医偏偏是是看颜色; XY再精确,也拟合不出Z;大小重量再精确,
也拟合不出最模糊的颜色;血液科再发达,也替代不了神经科,二者的领域不同,观察
方式测试指标没有替代性。
这其实不是什么可能性,而是事实。反过来想想也能明白,如果经络现象不存在,如
果经络现象能用血管神经激素拟合解释,那中医... 阅读全帖
m********e
发帖数: 16
22
来自主题: Economics版 - Lucas1980这段话该怎么理解
我得理解:
小卢的观点是说那些复杂的试图完全拟合经济行为的模型并不能给我们认识经济行
为提供多少帮助,无论实证还是纯理论。这都是由于这些模型拘泥于细节,从而没有将重
要的因素抽象出来。
从数学上讲,L2空间的任何函数都可以被一个compact supported的无限可微的函数
所拟合(他们之间的距离渐进趋于0),并且这样的一个函数在一定条件下可微、可积。
因此小卢置疑这样的试图完全拟合周期曲线或者说想尽可能的囊括变量是否有助于我们认
识经济现实,是否有助于理论的改进。小卢坚持模型之所以成为模型,是供我们分离主要
变量,从而研究其行为模式,而不是为了拟合而拟合。
我想这也是80年代初复杂的联立方程被计量学界抛弃的原因:既不能提供更好的模
拟经济现实的能力,又因为过度复杂从而掩盖了真正重要的,需要被研究的方面。
其实挺佩服小卢的。不过感觉经济学家其实主要还是混饭吃的。经济现实过于复杂
了。







A****a
发帖数: 460
23
来自主题: Mathematics版 - 问一个数学问题,有包子
是我自己research中遇到的一个问题,我是做实验的,然后用函数来拟合实验结果从而
得出函数里的参数,如k1,k2,k3。 即y=f(t,k1,k2,k3),t是时间,y是实验测
得数据。
现在我们在做一组实验的时候,通过拟合得到了k1,k2,k3,然后我们在另一种条件下
的数据又得到了新的k1,k2,k3。然后我老板想通过比较原来的k1和新k1做出关于这两
种实验条件的结论。
1)但是我总觉得这种比较不是很严格,因为比如k2和k3的residue比较大都可能影响到
k1,导致比较两个k1不合理。我试着用英文跟老板解释这个问题,但是老板似乎对这个
问题不够重视,我该怎么用英语更好的解释呢?怎么用英语准确的表达这个问题?
(我的理解是,软件都是用最小二乘法拟合的,所以拟合结果都是依据三个k最小差的
平方和算出来的,那么很可能这两个方法里k2和k3会影响k1.)
2)有没有什么拟合方法让这种k1的比较更合理?
先谢
A****a
发帖数: 460
24
来自主题: Statistics版 - 问一个数学问题,有包子
是我自己research中遇到的一个问题,我是做实验的,然后用函数来拟合实验结果从而
得出函数里的参数,如k1,k2,k3。 即y=f(t,k1,k2,k3),t是时间,y是实验测
得数据。
现在我们在做一组实验的时候,通过拟合得到了k1,k2,k3,然后我们在另一种条件下
的数据又得到了新的k1,k2,k3。然后我老板想通过比较原来的k1和新k1做出关于这两
种实验条件的结论。
1)但是我总觉得这种比较不是很严格,因为比如k2和k3的residue比较大都可能影响到
k1,导致比较两个k1不合理。我试着用英文跟老板解释这个问题,但是老板似乎对这个
问题不够重视,我该怎么用英语更好的解释呢?怎么用英语准确的表达这个问题?
(我的理解是,软件都是用最小二乘法拟合的,所以拟合结果都是依据三个k最小差的
平方和算出来的,那么很可能这两个方法里k2和k3会影响k1.)
2)有没有什么拟合方法让这种k1的比较更合理?
先谢
C********g
发帖数: 9656
25
【 以下文字转载自 THU 讨论区 】
发信人: Communipig (共产猪), 信区: THU
标 题: 清华硕士及其导师被指抄袭 学校称构成学术不端
发信站: BBS 未名空间站 (Sun Jun 12 10:17:33 2011, 美东)
http://news.sohu.com/20110612/n309943569.shtml
来源:新民晚报·新民网
2011年06月12日04:18
潘晓春勾画出的论文核心公式被抄袭的地方 实习生 朱云辰 摄
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主
要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大
学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无
奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,
表示将会做出处理。
日前,快报记者就此事展开了... 阅读全帖
o***s
发帖数: 42149
26
潘晓春勾画出的论文核心公式被抄袭的地方
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,表示将会做出处理。
日前,快报记者就此事展开了调查。清华校方也向本报答复:初步构成学术不端,6月底将会作出最终的调查和处理结果。
无意中发现
论文被抄
最近这几年,潘晓春每年都有一篇学术论文发表,而这完全是兴趣使然。
“可能像我们这样工作多年的人,发表论文也就是评职称的需要,我当初也不排除这种想法,但后来发论文则与别人不同了,我确实很有兴趣研究些自己领域内的学术问题。”
潘晓春是江苏泰州人,1995年毕业于河海大学陆地水文专业,后进入东南大学攻读硕士,此后进入江苏省电力设计... 阅读全帖
j*******6
发帖数: 10
27

同学你好,感谢你的关注和回复!也感谢楼主帮忙将这点资料上传到这里。
我这本书是整体架构的上半部分,算是个半成品,本来有序一篇,因为有其他内容,并
没有最后改好,所以没有传上来,在那里面介绍了写作思路。
游戏这个东西,大家见仁见智。我个人的感觉是,不能和历史混为一谈,但是我却非常
重视它作为一种启发思路的方式而存在的角色。光荣做的《三国志11》非常仔细,虽然
有很多不合理的地方,但是他在这一作中将历史地理的考据体现出来了,很多玩家可以
通过对游戏资料的汲取来辅助自己了解三国的历史。我对历史游戏的主要评价是:游戏
就像对历史过程的拟合,有时候拟合的好,有时候拟合的不好,总归是一种拟合的方式
,绝不会完美,但也会提供给我们很多思路。所以,我觉得这样的游戏对我是一种启发。
文字的问题,确实如此。我一个人修改,无人校稿,有时候想得快,写得慢,有时候写
得快,想得慢,小错误和大错误都会出现,这是我修改的第三稿,远没有达到我的预期
效果,只是楼主想借这个机会拿出来和大家交流一下想法,自己也只是自娱自乐。平时
学业也比较忙,思路不连续,难免有很多问题,大家尽管拍砖,感谢大家的关注!
圣诞快乐!
20... 阅读全帖
M******a
发帖数: 6723
28
http://finance.ifeng.com/a/20160919/14888021_0.shtml
2016年09月19日 16:33来源:凤凰财经综合
来源:中信建投
零和博弈——渐行渐近的城市战争
内生性人口红利的趋缓
回顾我国快速发展的30年,本质是人口红利加速释放的30年,这期间我国总人口净增加
了3.24亿,其中15岁至64岁的人口数量保持了12年的连续增长,人口红利的快速释放也
加速了城乡的聚集,2014年人口密度也比1980年增长了38%,城镇化率从80年代初不到
20%的水平晋升至50%以上,带动了人口布局的重构,也推动了城市群发展以及房地产行
业的需求释放。
资料图
但进入“十二五”末,人口红利的可持续性已经成为各个学界关注的问题。一方面,人
口总量增速开始下行,人口自然增长率已经下降至5%以下,老龄化问题日趋严重,另一
方面,劳动力人口占比也出现拐头,抚养比正逐步抬升。我们此前在年度策略中做过测
算,主流城市的购房年龄段主要集中于25-34岁和35-44岁,这部分人群从2015年开始,
占比下滑斜率将逐步加大,虽然我们认为在2025年以前,25-44岁人口的总... 阅读全帖
f*****n
发帖数: 12752
29
对你的第一个问题,我知道的反例太多了。仗义每多屠狗辈,负心总是读书人。蔡京严
嵩到现代的无行文人,举不胜举。不说有才是否一定会放旷,才德本来就是两回事。不
然孔子也不用背上杀少正卯的罪名了。
第二个问题,outliers本来就是统计学的鸡肋,在原理和工具有限的前提下怎么处理都
难完美。在这个拟合里,顾城和我都不算outliers,反而完全符合拟合曲线。灵性强就
是变态,我毫无疑问和惭愧。我很谦虚,但不会故作谦虚。任何对我的吹捧和指责我都
可以毫无困难的接受。
对于大多数数据点,都和拟合曲线多多少少差点,甚至差好多,对于它们来说拟合曲线
有没有意义,和对于人类来说是完全不同的。归纳演绎,虽然不是完美,但是人类仅有
的工具了吧。人类能完善工具,不能因噎废食。
雄狮整天吃饱了睡觉,都不用捕食。只要不侵犯底盘,很好相处的
k**o
发帖数: 3006
30
☆─────────────────────────────────────☆
apolitical (无期徒刑) 于 (Thu Apr 11 12:52:03 2013, 美东) 提到:
趁板神在黑屋里关着,我来行为艺术啦。用希大师的eos 3拍了一场比赛。说明书上写
连拍是每秒4.7张,但实际操作达不到,不过我算了一下,一卷24张,洗扫花8块多,基
本按动快门每秒就扔出去一块多钱,连拍体育有肾上腺激素的涌动,这次跟着流动的还
有现金。
重点难题在对焦上,虽然能在胶片机上找到佳能现在数码对焦操作的影子,但我还没找
到感觉。对上焦很快很准,但追焦跟踪的难度很大。都说佳能技术储备强,我时光倒流
追抚奸商的过去,还需要更多时间摸索。我应该还会再谈谈对焦问题。
fuji superia 400
kodak ektar 100
顺便对比一下用7d拍的,光照条件相似。
对比胶片和数码,除了明显的不同色调外,胶片在明暗过度的处理上会不会好一些?条
件是大太阳直射,无云,7d给了明显的数码味,对比度很强,显得光很硬,胶片则显得
在细节上不是那么对比强烈,能看出是晴天,但不是那种让人睁不开眼... 阅读全帖
n******g
发帖数: 17225
31
来自主题: WaterWorld版 - 半年连续12跳,富士康中邪了?
数学和统计建模从来都没有证明模型正确描述了"真理"这个步骤啊.
原文首先从这次事件是一种情绪diffusion的假设开始,然后用于拟合diffusion最常用
的工具就是logistic曲线,所以得到了后续的拟合结果。
如果从阴谋论或者化学毒素造成幻觉等其他基本假设出发,应该不会去用logistic曲线
拟合,甚至不会有适合的模型去拟合。
C********g
发帖数: 9656
32
http://news.sohu.com/20110612/n309943569.shtml
来源:新民晚报·新民网
2011年06月12日04:18
潘晓春勾画出的论文核心公式被抄袭的地方 实习生 朱云辰 摄
如果不是在期刊数据库中多看那几眼,潘晓春或许并没有机会发现那篇跟自己的主
要思想、核心公式甚至个性化用语都高度近似的论文。
“我既气愤又惊诧。”潘晓春说。尤其是涉嫌抄袭者竟然出自清华大学。
41岁的潘晓春是江苏省电力设计院的一名高级工程师,他所指控的抄袭者是清华大
学的硕士孟昌波及其导师马吉明教授。今年初,潘晓春开始走上曲折的维权路。
几经交涉无果,潘晓春实名举报到清华大学,在被校方踢了几次皮球后,潘晓春无
奈将此事发到网络上,以期引起更多人的关注。今年5月,潘晓春终于得到校方回复,
表示将会做出处理。
日前,快报记者就此事展开了调查。清华校方也向本报答复:初步构成学术不端,
6月底将会作出最终的调查和处理结果。
快报记者 张瑜 王凡
无意中发现
论文被抄
最近这几年,潘晓春每年都有一篇学术论文发表,而这完全是兴趣使然。
“可能像我们这样工作多年的人,发表论文也就是评职称的需要... 阅读全帖
S**********e
发帖数: 1789
33
来自主题: ChineseMed版 - 说说我对量子力学的理解 (转载)
【 以下文字转载自 Physics 讨论区 】
发信人: WtMaster (关仁隐士), 信区: Physics
标 题: 说说我对量子力学的理解
发信站: BBS 未名空间站 (Tue Mar 20 19:45:25 2012, 美东)
我不是物理专业,水平有限。如有错误,请大家指正。
量子力学本质上是一个公理系统。它的核心是薛定谔方程。这是一个二阶偏微分方程。薛定谔方程相当于数学体系中的公理,因为它没有任何推导,没有任何证明。但是用这个方程可以解释一些实验现象和数据,所以人们就把它拿过来用了。薛定谔方程的解叫做波函数。刚开始的时候这个波函数没有任何物理上的解释,后来人们觉得一个物理理论总得有个物理解释吧,于是就把波函数解释成粒子的密度。在这个模型中,一颗粒子充满了整个空间,它在空间各点的密度由波函数给出。但是人们发现,一粒电子能充满整个空间,这实在令人难以接受。于是后来人们又把波函数解释成概率。这个解释比较符合人的直观,逐渐就被人们接受。因为引入了概率,所以才有了后来的不确定原理。
再后来不确定原理就被神化了。其实概率只不过是公理系统的一个解释。这个解释不是唯一的,甚至不是必须... 阅读全帖
v********y
发帖数: 2
34
来自主题: Computation版 - 请教一个线性回归的问题(急)
希望对一些二维数据进行线性拟合
但是拟合结果不可能只是一条线段
(如:如果这些二维数据形成一个圆,可能需要八条线段来进行拟合)
目的是使得拟合的误差在一定范围内
请问大虾知不知道什么算法,
或者在哪儿有介绍这个问题的比较经典的做法的
多谢了!
r****y
发帖数: 1437
35
来自主题: Mathematics版 - 问个问题 about Stochastic ODE
如果有一组数据,比如时间序列,
(t1, x1), (t2, x2), ...
如果用线性拟合,很容易检验这种拟合到底多好,误差估计等等,e.g. R-
square
如果现在想用stochastic ODE 来拟合,
dx/dt = Ax + noise
应该用什么metric来衡量这种拟合的好坏?
D*D
发帖数: 236
36
来自主题: Mathematics版 - 关于导数的一个问题请教.
用polynomial 拟合,然后对拟合的函数求导
excel能给出拟合的函数,任意次的多项式,如果拟要求完全拟合的话,理论上你有n个
(X,Y),那么n-1次的多项式一定能穿过所有的点,然后再对这个多项式求导就可以
了,很简单

激.
W******r
发帖数: 789
37
来自主题: Physics版 - 说说我对量子力学的理解
我不是物理专业,水平有限。如有错误,请大家指正。
量子力学本质上是一个公理系统。它的核心是薛定谔方程。这是一个二阶偏微分方程。薛定谔方程相当于数学体系中的公理,因为它没有任何推导,没有任何证明。但是用这个方程可以解释一些实验现象和数据,所以人们就把它拿过来用了。薛定谔方程的解叫做波函数。刚开始的时候这个波函数没有任何物理上的解释,后来人们觉得一个物理理论总得有个物理解释吧,于是就把波函数解释成粒子的密度。在这个模型中,一颗粒子充满了整个空间,它在空间各点的密度由波函数给出。但是人们发现,一粒电子能充满整个空间,这实在令人难以接受。于是后来人们又把波函数解释成概率。这个解释比较符合人的直观,逐渐就被人们接受。因为引入了概率,所以才有了后来的不确定原理。
再后来不确定原理就被神化了。其实概率只不过是公理系统的一个解释。这个解释不是唯一的,甚至不是必须的,更不是什么绝对的真理。即使不对波函数作任何解释(也就没有了不确定原理),量子力学仍然是一个相容的公理系统,仍然可以用它来计算各种化学键的长度、夹角、能量等数值。
和所有物理理论一样,量子力学是建立在假设和抽象简化的模型之上的,是对现实世界的... 阅读全帖
E*******1
发帖数: 3464
38
来自主题: Physics版 - 说说我对量子力学的理解
看来你的猜测不太靠谱,在这瞎猜还不如上网翻翻历史,有点科学精神比在这乱灌水有
价值好不好。力的定义不是初中物理当作,而是物理学的定义,因为力本身就是描述物
体相互作用的量,你不定义还能靠拟合出来?你自己说物理是实验科学,那么实验基本
的观测需要量化吧。你说万有引力是拟合出来的可能还靠谱点,问题是这也没怎么样,
人家那公式用的很好啊,你要认为他不对可以拿出范例并能预测现象,如果反例是其他
宇宙的,那也和我们无关不是吗
key point is,你所谓的公理系统的说法没什么问题,但是物理学的公理并不比数学里
的多。关键是,你不能因为科学系统里有公理就觉得这个系统不靠谱,是‘拟合’出来
的,物理学的成功,当然也是大多数非伪科学的成功在于他不仅可以解释和测量自然,
而且最关键的是它可以预测显然甚至创造现象,你说这个是公理那个是拟合的,问题是
你用这些玩意就是可以让卫星上天啊,就是按照我们算出来的轨道走啊;很多惊人的物
理实验也是先有天才的理论,之后被观测到的啊...这比某某某宗教是不能比的,马后
炮的东西永远都是自欺欺人的,但是物理学,你可以说他有公理,但这些都是基本的自
然假设,并不比我首先... 阅读全帖
l******o
发帖数: 52
39
【 以下文字转载自 DataSciences 讨论区 】
发信人: laihaobo (数海扬帆), 信区: DataSciences
标 题: 大数据时代的最大挑战(一)?
关键字: 数据挖掘,过度拟合,“大海捞针”回归法
发信站: BBS 未名空间站 (Sun Aug 24 21:55:49 2014, 美东)
挑战一: 数据挖掘者的陷阱或"愚蠢把戏"。
海量数据,"大数据",和高频数据---由 “Big Data” 说开去之二
这个"愚蠢把戏"是直译。见下文:
http://bit.ly/StpdDtMnrTrck
文中有更加强烈的用词,像”evil data miners”,不过也还有的放矢,我们再做解释
。.此文发表于 The Journal of Investing 2007年第1期。大家可以验证一下此文的出
处:
Leinweber, David J. "Stupid data miner tricks: overfitting the S&P 500."
 The Journal of Investing 16.1 (2007): ... 阅读全帖
S***E
发帖数: 1977
40
来自主题: Statistics版 - 让我抓狂的统计学问题
我是工程师,最近工作里面碰到个统计学问题。大学和研究生学的统计知识基本都还给
老师了。办公室的老美全部是统计学dummy。只好在这里碰碰运气,多谢帮助。
我有两组数据,a和B,各有八个数据点。
现在我通过一定的计算A=f(a)得到一组新数据A。
然后我试图建立A(自变量)和B(参变量)之间的线性拟合。对于拟合的直线和B之间
,我求得square of the sample correlation coefficient,得到0.92,看起来还不错。
接下来我多事,又反向进行以下步骤,结果傻眼了。
我用f的反函数f',求得b=f'(B),得到一组数据b。同样的,建立a和b直接的线性拟合。
然后对于b和拟合直线求square of the sample correlation coefficient,得到只有0
.10,看起来糟透了。
总的来说,我从a求A,然后A和B直接相关性很好。但是从B反向求b,b和a的相关性就很
差。请问这个结果自然么?我的问题大概很傻,但是多谢版式各位大牛帮助!
s*****V
发帖数: 21731
41
来自主题: History版 - 考古界对C14测年数据很有意见
测出来数据越来越小,而且朝令夕改。
“商假说”之七:测年专家给考古学界提出的问题
与夏商分界相关的测年结果的变化,是学界关注的热点问题。
前引王琼、钱燕的论文述及:“在《夏商周断代工程1996-2000年阶段成果报告》中,
众多学者根据碳-14测年数据推断郑州商城和偃师商城始建年代在公元前1610-前1560年
。但仅时隔5年,又有新的碳-14测年数据公布,指出郑州商城的始建年代在公元前1500
年前后(该处引注为《中原文物》2005年第1期张雪莲等文)”(《中国历史文物》
2009年第6期)。
其实,我在评述2001年的夏商周考古研究时就曾指出:“值得注意的是,负责工程测年
技术的首席科学家仇士华等,在工程阶段性成果公布不久,又撰文发表了不同于已公布
成果的最新数据拟合结果。如《阶段成果报告(简本)》中曾推断‘郑州商城和偃师商
城始建年代在公元前1610-前1560年之间’,新发表的《关于夏商周碳十四年代框架》
一文则认为‘两个商城最早的年代均不早于公元前1560年~公元前1580年’,而‘郑州
商城的始建年代难以老上去,应处于公元前1500年前后’(《华夏考古》2001年3期)
。... 阅读全帖
g**1
发帖数: 10330
42
国家统计局拟用大数据预测房价走势
2014年09月22日 03:10
来源:第一财经日报 作者:重华
0人参与 0评论
国家统计局的“大数据梦”肯定不是说说而已,而在这场圆梦之旅中,作为中国互联网
翘楚的BAT(百度、阿里、腾讯)三家都不会缺席。
在19日上午召开的第五届中国统计开放日上,国家统计局首次对外展示了其正在研究的
基于百度搜索数据来预测房地产价格的新工具,并演示了这项工具对北京房价的惊人预
测力。在开放日上,国家统计局也展示了新研发的网购数据统计,而其数据来源之一就
是刚赴纽约上市的阿里巴巴。
腾讯也没有缺席这场建立大数据统计的国家战役。甫一开年,国家统计局局长马建堂就
马不停蹄地走访了中国最具代表性的互联网企业。马建堂的身影出现在京东商城和阿里
巴巴,以及1号店、CBI易贸集团、百度等企业。今年6月末,马建堂来到了腾讯,并从
马化腾手中接过了一个企鹅公仔。
百度如何统计房价
更为精确的房地产价格统计一直是政府希图攻克的难题。因为个人隐私、阴阳合同等问
题存在可能影响源头数据的真实性,而现有房地产领域“数出多门”的情况也增加了“
数据打架”的概率。
相对而言,海量的搜索数据... 阅读全帖
x***4
发帖数: 475
43
来自主题: Military版 - 看了柴静影片,三点总结
仔细看了一下,还看了后面的回复。
红色曲线好像被改动了,是循环系统的死亡率。这算是一个细节上的疑问。因为循环系
统和空气污染好像不是太相关。
R2 这个问题:R2小,不能说明方程拟合的不好啊。有的方程Y变化较小,主要是X在变
化,直线方程和X轴近乎平行时,这时拟合的方程R2会很小,但是方程显著。所以不能
完全用R2来衡量方程拟合的效果。
x***4
发帖数: 475
44
来自主题: Military版 - 看了柴静影片,三点总结
仔细看了一下,还看了后面的回复。
红色曲线好像被改动了,是循环系统的死亡率。这算是一个细节上的疑问。因为循环系
统和空气污染好像不是太相关。
R2 这个问题:R2小,不能说明方程拟合的不好啊。有的方程Y变化较小,主要是X在变
化,直线方程和X轴近乎平行时,这时拟合的方程R2会很小,但是方程显著。所以不能
完全用R2来衡量方程拟合的效果。
w*p
发帖数: 16484
45
来自主题: Military版 - 看看王垠怎么说阿尔法狗
http://www.yinwang.org/blog-cn/2016/03/09/alpha-go
AlphaGo与人工智能
在之前的一篇文章中我指出,自动驾驶所需要的“视觉识别能力”和“常识判断能力”
,对于机器来说是非常困难的问题。至今没有任何机器可以在视觉方面达到驴的水平,
更不要说和人比。可是最近Google的AlphaGo战胜了围棋世界冠军,挺闹腾的,以至于
对AI的误解又加深了。
本来玩个游戏而已,恁要吹成是“历史性的人机大战”,说得好像是机器挑战了人类的
智能,伤了人类的自尊似的。这整个项目打着一个相当高大上的招牌,叫做“Deep
Mind”。当然,其中的技术也有一些吓人的名字,什么“神经网络”啊,“深度学习”
啊……
听到这些,总有一知半解的人,根据科幻电影的情节开始展望,这样厉害的技术,应该
可以用来做更加“智能”的事情,然后就开始对“人类的未来”作出一些猜想,比如自
动车就要实现,人的工作很快都要被机器取代,甚至Skynet)就要控制人类,云云。
我只想在这里给这些人提个醒:还是别做科幻梦了,回到现实吧。
棋类是相对容易的AI问题
一个常见的外行想法,是以为Alp... 阅读全帖
c****x
发帖数: 6601
46
鄙视的人恰恰是现在的自己。
http://www.youtube.com/watch?v=PCe-ZNTmhHk&t=9m10s
---------------------------------------------------
《AlphaGo与人工智能》
http://www.yinwang.org/blog-cn/2016/03/09/alpha-go
在之前的一篇文章中我指出,自动驾驶所需要的“视觉识别能力”和“常识判断能力”
,对于机器来说是非常困难的问题。至今没有任何机器可以在视觉方面达到驴的水平,
更不要说和人比。可是最近Google的AlphaGo战胜了围棋世界冠军,挺闹腾的,以至于
对AI的误解又加深了。
本来玩个游戏而已,恁要吹成是“历史性的人机大战”,说得好像是机器挑战了人类的
智能,伤了人类的自尊似的。这整个项目打着一个相当高大上的招牌,叫做“Deep
Mind”。当然,其中的技术也有一些吓人的名字,什么“神经网络”啊,“深度学习”
啊……
听到这些,总有一知半解的人,根据科幻电影的情节开始展望,这样厉害的技术,应该
可以用来做更加“智能”的事情,然后就开始... 阅读全帖
w********2
发帖数: 632
47
我们习惯性以为文献所叙述的历史传说,都在黄河流域发生,但仔细阅读,文献的
故事反而不能在黄河地带发生,而屈家岭、石家河文明面貌相当符合尧舜和夏王国的传
说和历史阶段,此乃屈原在描述其祖国楚的历史中的尧舜时代和夏王朝。考古研究成果
表明:天门石家河城势力大,应该就是夏王国的都城。到了距今3800年左右发生过国家
结构的演变:几个大城的神权中心变弱,包括石家河作中央的势力也衰落,而位处其东
邻并更靠近汉口和铜矿山的地区,出现更大的中央集权政体,这可能就是以盘龙城为代
表的政权。考古资料所反映的天门石家河没落而武汉盘龙城升起,或许正是汤克夏故事
中所隐藏的“现实”,即盘龙城文化或为传世历史神话中所载汤商王朝的历史阶段。
汤商的核心位置在江汉地带,但其所代表的文化和影响力的北界到达郑州、洛阳,
所以二里头、郑偃也属该文化的脉络,后者是先楚文明的北界城邦,而非一般所认为的
“中央”。
盘龙城文化时期,西北地区,黄河上、中游文化的国家化程度最低,虽然有本地的
青铜文化,但因族群的流动率高或其它因素,直至殷商末期和西周时,其影响力和权威
才成为主流。东北夏家店下层文化是另一系青铜文明,以发展战争技术... 阅读全帖

发帖数: 1
48
美国人口学臭名昭著,结论基于不可验证的假设
把1950-1958看作正常年份,对比1958~1963,制造了3千万“非正常死亡”,抨击共党
统治邪恶
我把1958~1963看作正常年份,对比1950-1958,是不是就成了“非正常人口增长”,该
赞美共党建国了
正常人都知道线性模型只能拟合、分析趋势,不能外推。线性外推的成立必依赖于诸多
假设,而人口学臭名昭著的地方就是假设主观任意性较大,研究结论随主观假设显著变
化,结果可靠性差。假设人口普查方法没有变化、假设线性模型正确、假设1950-1958
、1965-1980人口增长为“正常年份”、假设1958~1963人口增长应满足同样的线性规则
、假设线性模型无法拟合的部分就是“饿死”。这些都是梦话
这样做研究,基于不同的假设,就可以得出完全不同的结论。同样的方法我可以假设线
性模型无法拟合的1950-1958人口非正常增长都是因为共产党的出现,由此证明共产统
治的优越性。伴随着《我不是药神》的播出,全中国冰棍销售数量都非线性增加,所以
《我不是药神》导致了全中国的冰棍销量大增、冰棍厂家要给《我不是药神》发广告费?
j**********i
发帖数: 3758
49
【 以下文字转载自 Economics 讨论区 】
发信人: jpostsildavi (ID), 信区: Economics
标 题: Re: 美国大选最主要的国内议题是就业率
发信站: BBS 未名空间站 (Fri Jul 27 01:35:22 2012, 美东)
http://en.wikipedia.org/wiki/Household_income_in_the_United_Sta
http://en.wikipedia.org/wiki/Average_American
对于低收入的人们来说,希望不见得在于某天突然得到一大笔捐赠,而是能维持较为稳
定的长期收入。然而较为稳定的长期收入也并非垂手可得,对于年轻力壮的人还可以被
雇主看重,度过中年以后被淘汰下来的人就不是那么好看的招牌了。许多工作都是临时
性的,在不同渠道里传播的,是基于需求而非慈善性的。需要这些工作的人的分布和即
时状态是变化的。 在这些特殊工作需求和应聘者之间的拟合需要在极短的时间内达成
(也许就是几分钟),因而这种拟合是十分重要的环节。
对于雇主而言,常常考虑的是付出的价格,应聘者的可靠性,是否能完成... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)