由买买提看人间百态

topics

全部话题 - 话题: samplesize
(共0页)
d**********o
发帖数: 1321
1
来自主题: WebRadio版 - 潜水员冒泡兼征版友意见
第一个项目report
这时偶刚到CSAC工作不久,与小A同学还不熟,我用的还是latex。随着贴的作业越来越
多,应该是用有共同爱好的小伙伴更亲密些。这次贴latex,下次才再org-mode。
\documentclass[b5paper,11pt, abstraction, titlepage]{scrartcl}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{CJKutf8}
\usepackage{multirow}
\usepackage{multicol}
\usepackage{listings}
\usepackage{geometry}
\geometry{b5paper}
\usepackage{graphicx,floatrow}
\usepackage{graphicx,subfigure}
\newsavebox{\abstractbox}
\renewenvironment{abstract}
{\begin{lrbox}{0}\begin{minipage}{\t... 阅读全帖
d**********o
发帖数: 1321
2
来自主题: WebRadio版 - 潜水员冒泡兼征版友意见
第一个项目report
这时偶刚到CSAC工作不久,与小A同学还不熟,我用的还是latex。随着贴的作业越来越
多,应该是用有共同爱好的小伙伴更亲密些。这次贴latex,下次才再org-mode。
\documentclass[b5paper,11pt, abstraction, titlepage]{scrartcl}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{CJKutf8}
\usepackage{multirow}
\usepackage{multicol}
\usepackage{listings}
\usepackage{geometry}
\geometry{b5paper}
\usepackage{graphicx,floatrow}
\usepackage{graphicx,subfigure}
\newsavebox{\abstractbox}
\renewenvironment{abstract}
{\begin{lrbox}{0}\begin{minipage}{\t... 阅读全帖
c*****h
发帖数: 166
3
来自主题: JobHunting版 - Google电面
刚面完第二轮 希望对各位有帮助吧
一面大概1小时 用google doc写java code
1. 最challenging的project 问的很细 关注challeing在哪 怎么解决的
2. abstract class和interface的区别 什么时候用哪个
3. 实现List deduplicate(List phoneNumbers) {}
我先写把list加到一个set里面然后把set包装成list出来 他就笑了说不给这么搞 用别的data
structure 然后我就写了个用HashMap的.然后问复杂度 然后问hashCode怎么写 其实后来想想
用HashMap的话和原来是一样的 都靠的是HashMap的keySet是一个set
4. reservoir sampling. 实现List getRandomSample(Iterator itr,
int sampleSize) {} 返回sampleSize个随机的元素 因为只给了Iterator拿不到
collection的size我就
o*****m
发帖数: 950
4
来自主题: Statistics版 - 谁用过surveyselect 啊, 救我啊
我运行以下
proc surveyselect data = basic
n=1000 out=samplesize;
strata client_id tier / alloc=prop nosample;
run;
But keep get error, saying
697 proc surveyselect data = basic
698 n=1000 out=samplesize;
699 strata client_id tier / alloc=nosample;
-
22
-----
202
ERROR: Variable NOSAMPLE not found.
ERROR 22-322: Syntax error, expecting one of the following: a name,... 阅读全帖
c*****a
发帖数: 808
5
来自主题: Statistics版 - 请教个菜鸟的sas问题
hi, i am learning SAS too.
%let samplesize=5;
data a;
input x;
cards;
1
2
3
4
5
;
data b (rename=(x=y) keep=x);
if _n_ =1 then do i=&samplesize to 1 by -1;
pt=nobs-i;
set a nobs=nobs point=pt;
output ;
end;
stop;
run;
option missing = 0;
data final;
set a;
set b;
z=x-y;
run;
The outcome is :
Obs x y z
1 1 0 0
2 2 1 1
... 阅读全帖

发帖数: 1
6
版上samplesize不足啊,看put/call ratio会不会更好点
m*****5
发帖数: 23482
7

racked, thevoguecity, samplesally, etc.
m*****5
发帖数: 23482
8
来自主题: NewYork版 - 造七级浮屠
介于最近SS很多,我就贴几个我常去看的地方,大家要参考起来看,才能找到丢
http://www.samplesalelist.com/index.htm
这个左边分男女儿童的,点进去看
http://thevoguecity.com/sample-sales-calendar/
这个优点是一目了然,缺点是信息不足
http://www.mizhattan.com/
这个信息比较杂,要天天翻着看
http://samplesally.com/sallys-sales-listing/
这家有时候会有个把独家信息,点评也不错
http://onthesly.tumblr.com/
这家会每周出一个简约版的逛街指南
http://sugarrockcatwalk.blogspot.com/
这家点评不错
http://neverpayretailnyc.tumblr.com/
这家点评也不错
l***a
发帖数: 5114
9
来自主题: PhotoForum版 - [公告] PhotoForum 版的投票结果
哈哈好麻烦, 这么小的samplesize, 8票对7票很不显著啊。不如本版大出血,两个都
奖励。zzz
m******r
发帖数: 1033
10
来自主题: Programming版 - 单变量xgboost模型好的吓人,求解
上来给大家汇报一下工作。
一开始我也以为overfit了,哪里出了错。仔细检查了代码,整个过程没什么错误。 虽
然这是个比较大的项目,很多代码copy来copy去 但是我造这个模型用的是最近12月的
数据, 真正的测试数据是更早的数据:前24个月到前12个月。 也就是我造模型的数据
在我的硬盘里,测试的数据在数据库里躺着呢。
这简直就是物理隔离啊。
今天我把测试的12个月数据每个月单独拎出来测一遍。 这样每个月只有1K~2K人群
samplesize应该算很小了,结果目测还是很好的,反正就那10个数从100%递减到0%, 按
score_rank递减,我连AUC都懒得看,因为趋势是很明显的。
于是我就这样给老板交差了。
还有一个原因是这个xgb做的模型是其中一个部分,大部分还是用回归做的。 如果所有
模型都得到这么高的AUC, 我还真发毛了。
s****d
发帖数: 14
11
http://www.hftradingbook.com/content/index.php?option=com_jumi&
Statistical Arbitrage(cpp文件)
内容如下:
////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////
void AnalyzePair(char* symbol1, char* symbol2)
{
double close1[100] = {0};
int n1 = 0, dates1[100] = {0};
double close2[100] = {0};
int n2 = 0, dates2... 阅读全帖
s*****r
发帖数: 790
12
来自主题: Statistics版 - 请教一个关于有效sample size的问题
你这个问题显然不满足正态的假设。你是想估计proportion.
通常情况下 exact 95% CI 不会是对称的(一般大家求的,不是说不能,symmetric if using normal approximation)。你还需要有一个假
设,就是真实的rate是多少。rate越接近0.5 sample size 就需要越大。
I suggest the following sample size calculator. (ps I am not familiar with survey data so the above is just general statistical consideration)
http://www.raosoft.com/samplesize.html

个数除以广告展现数)。这个rate在我总
normal distribution, 95% confidence
formula
c*****a
发帖数: 808
13
来自主题: Statistics版 - 问个R的问题
以前我上课听一个stat computation的老师,经常在吹R的vectorization, how
awesome vector operations in R. 他也是叫我们少用for loop,多用sapply, lapply
什么的.
如果2个for loop在一起用算大点点的samplesize,等半天啊
e*****s
发帖数: 273
14
自己顶一下,找到了个“samplesize”package,但是只能算(unpaired)Wilcoxon-
Mann-Whitney/rank sum。
可是俺要的是paired的signed rank啊,难道真的要自己run一个蒙特卡罗simulation么。
(共0页)