由买买提看人间百态

topics

全部话题 - 话题: data4
(共0页)
t*********u
发帖数: 26311
1
来自主题: DataSciences版 - hadoop pig的问题
data3 = FOREACH data2 GENERATE group, SUM(data1.cpc) as cost:int;
data4 = ORDER data3 BY cost ASC;
如果
DESCRIBE data4;
不会报错
但是换成 DUMP data4;
就报错
2014-06-11 17:22:26,525 ERROR org.apache.pig.tools.pigstats.SimplePigStats:
ERROR: java.lang.RuntimeException: java.lang.ClassCastException: java.lang.L
ong cannot be cast to java.lang.Integer
2014-06-11 17:22:26,525 ERROR org.apache.pig.tools.pigstats.PigStatsUtil: 1
map reduce job(s) failed!
2014-06-11 17:22:26,573 ERROR org.apache.pig.tools.grunt.Gru... 阅读全帖
l*********1
发帖数: 2971
y****2
发帖数: 34
3
来自主题: Statistics版 - 再问R的问题 - 关于matrix 的operation
data <- matrix(c(1 ,1 ,2, 2, 1, 3, 4, 2,1, 5, 6, 3,2, 7, 8, 3,2, 9, 10, 4),
ncol=4, byrow=T)
colnames(data) <- c("id", "x1", "x2", "e")
### step1:
data[,2:3] <- data[,2:3]*data[,4]
data1 <- data[,1:3]
### step2:
data2 <- aggregate(data1[,2:3], list(id=data1[,1]), sum)
### step3:
data3 <- split(data2[,2:3], f=list(data2[,1]))
data3 <- lapply(data3, as.vector, "numeric")
mprod <- function(x){x %*% t(x)}
data4 <- lapply(data3, mprod)
### step4:
data5 <- 0
for(i in 1:length(data4)){
data5 <- data5 +
n******n
发帖数: 12088
4
来自主题: ChinaStock版 - 货币基金的盈利模式是啥?
短期拆借吗?
这个国泰基金的年化收益能达到4%,怎么做到的呀?
http://funds.money.hexun.com/fundsdata/focus/data4.htm
g*******a
发帖数: 1383
5
来自主题: MusicPlayer版 - Re: how does this look?
well, pf series is the entry level for ibanez
pf10 is only used in therir "jam pack" now and it's a great
guitar considering the price, here is a review
http://www.harmony-central.com/Guitar/Data4/Ibanez/PF10-01.html
this looks likea good deal
but you probably can skip the books
h**u
发帖数: 304
6
【 以下文字转载自 ChinaNews 讨论区 】
【 原文由 zhouzhzh 所发表 】
都是大学排名惹的祸——从北大官方网站一则假新闻谈起
最近有一则假新闻“美国学界眼中的中国10所杰出大学排行榜”甚嚣尘土,这则假新闻首
先由浙江大学的网友发在网大论坛上,然后浙大学生又拿去四处转贴,以至于北大官方网
站“北大招生网”都上当受骗,还拿出这则假新闻刊登在自己的网站上,成为贻笑大方的
大笑话。回想起北大在线BBS还曾经把满篇诽谤造谣的“青蛙大学丑闻录”标为精华并且
列为头版“推荐文章”,所以对于北大官方网站再次出丑,我算是早有心理准备,总算没
有笑死。大概他们认为只有那种Surprising的新闻,才是真的。
以下是刊登假新闻的“北大招生网”网址:
http://edu.beida-online.com/data/data4.jsp?db=bdzs&id=02kexuepai
美国学界眼中的中国10所杰出大学排行榜
最近的一期美国权威杂志《科学》刊登了美国情报研究所的研究资料,对亚洲学术和科研
的现状与发展作出了专题报告,报告中对中国的大学的综合实力和趋势展望给予了较大关
注。根据科学
w********5
发帖数: 72
7
来自主题: Statistics版 - 请教一下SAS编程的一个问题
This is my answer. My codes are alway very long and not efficient. Please
help simlify.
data data1;
input var1;
cards;
5
6
;
run;
data data2;
input var2;
cards;
5
6
;
run;
data new;
infile datalines dlm=" ";
input name $ var $ ;
datalines;
data1 var1
data2 var2
data2 var2
data4 var4
;
run;
proc sql;
select name into:name1-:name&SYSMAXLONG
from new;
select var into:col1-:col&&SYSMAXLONG
from new;
quit;
%put _user_;
option mprint mlogic;
%macro mutiple;
%do i=1 %to &sqlobs;
proc so
p***r
发帖数: 920
8
or you can do it in another brutal way
*WIDE TO LONG;
PROC TRANSPOSE DATA=data1 OUT=data2;
BY var_id;
VAR _ALL_;
RUN;
data data3;
set data2;
log_var=log(col1);
run;
*LONG TO WIDE;
PROC TRANSPOSE DATA=data3 OUT=data4
BY var_ID;
ID variable;
VAR log_var;
RUN;
d********t
发帖数: 837
9
Reduce(rbind, list(data1,data2,data3,data4))
example:
Reduce(rbind, list(data.frame(x1=c(1,2,3),x2=c(2,3,4)),data.frame(x1=c(5,6,7
),x2=c(7,5,4)),data.frame(x1=c(5,4,3),x2=c(7,6,5))))
k****o
发帖数: 76
10
来自主题: DataSciences版 - hadoop pig的问题
Before doing DUMP data4, mapreduce is not actually running.. "Describe"
works without mapreduce runs..
check the table for pig SUM :
http://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#SUM:
SUM returns long when input is int, but you assign it to cost: int..
This is where the runtime error comes from, I believe. change to "cost: long
", or simply "cost" without type specification..

.L
(共0页)