v*******a 发帖数: 1193 | 1 有个list of name address phone email
有没有什么 sas R 或者其他program的 code 可以 check
这些information是不是fake的?
谢谢 | c*****a 发帖数: 808 | 2 是不是这类,以前我老师布置过,用R写查垃圾email的program。用很多regular
expression。。。。挺痛苦的一份作业
subjectPunctuationCheck1 = function(x,n){
count = logical()
for(i in 1:n){
sb=x[[i]]$header["Subject"]
att = gregexpr("Re: .*([[:alpha:]|[:punct:]])[:alpha:]", sb, ignore.case
=TRUE)[[1]]
size = sum(attr(att, "match.length"))
if (is.na(size)== TRUE) count[i] = FALSE
else {if (size<0) count[i] = FALSE else count[i] = TRUE}
}#forloop
return(count)
}##subject punct check | v*******a 发帖数: 1193 | 3 对 就是这类 ,是很痛苦
case
【在 c*****a 的大作中提到】 : 是不是这类,以前我老师布置过,用R写查垃圾email的program。用很多regular : expression。。。。挺痛苦的一份作业 : subjectPunctuationCheck1 = function(x,n){ : count = logical() : for(i in 1:n){ : sb=x[[i]]$header["Subject"] : att = gregexpr("Re: .*([[:alpha:]|[:punct:]])[:alpha:]", sb, ignore.case : =TRUE)[[1]] : size = sum(attr(att, "match.length")) : if (is.na(size)== TRUE) count[i] = FALSE
| w*********i 发帖数: 77 | 4 why not use Perl or Python ? R is really not the ideal tool for regular
expression.....
【在 v*******a 的大作中提到】 : 有个list of name address phone email : 有没有什么 sas R 或者其他program的 code 可以 check : 这些information是不是fake的? : 谢谢
|
|