s********r 发帖数: 297 | 1 Column1 Column2: (#.of.A) / (total.#)
A, B, C 1 / 3
A, B, A, D 2 / 4
A, B, A, D, A 3 / 5
.....
请问已知在一个CSV文件里 column 1 里面 是无次序并且可能重复的人的代号(用A,B..
.等字母代表)
delimiter是 ","
请问怎么在csv文件里添加一个 new column (column2) 并且算出 A 那个人在每个row
的出现的frequency 除以 总共人数的ratio呢 | t******g 发帖数: 372 | 2 may not be the best, my 2ct
option1,
sapply(sapply(csv[,2], function(x) strsplit(x, ',')), function(y) prop.table
(table(y))['A'])
option2,
sapply(gregexpr('A', csv[,2]), function(x) length(x)) / sapply(gregexpr(',',
csv[,2]), function(x) length(x)+1)
..
row
【在 s********r 的大作中提到】 : Column1 Column2: (#.of.A) / (total.#) : A, B, C 1 / 3 : A, B, A, D 2 / 4 : A, B, A, D, A 3 / 5 : ..... : 请问已知在一个CSV文件里 column 1 里面 是无次序并且可能重复的人的代号(用A,B.. : .等字母代表) : delimiter是 "," : 请问怎么在csv文件里添加一个 new column (column2) 并且算出 A 那个人在每个row : 的出现的frequency 除以 总共人数的ratio呢
| s********r 发帖数: 297 | 3 谢谢你!
table
',
【在 t******g 的大作中提到】 : may not be the best, my 2ct : option1, : sapply(sapply(csv[,2], function(x) strsplit(x, ',')), function(y) prop.table : (table(y))['A']) : option2, : sapply(gregexpr('A', csv[,2]), function(x) length(x)) / sapply(gregexpr(',', : csv[,2]), function(x) length(x)+1) : : .. : row
|
|