usage of tapply with FUN = function(x){}
在我的任务中,我想按性别找到温度的平均值。我们可以通过 tapply 命令来做到这一点。我也不允许使用平均命令:
1 | tapply(df$temperature,df$gender,FUN = function(x){sum(x)/length(df[,1])}) |
但它给了我错误的结果。它只是将结果除以 2,而不是找到两个性别的平均值。
我该如何解决?
因为聚合函数一切正常:
1 | aggregate(df$temperature,by = list(df$gender),function(x){sum (x)/length(x)}) |
确认 sum(x)/length(x) 是这里的方法:
创建模拟数据集:
1 2 3 | set.seed(1) d<-data.frame(temperature=rnorm(1000,500,20), gender=rep(c('M','F'),500)) |
使用带有自定义平均函数的tapply按性别计算平均温度
1 2 3 | > tapply(d$temperature, d$gender, function(x){ sum(x)/length(x)}) F M 500.0884 499.4457 |
确认这与基础 mean() 函数匹配:
1 2 3 4 | > mean(d$temperature[d$gender=='F']) [1] 500.0884 > mean(d$temperature[d$gender=='M']) [1] 499.4457 |