R语言里如何生成数据统计数据框
比如有一个大的数据集,里面有N个字段,对于这次的case我需要实用其中3个参数,他们为siteNO,user,check,siteno为数值型(只有4个值),user是用...
比如有一个大的数据集,里面有N个字段,对于这次的case我需要实用其中3个参数,他们为siteNO, user, check, siteno为数值型(只有4个值),user是用户名,check是一个数值型表示时间的值,现在有好多条数据,我想统计,在siteNO和user一定的情况下,check的中位数,均值,生成一个数据框,里面包含
siteNO,user,check_media,请问怎么转化原有的数据集呢? 展开
siteNO,user,check_media,请问怎么转化原有的数据集呢? 展开
1个回答
展开全部
你可以利用dplyr包进行计算,假设你的数据名为:yourdata
data <- yourdata[,c("siteNO","user","check")]
library(dplyr)
by_siteNO_USER <- group_by(data,siteNO,user)
need <- summary(by_siteNO_user,
mean =mean(check),
median=median(check))
data <- yourdata[,c("siteNO","user","check")]
library(dplyr)
by_siteNO_USER <- group_by(data,siteNO,user)
need <- summary(by_siteNO_user,
mean =mean(check),
median=median(check))
追问
追答
你的数据不好输入,你用下面的例子试试,a3就是你要的。
library(dplyr)
library(nycflights13)#flights数据是nycflights13包里自带的
a1 <- group_by(flights, year, month, day)#按照年月日分组
a2 <- select(a1, arr_delay)#选择arr_delay变量
a3 <- summarise(a2,
median = median(arr_delay, na.rm = TRUE))
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询