R语言里如何生成数据统计数据框

比如有一个大的数据集,里面有N个字段,对于这次的case我需要实用其中3个参数,他们为siteNO,user,check,siteno为数值型(只有4个值),user是用... 比如有一个大的数据集,里面有N个字段,对于这次的case我需要实用其中3个参数,他们为siteNO, user, check, siteno为数值型(只有4个值),user是用户名,check是一个数值型表示时间的值,现在有好多条数据,我想统计,在siteNO和user一定的情况下,check的中位数,均值,生成一个数据框,里面包含
siteNO,user,check_media,请问怎么转化原有的数据集呢?
展开
 我来答
yugao1986
2015-07-28 · TA获得超过1129个赞
知道小有建树答主
回答量:449
采纳率:100%
帮助的人:155万
展开全部
你可以利用dplyr包进行计算,假设你的数据名为:yourdata
data <- yourdata[,c("siteNO","user","check")]
library(dplyr)
by_siteNO_USER <- group_by(data,siteNO,user)
need <- summary(by_siteNO_user,
mean =mean(check),
median=median(check))
追问

可能我没太说明白,我只是想得到一个统计后的简洁的数据框。我把源数据集给你看一下

。。。

然后我想要一个统计后的,group by siteno,user,得到check的中位数的一个数据框。

其实就是变成

user,siteno,check

user1,2,check中位数

user1,4,check中位数

user2,2,check中位数

。。。

追答
你的数据不好输入,你用下面的例子试试,a3就是你要的。
library(dplyr)
library(nycflights13)#flights数据是nycflights13包里自带的
a1 <- group_by(flights, year, month, day)#按照年月日分组
a2 <- select(a1, arr_delay)#选择arr_delay变量
a3 <- summarise(a2,
median = median(arr_delay, na.rm = TRUE))
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式