求统计学的大神帮忙!!
首先 你并不知道总体的分布 所以参数方法不好使 要用非参数方法
有个简单的方法permutation test 就是在总体分布未知的情况下用mc(蒙特卡洛模拟)求两组均值差的pvalue的
你自己搜下原理 我用R做了下你的数据 code如下
a<-c(c(rep(1,31),rep(0,130)),c(rep(1,4),rep(0,156)))
group<-factor(c(rep("A",161),rep("B",160)))
data<-data.frame(group,a)
find.mean<-function(x){
mean(x[group=="A",2])-mean(x[group=="B",2])
}
results<-replicate(999,find.mean(data.frame(group,sample(data[,2]))))
p.value<-length(results[results>mean(data[group=="A",2])-mean(data[group=="B",2])])/1000
hist(results,breaks=20,prob=TRUE)
lines(density(results))
pvalue是个很小的数接近零 所以新办法是有用的