R语言最优化模型怎么做 200
R语言最优化模型怎么做4.Hitters数据集。在ISLR包中有一个名为Hitters的数据集。该数据集包含了棒球运动员薪水(Salary)等变量。请根据以下要求编写相应...
R语言最优化模型怎么做4.Hitters数据集。在ISLR包中有一个名为Hitters的数据集。该数据集包含了棒球运动员薪水(Salary)等变量。请根据以下要求编写相应的R程序:
1)判断该数据集中是否存在缺失值?如果是,Salary变量中存在多少个缺失值?
2)剔除在任何变量上存在缺失值的观测,剔除后的数据集样本量是多少?
3)将Salary作为因变量,其余变量作为自变量,建立一系列包含给定数目自变量的最优模型,实现最优预测变量子集的筛选。
4)画出所有模型的RSS,调整的R2,Cp以及BIC的图像,确定最终选择哪个模型(注意:根据各种指标确定的最优模型可能不一致)。
前两题做完了,第三题要用什么公式 展开
1)判断该数据集中是否存在缺失值?如果是,Salary变量中存在多少个缺失值?
2)剔除在任何变量上存在缺失值的观测,剔除后的数据集样本量是多少?
3)将Salary作为因变量,其余变量作为自变量,建立一系列包含给定数目自变量的最优模型,实现最优预测变量子集的筛选。
4)画出所有模型的RSS,调整的R2,Cp以及BIC的图像,确定最终选择哪个模型(注意:根据各种指标确定的最优模型可能不一致)。
前两题做完了,第三题要用什么公式 展开
展开全部
参考代码:
dat <- read.table("clipboard",header = T)
dat
lm.d<- lm(y~x1+x2+x3+x4+x5,data = dat)
summary(lm.d)
lm.d2 <- step(lm.d) #逐步回归法,挑选变量子集
summary(lm.d2)
newd <- data.frame(x1=12135,x2=28679,x3=19978,x4=502,x5=24950)
predict(lm.d,newd,interval = "prediction")#预测值
predict(lm.d,newd,interval = "prediction",scale = T) #预测均值
dat <- read.table("clipboard",header = T)
dat
lm.d<- lm(y~x1+x2+x3+x4+x5,data = dat)
summary(lm.d)
lm.d2 <- step(lm.d) #逐步回归法,挑选变量子集
summary(lm.d2)
newd <- data.frame(x1=12135,x2=28679,x3=19978,x4=502,x5=24950)
predict(lm.d,newd,interval = "prediction")#预测值
predict(lm.d,newd,interval = "prediction",scale = T) #预测均值
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询