【课程作业】数据挖掘之具有定性变量的回归模型
发布日期:2021-06-29 02:15:36 浏览次数:2 分类:技术文章

本文共 897 字,大约阅读时间需要 2 分钟。

参考资料

具有定性变量的回归模型

具有定性变量的回归模型

在这里插入图片描述
在这里插入图片描述
并非每个定性变量都会出现在回归方程

作业要求

在这里插入图片描述

流程与代码

原始数据:400条,11列(11个属性)

library(MASS) #加载库library(ISLR) #安装库install.packages("ISLR") library(car) #测试:有此行才能运行后面的vif(tlm) 多重共线性检验#Introduction to statistical learning中的ISLR package#fix(Carseats) # 查看Carseats数据集#names(Carseats) # 查看数据集的列名#?Carseats # 查看数据集的更多信息#多元线性回归tlm<-lm(Sales~., data = Carseats) #~后面的. 表示用上全部变量summary(tlm) #查看回归结果(最后一列*,没有*的变量即没有显著关系,应当去掉)#逐步回归,自动排除不显著的变量tstep<-step(tlm)summary(tstep)#逐步回归的优化drop1(tstep)#再:多元线性回归tlm<-lm(Sales~CompPrice+Income+Advertising+Price+ShelveLoc+Age, data = Carseats)#显著(有*)的变量:CompPrice+Income+Advertising+Price+ShelveLoc+Agesummary(tlm)tlm# 自动将定性变量转变为虚拟变量,并通过contrasts()返回虚拟变量的编码attach(Carseats)contrasts(ShelveLoc)#变量的多重共线性vif(tlm)#方差膨胀因子。一般认为,当0
<10,不存在多重共线性(注意:在《R语言实战》第2版P182中认为VIF>4就存在多重共线性);当10≤VIF<100,存在较强的多重共线性,当VIF>=100,多重共线性非常严重。vif是判断多重共线性的比较常用方法。 #残差分析和异常点检测(判断方法见下图)par(mfrow=c(2,2))plot(tlm)

在这里插入图片描述

运行结果
在这里插入图片描述

转载地址:https://blog.csdn.net/YWP_2016/article/details/106111777 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:【NLP_命名实体识别】Bert/Albert+CRF模型实现
下一篇:【课程作业】GIS设计与开发之MySQL、WebServie、调用环境云API

发表评论

最新留言

很好
[***.229.124.182]2024年04月15日 11时56分09秒