欢迎关注天山情报。我们是一个专注于商业智能BI、人工智能AI和大数据分析与挖掘的垂直社区。学习、问答、求职一站搞定!
对商业智能BI、大数据分析与挖掘、机器学习、python、R等数据领域感兴趣的同学加微信:tsaiedu,注明消息来源,邀请你加入数据爱好者交流群,都在这里。
618狂欢,天山学院全程6.18折!投资知识,赋予自己力量,蝴蝶很快就会改变!https://www.hellobi.com/618
本文来自天山无线城专栏作家:okajun相关文章链接:“单变量(多元)线性回归分析的Excel实现”“单变量(多元)线性回归分析的R语言实现”
我写《一元线性回归分析的Excel实现》的时候说过,我也会写《一元线性回归分析的R语言实现》及其Python实现。其实这个文档早就准备好了,只是一直没有模型的测试方法,所以一直拖着。今天先分享一下我知道的。希望大家能给我很多指导和建议。
在这种情况下,仍然使用女性数据集和薪资数据集。下载请参考之前的博文。
1.线性回归
1.1使用sklearn,所有样本数据
首先导入要使用的库和模块
先做数据探索,做散点图
我们可以看到体重和身高之间存在明显的线性正相关关系。让我们建立一个线性模型。
要查看模型结果:
得到一元线性方程:体重=-87.52+3.45身高
看预测值(直线)与真实值(散点)
线性方程为weight =-87.77+3.46 h8,与1.1中的模型结果略有不同,因为我们只用80%的数据建模。
使用测试集验证模型效果:
绘制以查看模型拟合效果:
输出如下:
形象
由此可见,最好的模式是引入三个变量,‘年龄’、‘公司_年龄’和‘学历’。
重新建模:
可以看出,新方程通过了F检验,系数都通过了T检验。
回归方程为工资=-4.463 e+04+2303.8365 age+1952.7198 company _ age+8052.9691 *学历
如果想用岭回归,可以查看sklearn官网钟灵回归的介绍。
补充:Python中如何进行正态分布检验、齐次方差检验、共线性检验,我还没有找到好的方法。如果有人知道,欢迎不吝赐教,谢谢~
1.《一元线性回归 一元(多元)线性回归分析之Python语言实现》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《一元线性回归 一元(多元)线性回归分析之Python语言实现》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/964459.html