首先我们需要明确一个概念,我们讨论的线性或者非线性针对的是自变量的系数,而非自变量本身,所以这样的话不管自变量如何变化,自变量的系数如果符合线性我们就说这是线性的。所以这里我们也就可以描述一下多项式线性回归。

由此公式我们可以看出,自变量只有一个,就是x,只不过x的级数(degree)不同而已。

我们这次用的数据是公司内部不同的promotion level所对应的薪资

下面我们来看一下在Python中是如何实现的

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd dataset = pd.read_csv('Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
# 这里注意:1:2其实只有第一列,与1 的区别是这表示的是一个matrix矩阵,而非单一向量。
y = dataset.iloc[:, 2].values

接下来,进入正题,开始多项式线性回归:

from sklearn.preprocessing import PolynomialFeatures
poly_reg = PolynomialFeatures(degree = 1) #degree 就是自变量需要的维度
X_poly = poly_reg.fit_transform(X)
lin_reg_2 = LinearRegression()
lin_reg_2.fit(X_poly, y)

这个过程我们设置了一元一次的自变量:degree=1 意思是自变量只有一次,相当于简单线性回归
我们在图像中表示一下:

# 图像中显示
plt.scatter(X, y, color = 'red')
plt.plot(X, lin_reg_2.predict(poly_reg.fit_transform(X)), color = 'blue')
plt.title('Truth or Bluff (Polynomial Regression)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

此图像与用简单线性回归表示的图像是一样的

# 简单线性回归 图像中显示
plt.scatter(X, y, color = 'red')
plt.plot(X, lin_reg.predict(X), color = 'blue')
plt.title('Truth or Bluff (Linear Regression)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

下面我们试着改变一下维度,将degree设置成2,其他不改变,执行一下代码看看图像:

我们可以发现整个趋势符合数据的分布。

我们将degree改成3 和 4 看看结果

我们可以发现,当degree=4的时候,基本上已经符合所有点的分布了

我们通过拆分横坐标将图像变得平滑一些:

X_grid = np.arange(min(X), max(X), 0.1)
X_grid = X_grid.reshape((len(X_grid), 1))
plt.scatter(X, y, color = 'red')
plt.plot(X_grid, lin_reg_2.predict(poly_reg.fit_transform(X_grid)), color = 'blue')
plt.title('Truth or Bluff (Polynomial Regression)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

下面我们给出一个测试值来试试结果 (6,10)

lin_reg_2.predict(poly_reg.fit_transform(6))
lin_reg_2.predict(poly_reg.fit_transform(10))

与实际值还是比较接近的。

最新文章

  1. 《Getting Started with Storm》译文 Homepage
  2. oracle sql 优化
  3. 指针的指针&指向指针数组的指针
  4. windows内核编程之常用数据结构
  5. shell小结
  6. Android 带checkbox的listView 实现多选,全选,反选,删除
  7. Asp.net MVC 中Controller返回值类型ActionResult
  8. 用delphiXE7 dbExpress Framework提供的功能获取数据表信息
  9. C/C++程序猿必须熟练应用的开源项目
  10. IsPostBack
  11. shell中的退出状态码
  12. [ext4]13 空间管理 - Prealloc分配机制
  13. 夹缝中求生存-在一无所有的php虚拟主机环境下利用smtp发送邮件(二)
  14. 【ASP.NET Core】如何隐藏响应头中的 “Kestrel”
  15. Vim 游戏 2048
  16. Android开源项目——带图标文字的底部导航栏IconTabPageIndicator
  17. swagger上传文件并支持jwt认证
  18. 【托业】【全真题库】TEST3-语法题
  19. JavaScript 引入方式 语言规范 语言基础 数据类型 常用方法 数组 if_else 比较运算符 for while 函数 函数的全局变量和局部变量 {Javascript学习}
  20. host文件的作用

热门文章

  1. 解决mysql for docker容器报错:Authentication plugin 'caching_sha2_password' cannot be loaded
  2. Web缓存和静态化
  3. 非交互式一句话添加root用户
  4. SpringBoot 基础01
  5. 用js实现贪吃蛇
  6. Collection类,泛型
  7. 转发: windows如何管理内存
  8. 解析Java分布式系统中的缓存架构(上)
  9. 几个实用的CSS代码段总结
  10. 简单读!tomcat源码(一)启动与监听