不多说,直接上干货!

  相比于决策树,保序回归的应用范围没有决策树算法那么广泛。

  特别在数据处理较为庞大的时候,采用保序回归做回归分析,可以极大地节省资源,从而提高计算效率。

  保序回归的思想,是对数据进行均值排序,从数据集的第一个数开始,如果下一个数出现乱序,即与设定的顺序不符,则从乱序的数据开始逐个开始求得平均值,直到求得的平均值与下一个数据比较不成为乱序为止。

  例如一个数据集:

 {,,2,,}

  要求其按照保序回归由小到大进行排列。

  首先观察第一个数是1,可以不做变动继续存放。第二个是2,仍然不需要变动。第三个数是2,是属于乱序从而需要对其重新计算。

  第三个数是乱序,需要对其重新计算,提取数据2和下一个数据4,计算得到平均值为3,因此,可获得一个新的数据集:

 {,,,,}

  具体,见

Spark Mllib机器学习实战的第8章 决策树与保序回归

最新文章

  1. js url.slice(star,end) url.lastIndexOf('/') + 1, -4
  2. Allegro笔记三
  3. 通过AJAX与ASP.NET结合实现的仿GridView增删改查功能
  4. Xcode6 运行程序后,右侧Debug区域的Memory显示空白解决方法
  5. warning: the `gets' function is dangerous and should not be used.(转)
  6. pl sql练习(3)
  7. BZOJ 1014: [JSOI2008]火星人prefix( splay + hash )
  8. 最终结算“Git Windowsclient保存username与password”问题
  9. Linux应用环境实战10:Bash脚本编程语言中的美学与哲学(转)
  10. git>>>>1
  11. Constructing continuous functions
  12. How to enable AHCI on Windows7
  13. 【zheng环境准备】安装activemq
  14. Twitter开发
  15. 在visual code的debugger for chrome中调试webpack构建的项目
  16. 使用Spring发送Email
  17. 窗口间传送数据wsprintf,WM_SETTEXT,SendMessage的理解
  18. Python进行数据分析(一)初步学习 对时区进行计数
  19. No mojo definitions
  20. Hihocoder1081 最短路径 结构体练习

热门文章

  1. C#某月的第一天和最后一天
  2. Linux根据端口查看进程
  3. MyBatis总结(1)
  4. ES6学习之对象扩展
  5. numpy.ones_like(a, dtype=None, order='K', subok=True)返回和原矩阵一样形状的1矩阵
  6. chef语法和案例
  7. 【总结整理】关于IE6的兼容性
  8. 微信 python搭建服务器
  9. Spring集成shiro+nginx 实现访问记录
  10. Cannot uninstall 'enum34'. It is a distutils installed project and thus we cannot accurately determine which files belong to it which would lead to only a partial uninstall.