ID3决策树优先选择信息增益大的属性来对样本进行划分,但是这样的分裂节点方法有一个很大的缺点,当一个属性可取值数目较多时,可能在这个属性对应值下的样本只有一个或者很少个,此时它的信息增益将很高,ID3会认为这个属性很适合划分,但实际情况下叫多属性的取值会使模型的泛化能力较差,所以C4.5不采用信息增益作为划分依据,而是采用信息增益率作为划分依据。但是仍不能完全解决以上问题,而是有所改善,这个时候引入了CART树,它使用gini系数作为节点的分裂依据。

最新文章

  1. Java 中的集合接口——List、Set、Map
  2. DataReader
  3. HTML5 ---localStorage
  4. qt5中QPrinter的使用兼容性问题
  5. Spring学习笔记 5. 尚硅谷_佟刚_Spring_自动装配
  6. Flash图表控件FusionCharts如何自定义图表的工具提示
  7. habse的CopyTable
  8. BeanUtils No value specified for Date的解决方法
  9. Hibernate 的<generator class="native"></generator>的不同属性含义
  10. 【Unity3D】场景转换与退出
  11. linux常用命令-搜索
  12. Common Table Expressions (CTE)
  13. 【Unity3d游戏开发】游戏中的贝塞尔曲线以及其在Unity中的实现
  14. python学习:Dmidecode系统信息(一)
  15. javascript 正则(将数字转化为三位分隔的样式)
  16. 深入浅出Git教程(转载)
  17. MangoDb的安装及使用
  18. 如何给python程序加密
  19. oracle性能优化之awr分析
  20. 基于VS Code创建Spring Boot项目开发REST API(一)

热门文章

  1. Vagrant 手册之多个虚拟机 multi-machine
  2. Ubuntu下使用boost例子
  3. c#访问webapi以及获取
  4. 批量更新:A表数据源 B表目标
  5. "CoolShell puzzle game" writeup
  6. Quartz-第一篇 认识Quartz
  7. 两台centos,用yum install 安装,一台成功,一台失败
  8. POJ 2528 Mayor's posters(线段树,区间覆盖,单点查询)
  9. 状压BFS
  10. NGUI的下拉框的使用(popup list script)