ID3,C4.5和CART三种决策树的区别
2024-09-03 02:50:22
ID3决策树优先选择信息增益大的属性来对样本进行划分,但是这样的分裂节点方法有一个很大的缺点,当一个属性可取值数目较多时,可能在这个属性对应值下的样本只有一个或者很少个,此时它的信息增益将很高,ID3会认为这个属性很适合划分,但实际情况下叫多属性的取值会使模型的泛化能力较差,所以C4.5不采用信息增益作为划分依据,而是采用信息增益率作为划分依据。但是仍不能完全解决以上问题,而是有所改善,这个时候引入了CART树,它使用gini系数作为节点的分裂依据。
最新文章
- Java 中的集合接口——List、Set、Map
- DataReader
- HTML5 ---localStorage
- qt5中QPrinter的使用兼容性问题
- Spring学习笔记 5. 尚硅谷_佟刚_Spring_自动装配
- Flash图表控件FusionCharts如何自定义图表的工具提示
- habse的CopyTable
- BeanUtils No value specified for Date的解决方法
- Hibernate 的<;generator class=";native";>;<;/generator>;的不同属性含义
- 【Unity3D】场景转换与退出
- linux常用命令-搜索
- Common Table Expressions (CTE)
- 【Unity3d游戏开发】游戏中的贝塞尔曲线以及其在Unity中的实现
- python学习:Dmidecode系统信息(一)
- javascript 正则(将数字转化为三位分隔的样式)
- 深入浅出Git教程(转载)
- MangoDb的安装及使用
- 如何给python程序加密
- oracle性能优化之awr分析
- 基于VS Code创建Spring Boot项目开发REST API(一)
热门文章
- Vagrant 手册之多个虚拟机 multi-machine
- Ubuntu下使用boost例子
- c#访问webapi以及获取
- 批量更新:A表数据源 B表目标
- ";CoolShell puzzle game"; writeup
- Quartz-第一篇 认识Quartz
- 两台centos,用yum install 安装,一台成功,一台失败
- POJ 2528 Mayor&#39;s posters(线段树,区间覆盖,单点查询)
- 状压BFS
- NGUI的下拉框的使用(popup list script)