第4章 决策树

4.1 基本流程

#输入:训练集D={${(x_1,y_1),(x_2,y_2),...,(x_m,y_m)}$};
#属性集A=${{a_1,a_2,...,a_d}}$.
#过程:函数TreeGeneratw(D,A)
1:生成结点node;
2:if D中样本全属于同一类别C then
3: 将node标记为C类叶结点;return
4:end if
5:if A=${\emptyset}$ OR D中样本在A上取值相同 then
6: 将node标记为叶结点,其类别标记为D中样本数最多的类;return
7:end if
8:从A中选择最优划分属性${a_*}$;
9:for ${a_*}$ 的每一个值${a_*^v}$ do
10: 为node生成一个分支;令D_v表示D中在a_*上取值为a_*^v的样本子集;
11: if D_v 为空 then
12: 将分支结点标记为叶结点,其类别标记为D中样本最多的类;return
13: else
14: 以TreeGenerate(D_v,A\{A_*})为分支结点
15: end if
16: end for
输出:以node为根结点的一棵决策树

决策树的本质就是整个分类过程的具体操作过程,如前置条件满足则进行后续判断,否则则或是输出分类结果,或是继续进行其他分类结果的过程判断。

4.2 划分选择

4.3 剪枝处理

4.4 连续与缺失值

4.5 多变量决策树

最新文章

  1. 珍珠(bead)
  2. OpenMP编程总结表
  3. 《C#本质论》读书笔记(14)支持标准查询操作符的集合接口
  4. MQTT协议的简单介绍和服务器的安装
  5. [CAMCOCO][C#]我的系统架构.服务器端.(一)
  6. hdu 2203
  7. Swift - 动态添加删除TableView的单元格(以及内部元件)
  8. 用vlc搭建简单流媒体服务器(UDP和TCP方式)
  9. 第二周c语言PTA作业留
  10. Git的可视化工具SourceTree管理代码 SourceTree的使用
  11. Servlet抽取的问题-method传递问题+表单提交的问题
  12. [转帖]HPE的软件部分到底是谁的?
  13. vue2.x + vux采坑总结(一)
  14. ios消息机制
  15. centos 解决中文支持问题, 如此修改可以修正eclipse 乱码问题。
  16. volatile synchronized AtomicInteger的区别
  17. How to add libraries to “External Libraries” in WebStorm/PhpStorm/Intellij
  18. 剑指offer23 从上往下打印二叉树
  19. member access within misaligned address 0x000000000031 for type 'struct ListNode', which requires 8 byte alignment
  20. nginx与apache的区别

热门文章

  1. 头文件与main函数
  2. 新开源HTML5单文件网页版ACME客户端,可在线申请Let's Encrypt、ZeroSSL免费HTTPS多域名通配符泛域名SSL/TLS证书(RSA/ECC/ECDSA)
  3. 使用 Skywalking Agent,这里使用sidecar 模式挂载 agent
  4. 使用SkyWalking监控nginx (以openresty为例)
  5. 在kibana中查看nginx日志的Discover,Dashboards
  6. Ingress
  7. 基于MySQL的-u选项实现如何最大程度防止人为误操作MySQL数据库
  8. 《HelloGitHub》第 78 期
  9. FluentValidation 验证(二):WebApi 中使用 注入服务
  10. 记一次 .NET 某企业OA后端服务 卡死分析