Datawhale组队学习_Task03:详读西瓜书+南瓜书第4章
2024-10-20 11:29:35
第4章 决策树
4.1 基本流程
#输入:训练集D={${(x_1,y_1),(x_2,y_2),...,(x_m,y_m)}$};
#属性集A=${{a_1,a_2,...,a_d}}$.
#过程:函数TreeGeneratw(D,A)
1:生成结点node;
2:if D中样本全属于同一类别C then
3: 将node标记为C类叶结点;return
4:end if
5:if A=${\emptyset}$ OR D中样本在A上取值相同 then
6: 将node标记为叶结点,其类别标记为D中样本数最多的类;return
7:end if
8:从A中选择最优划分属性${a_*}$;
9:for ${a_*}$ 的每一个值${a_*^v}$ do
10: 为node生成一个分支;令D_v表示D中在a_*上取值为a_*^v的样本子集;
11: if D_v 为空 then
12: 将分支结点标记为叶结点,其类别标记为D中样本最多的类;return
13: else
14: 以TreeGenerate(D_v,A\{A_*})为分支结点
15: end if
16: end for
输出:以node为根结点的一棵决策树
决策树的本质就是整个分类过程的具体操作过程,如前置条件满足则进行后续判断,否则则或是输出分类结果,或是继续进行其他分类结果的过程判断。
4.2 划分选择
4.3 剪枝处理
4.4 连续与缺失值
4.5 多变量决策树
最新文章
- 珍珠(bead)
- OpenMP编程总结表
- 《C#本质论》读书笔记(14)支持标准查询操作符的集合接口
- MQTT协议的简单介绍和服务器的安装
- [CAMCOCO][C#]我的系统架构.服务器端.(一)
- hdu 2203
- Swift - 动态添加删除TableView的单元格(以及内部元件)
- 用vlc搭建简单流媒体服务器(UDP和TCP方式)
- 第二周c语言PTA作业留
- Git的可视化工具SourceTree管理代码 SourceTree的使用
- Servlet抽取的问题-method传递问题+表单提交的问题
- [转帖]HPE的软件部分到底是谁的?
- vue2.x + vux采坑总结(一)
- ios消息机制
- centos 解决中文支持问题, 如此修改可以修正eclipse 乱码问题。
- volatile synchronized AtomicInteger的区别
- How to add libraries to “External Libraries” in WebStorm/PhpStorm/Intellij
- 剑指offer23 从上往下打印二叉树
- member access within misaligned address 0x000000000031 for type 'struct ListNode', which requires 8 byte alignment
- nginx与apache的区别
热门文章
- 头文件与main函数
- 新开源HTML5单文件网页版ACME客户端,可在线申请Let's Encrypt、ZeroSSL免费HTTPS多域名通配符泛域名SSL/TLS证书(RSA/ECC/ECDSA)
- 使用 Skywalking Agent,这里使用sidecar 模式挂载 agent
- 使用SkyWalking监控nginx (以openresty为例)
- 在kibana中查看nginx日志的Discover,Dashboards
- Ingress
- 基于MySQL的-u选项实现如何最大程度防止人为误操作MySQL数据库
- 《HelloGitHub》第 78 期
- FluentValidation 验证(二):WebApi 中使用 注入服务
- 记一次 .NET 某企业OA后端服务 卡死分析