算法应用杂谈-xgboost的偏差
2024-09-02 15:33:32
一个小样本的cvr 估计问题中, 考虑用xgboost 模型. 发现结果的估计偏差很大. 仔细研究后, 发现现象:
- 迭代步数不多, 一般3,5步就停了.
- 预测的分数偏差很大, 分布不匀. pcoc很大. 注: pcoc = 分数均值/ 正样本占比 - 1
- 类似的参数用 lightgbm跑则比较正确.
仔细分析发现是因为迭代不够充分情况下, 会产生这个问题. 可以通过一个参数调整解决, 方法为:
- 将base_score 设置为 正样本占比, 可以解决偏差大的问题. 但auc 可能变低, 需要相应的调整参数.
{
'min_child_weight': 100,
'lambda': 1,
'alpha': 1,
'base_score':0.012,
'grow_policy': 'lossguide',
'min_split_loss': 0.001
}
最新文章
- commons-lang包中我们常用的类的作用
- 利用javascript对字符串加密
- makefile学习小结
- “System.Data.OracleClient.OracleConnection”已过时
- duilib relativepos属性导致控件错误的bug修复
- Hadoop 2.6.0编译on mac
- Codeforces Round #263 (Div. 1) C. Appleman and a Sheet of Paper 树状数组暴力更新
- jQuery Mobile Slider 禁用点击事件
- imx51-linux的cpuinfo之分析
- SQL Server的Descending Indexes
- 学习笔记CB013: TensorFlow、TensorBoard、seq2seq
- array_walk函数与call_user_func_array函数
- 用layui前端框架弹出form表单以及提交
- 【Kibana】自定义contextPath
- Oracle中查看所有表和字段
- 剑指offer(11)二进制中1的个数
- 使用vim打造自己的python编辑器
- android -------- 常用依赖库
- 微信 小程序组件 加入购物车全套 one js
- windows下java开发资料汇总