2016天池-O2O优惠券使用预测竞赛总结
2024-09-30 21:00:50
第一次参加数据预测竞赛,发现还是挺有意思的。本文中的部分内容参考第一名“诗人都藏在水底”的解决方案。
从数据划分、特征提取、模型设计、模型融合/优化,整个业务流程得到了训练。作为新手在数据划分和模型训练以及模型融合上做的不够好(都是套路)。
首先,数据划分方式最自然的按照月份-》后面的月份这种自然顺序(滑窗)即可,在整个数据集上做特征提取实在是不能发挥出 特征的优势,因为数据量本身挺大,太多的脏数据,会导致训练出的模型不准确。
看来这个竞赛并没有涉及到太多的数据清洗处理等工作。
用户特征、商户特征、优惠券相关的特征、用户-商家交互特征有很多。
从单模型到多模型的加权融合。每一个模型都是在训练集上调优到极限的。所以调模型并不是一个不重要的工作。主流的回归模型果然还是GBDT嘴刁,
XGBoost,GBDT,RandomForest这三种是他们用的主要模型。
最新文章
- HDU 5919 Sequence II 主席树
- 显示HTML文本
- Android IntentService完全解析 当Service遇到Handler
- Jquery对文本框的值、字符串的验证;正则表达式字符串的验证
- cocos2d-x-3.0 的改变,由于变得太多,一点点累积吧!
- css3高级运动keyframes
- 分享:shell去掉linux配置文件的注释行
- umask默认权限分配
- Android 开发笔记——通过 Intent 传递类对象
- git 创建远程仓库
- [转]Android重力感应开发
- YII重点文件
- Gym 100917L Liesbeth and the String 规律&;&;胡搞
- linux下Tomcat 安装后执行startup.sh,出现– Cannot find …bin/catalina.sh
- 05 利用Appliction 传值Activity
- 《Gradle权威指南》--Android Gradle多项目构建
- MXNET:权重衰减
- PAT1021(dfs 连通分量)
- 将驼峰转化为下化线(将型如AbcDef转化为abc_def)
- Apache 与 Tomcat 整合
热门文章
- Jquery为DIV添加点击事件,Jquery为a标签超链接添加点击事件
- python 安装依赖几个问题---HttpScan
- oracle链接不上的问题
- Mybatis教程(一)
- 百万级 TCP 长连接即时通讯框架 t-io
- git: 保存帐号信息
- Windows 10 S中的Device Guard详解(上篇)
- [转载]【BlackHat 2017】美国黑客大会首日议题汇总,演讲PPT下载也在这里
- Flink内存管理源代码解读之基础数据结构
- 斜率优化专题1——bzoj 1597 [Usaco2008 Mar] 土地购买 题解