第一次参加数据预测竞赛,发现还是挺有意思的。本文中的部分内容参考第一名“诗人都藏在水底”的解决方案

  从数据划分、特征提取、模型设计、模型融合/优化,整个业务流程得到了训练。作为新手在数据划分和模型训练以及模型融合上做的不够好(都是套路)。

  首先,数据划分方式最自然的按照月份-》后面的月份这种自然顺序(滑窗)即可,在整个数据集上做特征提取实在是不能发挥出 特征的优势,因为数据量本身挺大,太多的脏数据,会导致训练出的模型不准确。

看来这个竞赛并没有涉及到太多的数据清洗处理等工作。

  

  

  用户特征、商户特征、优惠券相关的特征、用户-商家交互特征有很多。

  

   从单模型到多模型的加权融合。每一个模型都是在训练集上调优到极限的。所以调模型并不是一个不重要的工作。主流的回归模型果然还是GBDT嘴刁,

XGBoost,GBDT,RandomForest这三种是他们用的主要模型。

  

最新文章

  1. HDU 5919 Sequence II 主席树
  2. 显示HTML文本
  3. Android IntentService完全解析 当Service遇到Handler
  4. Jquery对文本框的值、字符串的验证;正则表达式字符串的验证
  5. cocos2d-x-3.0 的改变,由于变得太多,一点点累积吧!
  6. css3高级运动keyframes
  7. 分享:shell去掉linux配置文件的注释行
  8. umask默认权限分配
  9. Android 开发笔记——通过 Intent 传递类对象
  10. git 创建远程仓库
  11. [转]Android重力感应开发
  12. YII重点文件
  13. Gym 100917L Liesbeth and the String 规律&&胡搞
  14. linux下Tomcat 安装后执行startup.sh,出现– Cannot find …bin/catalina.sh
  15. 05 利用Appliction 传值Activity
  16. 《Gradle权威指南》--Android Gradle多项目构建
  17. MXNET:权重衰减
  18. PAT1021(dfs 连通分量)
  19. 将驼峰转化为下化线(将型如AbcDef转化为abc_def)
  20. Apache 与 Tomcat 整合

热门文章

  1. Jquery为DIV添加点击事件,Jquery为a标签超链接添加点击事件
  2. python 安装依赖几个问题---HttpScan
  3. oracle链接不上的问题
  4. Mybatis教程(一)
  5. 百万级 TCP 长连接即时通讯框架 t-io
  6. git: 保存帐号信息
  7. Windows 10 S中的Device Guard详解(上篇)
  8. [转载]【BlackHat 2017】美国黑客大会首日议题汇总,演讲PPT下载也在这里
  9. Flink内存管理源代码解读之基础数据结构
  10. 斜率优化专题1——bzoj 1597 [Usaco2008 Mar] 土地购买 题解