在数据预处理时首先可以对偏度比较大的数据用log1p函数进行转化,使其更加服从高斯分布,此步处理可能会使我们后续的分类结果得到一个更好的结果;
平滑处理很容易被忽略掉,导致模型的结果总是达不到一定的标准,同样使用逼格更高的log1p能避免复值得问题——复值指一个自变量对应多个因变量;

log1p的使用就像是将一个数据压缩到了一个区间,与数据的标准化类似。它的逆运算是expm1函数。

log1p :=       即

expm1 := 

log1p函数有它存在的意义,即保证了x数据的有效性,当x很小时(如 两个数值相减后得到),由于太小超过数值有效性,用计算得到结果为0,

换作log1p则计算得到一个很小却不为0的结果,这便是它的意义(好像是用泰勒公式来展开运算的,不确定)。

同样的道理对于expm1,当x特别小,就会急剧下降出现如上问题,甚至出现错误值。

另外RMSLE(均方根对数误差)会更多的惩罚欠拟合,所以在使用该误差定义时我们也可以用到上面的函数:

  1. np.loglp计算加一后的对数,其逆运算是np.expm1;
  2. 采用此误差函数时,可以先对原始数据做np.log1p,再使用RMSE。

最新文章

  1. ASP.NET MVC 解析模板生成静态页一(RazorEngine)
  2. getElement的几中属性介绍
  3. Redis容量及使用规划(转)
  4. 从源码剖析一个Spark WordCount Job执行的全过程
  5. 关于Bufferedreader的功能扩写
  6. FileZilla 无法保存密码
  7. iOS 网络请求——post请求
  8. SpringMVC一路总结(
  9. BUG,带给我的思考
  10. mac air 上的Linux命令训练(1)
  11. Java爬虫----有道翻译初步
  12. jquery绑定onkeyup()事件3中方法
  13. EBS R12安装升级(FRESH)(四)
  14. python 线程/线程锁/信号量
  15. 采用梯度下降优化器(Gradient Descent optimizer)结合禁忌搜索(Tabu Search)求解矩阵的全部特征值和特征向量
  16. mysql 开发进阶篇系列 13 锁问题(关于表锁,死锁示例,锁等待设置)
  17. centOS 6.5采用python+nginx+uwsgi实现爬金十财经日历
  18. SQL SERVER 数据库字段简单加密解密
  19. UILabel富文本 段落格式以及UILabel添加图片
  20. 项目冲刺Beta第二篇博客

热门文章

  1. Linux通配符知识深度实践详解
  2. centos 6.x下jira显示饼图乱码解决方法
  3. 【转帖】linux sort,uniq,cut,wc,tr,xargs命令详解
  4. 使用jackson序列化json时遇到的坑
  5. ASSERT((IDM_ABOUTBOX & 0xFFF0) == IDM_ABOUTBOX);
  6. python------模块基础【第二部分-time】------
  7. MySql常用字符集
  8. sort()方法的用法,参数以及排序原理
  9. MySQL安装及初级增删改查一
  10. DevOps 之 Jenkins 安装、配置、美化、插件及常见错误处理