log1p和expm1
2024-10-06 08:54:16
在数据预处理时首先可以对偏度比较大的数据用log1p函数进行转化,使其更加服从高斯分布,此步处理可能会使我们后续的分类结果得到一个更好的结果;
平滑处理很容易被忽略掉,导致模型的结果总是达不到一定的标准,同样使用逼格更高的log1p能避免复值得问题——复值指一个自变量对应多个因变量;
log1p的使用就像是将一个数据压缩到了一个区间,与数据的标准化类似。它的逆运算是expm1函数。
log1p := 即
expm1 :=
log1p函数有它存在的意义,即保证了x数据的有效性,当x很小时(如 两个数值相减后得到),由于太小超过数值有效性,用计算得到结果为0,
换作log1p则计算得到一个很小却不为0的结果,这便是它的意义(好像是用泰勒公式来展开运算的,不确定)。
同样的道理对于expm1,当x特别小,就会急剧下降出现如上问题,甚至出现错误值。
另外RMSLE(均方根对数误差)会更多的惩罚欠拟合,所以在使用该误差定义时我们也可以用到上面的函数:
- np.loglp计算加一后的对数,其逆运算是np.expm1;
- 采用此误差函数时,可以先对原始数据做np.log1p,再使用RMSE。
最新文章
- ASP.NET MVC 解析模板生成静态页一(RazorEngine)
- getElement的几中属性介绍
- Redis容量及使用规划(转)
- 从源码剖析一个Spark WordCount Job执行的全过程
- 关于Bufferedreader的功能扩写
- FileZilla 无法保存密码
- iOS 网络请求——post请求
- SpringMVC一路总结(
- BUG,带给我的思考
- mac air 上的Linux命令训练(1)
- Java爬虫----有道翻译初步
- jquery绑定onkeyup()事件3中方法
- EBS R12安装升级(FRESH)(四)
- python 线程/线程锁/信号量
- 采用梯度下降优化器(Gradient Descent optimizer)结合禁忌搜索(Tabu Search)求解矩阵的全部特征值和特征向量
- mysql 开发进阶篇系列 13 锁问题(关于表锁,死锁示例,锁等待设置)
- centOS 6.5采用python+nginx+uwsgi实现爬金十财经日历
- SQL SERVER 数据库字段简单加密解密
- UILabel富文本 段落格式以及UILabel添加图片
- 项目冲刺Beta第二篇博客
热门文章
- Linux通配符知识深度实践详解
- centos 6.x下jira显示饼图乱码解决方法
- 【转帖】linux sort,uniq,cut,wc,tr,xargs命令详解
- 使用jackson序列化json时遇到的坑
- ASSERT((IDM_ABOUTBOX &; 0xFFF0) == IDM_ABOUTBOX);
- python------模块基础【第二部分-time】------
- MySql常用字符集
- sort()方法的用法,参数以及排序原理
- MySQL安装及初级增删改查一
- DevOps 之 Jenkins 安装、配置、美化、插件及常见错误处理