在处理数据的时候,很多时候会遇到批量替换的情况,如果一个一个去修改效率过低,也容易出错。replace()是很好的方法。

1.基本结构:

df.replace(to_replace, value) 前面是需要替换的值,后面是替换后的值。

这样会搜索整个DataFrame, 并将所有符合条件的元素全部替换。

进行上述操作之后,其实原DataFrame是并没有改变的。改变的只是一个复制品。

2. 如果需要改变原数据,需要添加常用参数 inplace=True

这个参数在一般情况没多大用处,但是如果只替换部分区域时,inplace参数就有用了。

在上面这个操作中,‘合计’这一列中的0,并没有被替换。只有‘金额’这一列的0被替换,而且,替换后的结果不需要我们再和原数据进行合并操作,直接体现在原数据中。

只对某一列特定的值进行替换:

result['prediction'].replace([0,1,2,3,4,5,6,7,8],[870,870,880,898,1300,13117,13298,13690,13691],inplace=True)

BTW: 在pyspark 中的 replace() 函数

result.na.replace([0,1,2,3,4,5,6,7,8], [870,878,880,898,1300,13117,13298,13690,13691], 'prediction')

https://www.cnblogs.com/nshuai/articles/5762343.html

最新文章

  1. ASP.NET Core Web API Cassandra CRUD 操作
  2. 《HiWind企业快速开发框架实战》(3)使用HiWind创建和管理菜单
  3. Emacs学习心得之 LaTeX编辑
  4. iOS LaunchImage 各尺寸
  5. Salesforce 动态审批
  6. 分拆素数和 HDU - 2098
  7. hdu 2099 整除的尾数
  8. An attempt was made to load a program with an incorrect format
  9. Android 发布可穿戴设备 SDK 的开发者预览版
  10. JS自总结
  11. Hack工具
  12. Parse和Convert的区别
  13. 多工段查询存放到DataTable到List<DataTable>集合在C#里面做汇总
  14. 设计模式之建造者模式(Builder)
  15. java5 - 数组与排序算法
  16. java 引用数据类型(类)
  17. mycat 安装 分表 分库 读写分离
  18. linux 之分区和文件系统
  19. 能量模型与softmax和RBM以及正态分布的关联
  20. 《转》return *this和 return this有什么区别?

热门文章

  1. JavaScript 之 解码类似eval(function(p,a,c,k,e,d){}))的JavaScript代码
  2. Mybatis 自动生成代码,数据库postgresql
  3. Zabbix,Nagios,OneAPM Servers 安装部署大比拼
  4. Eclipse经常使用快捷键
  5. 【AIX】用户、组合安全管理
  6. python之模块cmath
  7. 老古董---ASP.NET中aspx页面runat="server"
  8. Linux中svn的使用
  9. (原)SphereFace及其pytorch代码
  10. (原)ubuntnu中anaconda的g++提示crtbeginS.o:unrecognized relocation