1dataframe删除某一列的重复元素,默认只留下第一次出现的

inplace参数设置为true时直接在原数据上修改,为False时,生成副本.

注意所有函数中inplace一旦设置为True,此时后面不能再跟任何函数,因为它整体已经是None.想要再跟函数只能再写一行.

且此时在前面也不能赋值,赋值也是None.因为设置为True时,整体是None,设置为False时,整体是一个引用,可以赋给其它变量.

a1 = pd.DataFrame({
'a': [1, 1, 3, 2,],
'b': [1, 1, 6, 4,],
'c': [1, 1, 3, 9,]
})
print(a1)
a1.drop_duplicates(inplace=True)
print(a1)
# 这里inplace为假,整体实际上是一个引用,所以可以直接输出.
print(a1.drop_duplicates(['a','b'], keep='first',inplace=False))
# 注意这里因为inplace为真,直接在原数据上修改,直接输出是空,因为它并不是一个引用,a1才是引用.
print(a1.drop_duplicates(['a','b'], keep='first',inplace=True))
# a b c
# 0 1 1 1
# 1 1 1 1
# 2 3 6 3
# 3 2 4 9
# a b c
# 0 1 1 1
# 2 3 6 3
# 3 2 4 9
# a b c
# 0 1 1 1
# 2 3 6 3
# 3 2 4 9
# None

https://blog.csdn.net/qq_28811329/article/details/79962511

 test_sample_quchong = test_sample.drop_duplicates(['ggid'])利用 data.drop_duplicates()#data中一行元素全部相同时才去除可检查dataframe是否有重复的行
 参考:   https://www.cnblogs.com/mahailuo/p/8317178.html
2 想要留下去掉的重复行,可以先删除重复行后,保存索引,再删除索引.
import pandas as pd
import numpy as np
import re df = pd.DataFrame({'a': [1,1,3,4,3],
'b': [1,1,3,4,3],
'c': [1,1,3,4,3]})
print('原始数据:\n',df)
print('去掉重复行后:\n', df.drop_duplicates())
drop_index = df.drop_duplicates().index.tolist()
print('去掉的重复行是:\n',df.drop(drop_index))
# 原始数据:
# a b c
# 0 1 1 1
# 1 1 1 1
# 2 3 3 3
# 3 4 4 4
# 4 3 3 3
# 去掉重复行后:
# a b c
# 0 1 1 1
# 2 3 3 3
# 3 4 4 4
# 去掉的重复行是:
# a b c
# 1 1 1 1
# 4 3 3 3

最新文章

  1. python学习笔记整理——列表
  2. Erlang 104 OTP
  3. 【转载】Velocity模板引擎的介绍和基本的模板语言语法使用
  4. 从Yii2的Request看其CSRF防范策略
  5. fatal error C1853: '*.pch' is not a precompiled header file created with this compile
  6. linux 交换分区分配规则
  7. 《.NET简单企业应用》技术路线
  8. STLport在vc6中的集成
  9. Java -- 浅入Java反射机制
  10. 【翻译】在Ext JS和Sencha Touch中创建自定义布局
  11. 【最小生成树】Bzoj1601[Usaco2008 Oct]灌水
  12. OPC协议解析-关于OPC协议的几个问题
  13. JavaScript易错点 -- 数组比较
  14. cat语法
  15. python3通过gevent.pool限制协程并发数量
  16. hdu 1072(BFS) 有炸弹
  17. 动态代理实现设置tomcat请求编码
  18. 关于UIImageView的显示问题——居中显示或者截取图片的中间部分显示
  19. BZOJ 1345[BOI]序列问题 - 贪心 + 单调栈
  20. LGP4577【JSOI2018】战争

热门文章

  1. vue 防抖和节流
  2. ukhj
  3. 二、在 ASP.NET Core 中使用 SignalR之类库
  4. 022-OpenStack 中虚拟机hostname问题
  5. <authentication> 元素
  6. DDD领域驱动设计初探(七):Web层的搭建
  7. Python---协程---重写多进程
  8. HBase过滤器(转载)
  9. 密码技术之密钥、随机数、PGP、SSL/TLS
  10. 6362. 【NOIP2019模拟2019.9.18】数星星