python对数据去重处理
2024-08-28 03:51:44
我们在数据处理时,经常需要用到对重复数据进行过滤处理。 对数据去重有两种处理方式,如下:
1、对重复数据去重,并且会自动排序
使用函数 set
# 列表去重
list_a = [6, 6, 5, 1, 2, 2, 3, 4, 4, 4, 6, 7, 8, 8, 8, 10] # 仅去重
list_aa = set(list_a) print(list_aa)
结果如下:
细心的小伙伴就会发现,不仅去重了,还对数据进行了重新排序。
2、对数据去重不改变原有顺序
# 列表去重
list_a = [6, 6, 5, 1, 2, 2, 3, 4, 4, 4, 6, 7, 8, 8, 8, 10] # 排序保持原来顺序
list_ab = list(set(list_a))
list_ab.sort(key=list_a.index) print(list_ab)
结果如下:
对数据进行了去重,但是没有改变原有数据的顺序。
list.sort()函数是对列表进行排序处理, 通过key值指定排序的方式。 这样顺序就不会变化了。
最新文章
- CMS模板引擎:XHtmlAction
- 测试cookie的读写
- 一种集合“相等性”的实现
- Web UI - Javascript之DOM Ready
- MapReduce实现二度好友关系
- LNK2005 连接错误解决办法
- UITableView(转)
- android中“下次不再提示”的对话框(修改自某大神)
- java相关的路径获取 (转载 http://tomfish88.iteye.com/blog/971255)
- Upload无刷新上传控件
- [Swift]LeetCode171. Excel表列序号 | Excel Sheet Column Number
- 去除编辑器的HTML标签
- mysql navicat 及命令行 创建、删除数据库
- spring boot(17)-@Async异步
- Android Intent实现页面之间跳转
- sql: Oracle 11g create procedure
- hdu6215 Brute Force Sorting
- 【BZOJ2124】等差子序列 树状数组维护hash值
- 嵌入式框架Zorb Framework搭建五:事件的实现
- Go丨语言对数据库操作报错 panic: dial tcp 127.0.0.1:3306: connectex: No connection could be made because the target machine actively refused it.