利用Python进行数据分析_Pandas_处理缺失数据
2024-09-01 14:10:23
申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。
1 读取excel数据
import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df
2 检测缺失值
2.1 isnull返回一个含有布尔值的对象
import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.isnull()
df
2.2 notnull 是isnull 的否定式
import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.notnull()
df
3 滤除缺失数据
3.1 滤除所有包含缺失值的行
df.dropna()
3.2 查看不含缺失值的所有行、列
df.dropna(thresh=4)
4 填充缺失数据
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
4.1 统一填充某一个值value
df.fillna(0)或df.fillna(value=0)
4.2 用前面的值填充缺失部分
df.fillna(method='ffill')
4.3 用后面的值填充缺失部分
df.fillna(method='bfill')
4.3 某N列用特定的值填充缺失部分
df.fillna({'起息日':'2018-12-11','评级得分':''})
4.4 指定一整个轴的值填充缺失部分
df.fillna(method='ffill',axis=1)
最新文章
- Eclipse开发环境JDK版本问题和校验问题
- JavaScript字符串的操作-课堂笔记
- Linux 下使用Visual Studio Code
- 8 Pratical Examples of Linux “Touch” Command--reference
- php模板引擎技术简单实现
- 怎么在centos中查看某个目录的树结构?
- MKNetWorkKit打印URL
- lPC1788驱动SDRAM
- 【IDE】IntelliJ IDEA (Mac) 运行速度优化(问题起因:debug模式突然变得巨慢)
- C language 模拟 win的经典游戏——扫雷
- 常见.NET功能代码汇总 (3)
- WEB消息推送-原理篇
- yum自动安装mysql
- python: 爬取[博海拾贝]图片脚本
- 代码雨 html实现
- 使用jsencrypt(rsa加密方式)给js加密防被刷
- css3中trastion,transform,animation基本的了解
- 超级详细使用Webpack4.X 搭建H5开发环境
- 佛祖保佑,永不死机 - /etc/motd文件配置
- 分模块开发创建service子模块——(八)