申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。

1 读取excel数据

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df

2 检测缺失值

2.1 isnull返回一个含有布尔值的对象

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.isnull()
df

2.2 notnull  是isnull 的否定式

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.notnull()
df

3 滤除缺失数据

3.1 滤除所有包含缺失值的行

df.dropna()

3.2 查看不含缺失值的所有行、列

df.dropna(thresh=4)

4 填充缺失数据

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

4.1 统一填充某一个值value

df.fillna(0)或df.fillna(value=0)

4.2 用前面的值填充缺失部分

df.fillna(method='ffill')

4.3 用后面的值填充缺失部分

df.fillna(method='bfill')

4.3 某N列用特定的值填充缺失部分

df.fillna({'起息日':'2018-12-11','评级得分':''})

4.4 指定一整个轴的值填充缺失部分

df.fillna(method='ffill',axis=1)

最新文章

  1. Eclipse开发环境JDK版本问题和校验问题
  2. JavaScript字符串的操作-课堂笔记
  3. Linux 下使用Visual Studio Code
  4. 8 Pratical Examples of Linux “Touch” Command--reference
  5. php模板引擎技术简单实现
  6. 怎么在centos中查看某个目录的树结构?
  7. MKNetWorkKit打印URL
  8. lPC1788驱动SDRAM
  9. 【IDE】IntelliJ IDEA (Mac) 运行速度优化(问题起因:debug模式突然变得巨慢)
  10. C language 模拟 win的经典游戏——扫雷
  11. 常见.NET功能代码汇总 (3)
  12. WEB消息推送-原理篇
  13. yum自动安装mysql
  14. python: 爬取[博海拾贝]图片脚本
  15. 代码雨 html实现
  16. 使用jsencrypt(rsa加密方式)给js加密防被刷
  17. css3中trastion,transform,animation基本的了解
  18. 超级详细使用Webpack4.X 搭建H5开发环境
  19. 佛祖保佑,永不死机 - /etc/motd文件配置
  20. 分模块开发创建service子模块——(八)

热门文章

  1. hive on tez
  2. Arts打卡第8周
  3. Asis_2016_b00ks wp
  4. HbuilderX
  5. Go 与 JSON
  6. spring aop中aspect和advisor的区别
  7. React拾遗(上)
  8. LC 450. Delete Node in a BST
  9. python线程池(转)
  10. IDEA新建本地项目关联远程git仓库