pandas 4 处理缺失数据nan
2024-09-04 21:22:51
from __future__ import print_function
import pandas as pd
import numpy as np
np.random.seed(1)
dates = pd.date_range('20130101', periods=6)
df = pd.DataFrame(np.arange(24).reshape((6,4)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[0,1] = np.nan
df.iloc[1,2] = np.nan # Nan模拟缺失的数据
print(df)
print(df.dropna(axis=0, how='all')) # how={'any', 'all'} 全部是0才丢掉
print(df.dropna(axis=0, how='any')) # how={'any', 'all'} 有0就丢掉行
print(df.fillna(value=0)) # 所有的nan用0填充
print(pd.isnull(df)) # 判断每一个数据是否是Nan,是nan就输出True
print(np.any(df.isnull()) == True) # 如果有数据缺失,就输出True
以下是所有的输出结果:
print(df)
> A B C D
> 2013-01-01 0 NaN 2.0 3
> 2013-01-02 4 5.0 NaN 7
> 2013-01-03 8 9.0 10.0 11
> 2013-01-04 12 13.0 14.0 15
> 2013-01-05 16 17.0 18.0 19
> 2013-01-06 20 21.0 22.0 23
print(df.dropna(axis=0, how='all')) # how={'any', 'all'}
> A B C D
> 2013-01-01 0 NaN 2.0 3
> 2013-01-02 4 5.0 NaN 7
> 2013-01-03 8 9.0 10.0 11
> 2013-01-04 12 13.0 14.0 15
> 2013-01-05 16 17.0 18.0 19
> 2013-01-06 20 21.0 22.0 23
print(df.dropna(axis=0, how='any')) # how={'any', 'all'}
> A B C D
> 2013-01-03 8 9.0 10.0 11
> 2013-01-04 12 13.0 14.0 15
> 2013-01-05 16 17.0 18.0 19
> 2013-01-06 20 21.0 22.0 23
print(df.fillna(value=0))
> A B C D
> 2013-01-01 0 0.0 2.0 3
> 2013-01-02 4 5.0 0.0 7
> 2013-01-03 8 9.0 10.0 11
> 2013-01-04 12 13.0 14.0 15
> 2013-01-05 16 17.0 18.0 19
> 2013-01-06 20 21.0 22.0 23
print(pd.isnull(df))
> A B C D
> 2013-01-01 False True False False
> 2013-01-02 False False True False
> 2013-01-03 False False False False
> 2013-01-04 False False False False
> 2013-01-05 False False False False
> 2013-01-06 False False False False
print(np.any(df.isnull()) == True)
> True
END
最新文章
- [原创]CSS3打造动态3D气球
- Delphi控件之---UpDown以及其与TEdit的配合使用(比如限制TEdit只能输入数字,还有Object Inspector之组件属性的介绍)
- request \response 总结
- node的安装
- 基于Moodle的IT课程辅助教育平台搭建
- ViewPager+Fragment再探:和TAB滑动条一起三者结合
- Power-BI 仪表盘实现动态预警
- How To Tune or Test PLSQL Code Performance in Oracle D2k Forms
- BZOJ3928 [Cerc2014] Outer space invaders
- iOS多线程之NSOperation,NSOperationQueue
- POJ 1450
- [PHP]MemCached高级缓存
- redis百度百科和维基百科知识总结:
- deepin 2014 安装后 ,grub出错
- Eclipse with C++: ";Launch failed. Binary not found.";
- Web前端开发的一点记录
- EasyuiAPI:基础
- 自动化之路 python psutil模块 收集硬件信息
- sql查询语句报错处理——ERROR: failed to find conversion function from unknown to text
- 最短路问题之Bellman-ford算法
热门文章
- [读书笔记] R语言实战 (一) R语言介绍
- ORA-01795: 列表中的最大表达式数为 1000
- mysql5.7官网直译SQL语句优化--分组优化
- 创业笔记-Node.js入门之JavaScript与Node.js
- 程序猿的量化交易之路(21)--Cointrader之Currency货币实体(9)
- 面向程序猿的设计模式 ——GoF《设计模式》读书总结(壹)抽象工厂&;amp;生成器
- 多项福利回馈会员,且看Hao123怎样玩转“霸权主义”
- 从头认识java-15.3 使用HashSet须要注意的地方
- HDU5233
- Oracle 10g RAC (linux) ASM 共享存储的管理详解