1 引言

高效处理数据的python工具:

与外界进行交互:

  读写各种文件格式和数据库

准备:

  对数据进行清理、修整、整合、规范化、重塑、切片切换、变形等处理以便进行分析

转换:

  对数据集做一些数学和统计运算以产生新的数据集。你如说,根据分组变量对一个大表进行聚合

建模和计算:

  将数据进行统计模型、机器学习或其他计算工具联系起来

展示:

  创建交互式或静态的图片或文字摘要

2 重要的库

(1)NumPy(Numerical Python)

菜鸟教程

numerical 英 /njuː'merɪk(ə)l/ 美 /nʊ'mɛrɪkl/N

NumPy是python科学计算的基础包

英 /nʌm/ py

一维数组:[ ];二维数组:[ [ ],[ ] ];三维数组:[ [ [ ],[ ] ],[ [ ],[ ] ] ]

NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
矩阵运算

一个强大的N维数组对象 ndarray
用于对数组执行元素级计算以及直接对数组执行数学运算的函数
用于毒血硬盘上基于数组的数据集个工具
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能
import numpy as np

(2)pandas

pandas是numpy的升级版本

提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数

pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据库(如SQL)灵活的数据处理功能。他提供了复杂的精细索引功能

以便便捷完成重塑、切片和切块、聚合以及选取数据子集等操作

首先需要了解他主要两个数据结构:Series和DataFrame。

(3)matplotlib数据可视化神器

[mæt'plɒtlib] 美式读音:[mæt'plotlib]

是最流行的用于绘制数据图表的Python库

import matplotlib.pyplot as plt

线图;
散点图;
等高线图;
条形图;
柱状图;
3D 图形,
甚至是图形动画等等.

最新文章

  1. viso
  2. CSS3动画效果-7.13
  3. Couchbase N1QL
  4. 总结eclipse中安装maven插件
  5. .gitignore 配置
  6. WEB安全测试的类型
  7. 面试时如何优雅的谈论OC
  8. C/C++语言学习——内存分配管理
  9. 什么是NoSQL
  10. Ubuntu 18.04基本配置
  11. postman加密短信验证码
  12. springMVC---业务处理流程图和最简单的springMvc搭建截图说明
  13. 关于用户登录状态存session,cookie还是数据库或者memcache的优劣
  14. Python基础5 常用模块学习
  15. 多目标进化算法(MOEA)概述
  16. table中超过长度的列,显示省略号
  17. 记录C#错误日志工具
  18. FTP枢轴攻击
  19. 【python】没有root权限的时候安装Python package
  20. CUDA内存拷贝

热门文章

  1. java类的高级概念
  2. keil项目的调试与编译
  3. html 刷新重载方法汇总
  4. RSA加密解密实现(JAVA)
  5. OperateResult 基础类及派生类介绍
  6. 2018年3月6日16:54:58 考试错误的java题目总结
  7. 15.python并发编程(线程--进程--协程)
  8. LeetCode - X of a Kind in a Deck of Cards
  9. Mongo数据库基本操作
  10. 对象属性的描述:writable、enumerable、configurable