利用Python进行数据分析学习记录(一)
2024-09-06 15:24:31
1、Python的科学计算邮件列表
pydata:这是一个Google Group邮件列表,其中的问题都是Python数据分析和pandas方面的。
pystatsmodels:针对Numpy相关的问题
numpy-discussion:针对Numpy相关的问题
scipy-user:针对与scipy和Python科学计算相关的问题
探讨会:PyCon和EuroPython
2、引入惯例
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
在Python软件开发过程中,不建议直接引入Numpy这种大型库的全部内容
3、编程和数据科学方面的常用术语
数据规整(Munge/Munging/Wrangling):
指的是将非结构化和(或)散乱数据处理为结构化或整洁形式的整个过程。
伪代码(Pseudocode):
算法或过程的代码式描述,而这些代码本身并不是实际有效的源代码。
语法糖(syntactic sugar):
一种编程语法,它并不会带来新的特性,但却能让代码易读,更易写。
4.读者各自工作的最终目的千差万别,但基本都需要完成以下几个大类的任务:
与外界进行交互:读写各种各样的文件格式和数据库
准备:对数据进行清理、修整、整合、规范化、重塑、切片切块、变形等处理以便进行分析。
转换:对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。
建模和计算:将数据跟统计模型、机器学习算法或其他计算工具联系起来。
展示:创建交互式的或静态的图片或文字摘要。
第一章的例子只看了bit.ly的1.usa.gov例子,其余的都看不懂,先不看了
最新文章
- 【译】Learn ES2015——箭头函数
- Android 查缺补漏之Adapter 和 LayoutInflater
- 洛谷P1726 上白泽慧音
- Algorithms, Part I by Kevin Wayne, Robert Sedgewick
- 图片上传代码(C#)
- jquery easyui Combobox 实现 两级联动
- ExtJs学习笔记之Button组件
- DXP中原理图与PCB图元件互找
- hasshmap输出value
- memcached几个easy被忽略但很实用的命令
- libeXosip2(1-1) -- How-To initialize libeXosip2.
- xCode6制作动态及静态Framework(转)
- chapter 14_1 环境
- HashMap HashTable和ConcurrentHashMap的区别
- Java单例模式之饿汉模式与懒汉模式
- Shell Script - 追踪与debug
- POI excel导出
- BZOJ_2661_[BeiJing wc2012]连连看_费用流
- python框架之Flask(2)-路由和视图&;Session
- [INet] WebSocket 数据收发的详细过程