关于pip安装

.\pip.exe install --ignore-installed --upgrade tensorflow-gpu

python可视化库

  • Seaborn:是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图。(用来对Titanic数据集来进行分析)

pandas

user[user['user_id']==10001082]  #特定查询

train.Survived.value_counts()  #pandas 可以直接 .列名

Survived_0 = data_train.Pclass[data_train.Survived == 0].value_counts()  #进阶

https://www.cnblogs.com/chaosimple/p/4153083.html   pandas十分钟

train.Survived.value_counts().plot(kind='bar')   #可以直接在matplotlib里画图

get_dummies获取某一列的one-hot向量

boolean索引

pandas 10 十分钟入门系列

https://www.cnblogs.com/chaosimple/p/4153083.html

创建

dataframe对象创建:传入numpy , 字典对象也可以

参看数据
选择  有标签方法,位置方法,布尔方法

http://blog.csdn.net/xw_classmate/article/details/51333646

缺失值处理

. Apply对数据应用函数

.str 使用字符串函数

合并

Concat基本的合并     Join 类似于SQL类型的合并(按照主键)    Append 将一行连接到一个DataFrame上,

分组

对于”group by”操作,我们通常是指以下一个或多个操作步骤:

l  (Splitting)按照一些规则将数据分为不同的组;

l  (Applying)对于每组数据分别执行一个函数;

l  (Combining)将结果组合到一个数据结构中;

Categorical

高级操作:

统计两个key关于第三个key的值

层次化索引(hierarchical index)是pandas的重要功能,这能使在一个轴上拥有两个以上的索引级别。抽象点说,它能使你以低维度形式处理高维度。

https://www.cnblogs.com/batteryhp/p/5006274.html

matplotlib

import matplotlib.pyplot as plt
fig = plt.figure()
fig.set(alpha=0.2) # 设定图表颜色alpha参数 plt.subplot2grid((2,3),(0,0)) # 在一张大图里分列几个小图
data_train.Survived.value_counts().plot(kind='bar')# 柱状图
plt.title(u"获救情况 (1为获救)") # 标题
plt.ylabel(u"人数") plt.subplot2grid((2,3),(0,1))
data_train.Pclass.value_counts().plot(kind="bar")
plt.ylabel(u"人数")
plt.title(u"乘客等级分布") plt.subplot2grid((2,3),(0,2))
plt.scatter(data_train.Survived, data_train.Age)
plt.ylabel(u"年龄") # 设定纵坐标名称
plt.grid(b=True, which='major', axis='y')
plt.title(u"按年龄看获救分布 (1为获救)") plt.subplot2grid((2,3),(1,0), colspan=2)
data_train.Age[data_train.Pclass == 1].plot(kind='kde')
data_train.Age[data_train.Pclass == 2].plot(kind='kde')
data_train.Age[data_train.Pclass == 3].plot(kind='kde')
plt.xlabel(u"年龄")# plots an axis lable
plt.ylabel(u"密度")
plt.title(u"各等级的乘客年龄分布")
plt.legend((u'头等舱', u'2等舱',u'3等舱'),loc='best') # sets our legend for our graph. plt.subplot2grid((2,3),(1,2))
data_train.Embarked.value_counts().plot(kind='bar')
plt.title(u"各登船口岸上船人数")
plt.ylabel(u"人数")
plt.show()

matplotlib  user guide

Line Plot  plot().

多个子图

time  datatime 等时间包的使用

datatime https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431937554888869fb52b812243dda6103214cd61d0c2000

https://www.cnblogs.com/snow-backup/p/5063665.html

最新文章

  1. 读书笔记--SQL必知必会04--过滤数据
  2. hadoop如何处理长时间运行不完成的map/reduce 任务?
  3. 使用JDK开发Servlet程序
  4. codeforces 334A - Candy Bags
  5. HTML5와 CSS3 적용기
  6. Java中JSON的简单使用与前端解析
  7. Swift 基本语法2
  8. lightoj 1036 dp
  9. c++11 stl atomic_flag 样例
  10. android 当屏幕截图,你如何改变屏幕内容,他们俩bitmap将合并的图像被一起显示
  11. javaIO流实现读写txt文件
  12. 跟我学ASP.NET MVC之四:使用Razor
  13. js分析 有_道_翻_译 md5
  14. Java WebService 简单实例使用JDK
  15. ORACLE提交事务回滚
  16. Linux Rsyslog日志集中管理
  17. JVM 类加载器 (二)
  18. 存储过程和函数 PROCEDURE & FUNCTION
  19. Linux下卸载安装mysql
  20. PAT乙级1012

热门文章

  1. Android菜单代码
  2. 6-10 SVM支持向量机1
  3. c# 组件无法下断点
  4. 面试那点小事,你从未见过的spring boot面试集锦(附详细答案)
  5. 第九篇 .NET高级技术ref、out
  6. Access 中case when then else end不支持使用switch代替
  7. jvm 实战
  8. Python递归实现遍历目录
  9. ssh密钥的分发之一:ssh-copy-id
  10. scikit-learning教程(三)使用文本数据