1.dataframe对象简述:

dataframe为pandas中一种有行列索引的二维数据结构,可以看成在普通二维结构上加上行列id标记

示例为创建一个2X3的dataframe:

 import sys
import pandas as pd
import numpy as np
data = pd.DataFrame([[1, 2, 3],[4, 5, 6]], columns=['y0','y1','y2'], index=['x0','x1'])
print ("data:\n",data) '''
data:
y0 y1 y2
x0 1 2 3
x1 4 5 6
'''

2.利用read函数读取数据到datafame:

pandas中的read函数可以从各种类型的文件中以及URL中读取数据到一个dataframe

示例为从一个txt文件中读取三个特征向量,表示长方体的长宽高:

 import sys
import pandas as pd
import numpy as np
filepath = "D:\\Code\\PyCode"
filename = "in.txt"
column_names = ["length", "width", "high"]
#sep="..."规定了分隔符
data = pd.read_table(filepath +"\\"+ filename,sep=" ", names = column_names )
print (data,"\n","data.shape:",data.shape)
'''
length width high
0 10 10 100
1 15 11 110
2 22 12 120
data.shape: (3, 3)
'''

注意:读取文件到dataframe时,若是指定列的标记,即在read函数中加入names=...,则读取到的data列索引为names指定的id,若是没有这个参数,列索引为源文件的第一行数据

示例:

 import sys
import pandas as pd
import numpy as np
filepath = "D:\\Code\\PyCode"
filename = "in.txt"
column_names = ["length", "width", "high"]
#sep="..."规定了分隔符
data = pd.read_table(filepath +"\\"+ filename,sep=",")
#data = pd.read_table(filepath +"\\"+ filename,sep=",", names = column_names )
print (data,"\n","data.shape:",data.shape)
'''
10 10.1 100
0 15 11 110
1 22 12 120
data.shape: (2, 3)
'''

3.对dataframe进行列切片:

对上面读取到的三行三列的data选取其第二列到第三列:

 data2 = data[column_names[1:3]]
print (data2)
print (data2.shape)
'''
length width high
0 10 10 100
1 15 11 110
2 22 12 120
(3, 3)
width high
0 10 100
1 11 110
2 12 120
(3, 2)
'''
data3 = data2[:n]#选取data2的前n行

4.pandas中读取文件的函数(截图来自《利用python进行数据分析》):

最新文章

  1. hibernate学习(设计多对多 关系 映射)
  2. JQuery获取页面关闭事件
  3. Android进阶笔记03:Android应用中实现查看"附近的人"的功能
  4. Html5选择图片并及时预览图片
  5. Objective C内存管理之理解autorelease------面试题
  6. 从一道面试题谈linux下fork的运行机制
  7. angular cors跨域资源共享设置 和formdata设定
  8. keras & tensorflow 列出可用GPU 和 切换CPU & GPU
  9. Spring MVC 使用介绍(八)—— 类型转换
  10. 1192:放苹果(dp + 搜索)
  11. centos rpm包下载地址
  12. Android分组子级的不同视图布局之BUG奇遇记
  13. python中安装Tensorflow
  14. 【机器学习】粗糙集属性约简—Attribute Reduction
  15. [udemy]WebDevelopment_HTML5
  16. invokespecial与invokevirtual指令的区别
  17. Linux VXLAN
  18. 转载:VMWARE虚拟机无法访问的三种方法分析
  19. MySQL注射绕过技巧(二)
  20. caffe Python API 之InnerProduct

热门文章

  1. 解决:"UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position"错误
  2. 【IOS】异常捕获 拒绝闪退 让应用从容的崩溃 UncaughtExceptionHandler
  3. WPF 线段Line过长渲染出现的问题
  4. javascript中json对象与字符串互转及取值
  5. PyODPS DataFrame 处理笛卡尔积的几种方式
  6. @bzoj - 4524@ [Cqoi2016]伪光滑数
  7. SVN的使用与教程
  8. selenium webdriver学习(四)------------定位页面元素(转)
  9. oracle避免在索引列上使用NOT
  10. PHP中 spl_autoload_register() 函数用法