使用Pandas加载数据
2024-09-05 14:57:50
1.dataframe对象简述:
dataframe为pandas中一种有行列索引的二维数据结构,可以看成在普通二维结构上加上行列id标记
示例为创建一个2X3的dataframe:
import sys
import pandas as pd
import numpy as np
data = pd.DataFrame([[1, 2, 3],[4, 5, 6]], columns=['y0','y1','y2'], index=['x0','x1'])
print ("data:\n",data) '''
data:
y0 y1 y2
x0 1 2 3
x1 4 5 6
'''
2.利用read函数读取数据到datafame:
pandas中的read函数可以从各种类型的文件中以及URL中读取数据到一个dataframe
示例为从一个txt文件中读取三个特征向量,表示长方体的长宽高:
import sys
import pandas as pd
import numpy as np
filepath = "D:\\Code\\PyCode"
filename = "in.txt"
column_names = ["length", "width", "high"]
#sep="..."规定了分隔符
data = pd.read_table(filepath +"\\"+ filename,sep=" ", names = column_names )
print (data,"\n","data.shape:",data.shape)
'''
length width high
0 10 10 100
1 15 11 110
2 22 12 120
data.shape: (3, 3)
'''
注意:读取文件到dataframe时,若是指定列的标记,即在read函数中加入names=...,则读取到的data列索引为names指定的id,若是没有这个参数,列索引为源文件的第一行数据
示例:
import sys
import pandas as pd
import numpy as np
filepath = "D:\\Code\\PyCode"
filename = "in.txt"
column_names = ["length", "width", "high"]
#sep="..."规定了分隔符
data = pd.read_table(filepath +"\\"+ filename,sep=",")
#data = pd.read_table(filepath +"\\"+ filename,sep=",", names = column_names )
print (data,"\n","data.shape:",data.shape)
'''
10 10.1 100
0 15 11 110
1 22 12 120
data.shape: (2, 3)
'''
3.对dataframe进行列切片:
对上面读取到的三行三列的data选取其第二列到第三列:
data2 = data[column_names[1:3]]
print (data2)
print (data2.shape)
'''
length width high
0 10 10 100
1 15 11 110
2 22 12 120
(3, 3)
width high
0 10 100
1 11 110
2 12 120
(3, 2)
'''
data3 = data2[:n]#选取data2的前n行
4.pandas中读取文件的函数(截图来自《利用python进行数据分析》):
最新文章
- hibernate学习(设计多对多 关系 映射)
- JQuery获取页面关闭事件
- Android进阶笔记03:Android应用中实现查看";附近的人";的功能
- Html5选择图片并及时预览图片
- Objective C内存管理之理解autorelease------面试题
- 从一道面试题谈linux下fork的运行机制
- angular cors跨域资源共享设置 和formdata设定
- keras &; tensorflow 列出可用GPU 和 切换CPU &; GPU
- Spring MVC 使用介绍(八)—— 类型转换
- 1192:放苹果(dp + 搜索)
- centos rpm包下载地址
- Android分组子级的不同视图布局之BUG奇遇记
- python中安装Tensorflow
- 【机器学习】粗糙集属性约简—Attribute Reduction
- [udemy]WebDevelopment_HTML5
- invokespecial与invokevirtual指令的区别
- Linux VXLAN
- 转载:VMWARE虚拟机无法访问的三种方法分析
- MySQL注射绕过技巧(二)
- caffe Python API 之InnerProduct
热门文章
- 解决:";UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position";错误
- 【IOS】异常捕获 拒绝闪退 让应用从容的崩溃 UncaughtExceptionHandler
- WPF 线段Line过长渲染出现的问题
- javascript中json对象与字符串互转及取值
- PyODPS DataFrame 处理笛卡尔积的几种方式
- @bzoj - 4524@ [Cqoi2016]伪光滑数
- SVN的使用与教程
- selenium webdriver学习(四)------------定位页面元素(转)
- oracle避免在索引列上使用NOT
- PHP中 spl_autoload_register() 函数用法