本节将使用torchvision包,它是服务于pytorch深度学习框架的,主要用来构建计算机视觉模型。

torchvision主要由以下几个部分构成:

  1. torchvision.datasets:一些加载数据的函数以及常用的数据集的接口
  2. torchvision.models: 包含常用的模型结构(含预训练模型),例如AlexNet,VGG,ResNet;
  3. torchvision.transforms:常用的图片变换,例如裁剪,旋转等;
  4. torchvision.utils: 其他的一些有用的方法
获取数据集

导入本节需要的包或者模块

import torch
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
import time
import sys
sys.path.append('..') # 为了导入上层目录的d2lzh_pytorch
import d2lzh_pytorch as d2l

通过调用torchvision的torchvision.datasets来下载这个数据集

可以通过train参数获取指定的训练集或者测试集、

测试集只用了评估模型,并不用来训练模型

同时指定了参数transform = transform.ToTensor()使所有数据转化为Tensor,如果不进行转化,则返回的是PIL照片。

transform.ToTensor()将尺寸为(H,W,C)且数据位于[0,255]的PIL图片或者数据类型为np.unit8的Numpy数组转化为(CxHxW)且数据类型为torch.float32且位于[0.0,1.0]的Tensor。

  • 如果用像素值(0,255)表示图片数据,一律将其类型设置为unit8,避免出问题
mnist_train= torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',download=True,train=True,transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',download=True,train=False,transform=transforms.ToTensor())
print(type(mnist_train))
print(len(mnist_train), len(mnist_test))
<class 'torchvision.datasets.mnist.FashionMNIST'>
60000 10000
feature,label = mnist_train[0]
print(feature.shape,label) # channel * height* width
torch.Size([1, 28, 28]) tensor(9)

feature对应的高和宽均为28像素的图像,由于我们使用了transforms.ToTensor(),所以每个像素的数值为[0,1]的32位浮点数。需要注意的是,feature的尺寸是(CxHxW)的,而不是(HxWxC)。第一维是通道数,因为数据集中是灰度图像,所以通道数为1,后面两维分别是图像的高和宽。

Fashion_MNIST中一共包括了10个类别,分别是t-shirt(T恤),trouser(裤子),pullover(套衫),dress(连衣裙),coat(外套),sandal(凉鞋),shirt(衬衫),sneaker(运动鞋),bag(包)和ankle boot(短靴)

import d2lzh_pytorch as d2l
def get_fashion_mnist_labels(labels):
text_labels = ['t-shirt','trouser','pullover','dress','coat','sandal',
'shirt','sneaker','bag','ankle boost'
]
return [text_labels[int(i)] for i in labels] def show_fashion_mnist(images,labels):
d2l.use_svg_display()
_,figs = plt.subplots(1,len(images),figsize=(12,12)) # 1行10列
for f ,img,lbl in zip(figs,images,labels):
f.imshow(img.view((28,28)).numpy())
f.set_title(lbl)
f.axes.get_xaxis().set_visible(False)
f.axes.get_yaxis().set_visible(False)
plt.show()
X,y = [],[]
for i in range(10):
X.append(mnist_train[i][0])
y.append(mnist_test[i][1])
show_fashion_mnist(X,get_fashion_mnist_labels(y))

读取小批量样本

我们将在训练集上训练模型,并将训练好的模型预测测试集上评估模型的表现。

可以用torch.utils.data.Dataloader来创建一个读取小批量样本的DataLoader实例。

在实际中,数据读取经常是训练的性能瓶颈,特别是当模型较为简单或者计算硬件性能较高时,pytorch的DataLoader中一个很方便的功能是允许使用多进程来加速数据读取。这里我们通过参数num_workers来设置进程数来加速读取数据

batch_size= 256

if sys.platform.startswith('win'):
num_worker=0 # 表示不用额外的进程来加速读取数据 else:
num_worker=4
train_iter = torch.utils.data.DataLoader(mnist_train,batch_size=batch_size,shuffle=True,num_workers=num_worker)
test_iter = torch.utils.data.DataLoader(mnist_test,batch_size=batch_size,shuffle=False,num_workers=num_worker)
start = time.time()
for X,y in train_iter:
continue
print('%.2f sec' % (time.time()-start))
1.28 sec
小结
  • Fashion_MNIST 是一个10类服饰的分类数据集,之后章节后使用它来验证不同算法的表现
  • 我们将高和宽分别是H和W像素的图像的形状记为HxW或(h,w)

最新文章

  1. matlab列优先与高维矩阵重构 及 CNN 逐层可视化 on Matlab
  2. Eclipse 启动时提示“发现了以元素&#39;d:skin&#39;开头的无效内容,此处不应含有子元素“
  3. JDBC常用接口详解
  4. C/C++学习之路----volatile
  5. Saving HDU
  6. 理解阻止浏览器默认事件和事件冒泡cancelBubble
  7. CSS中link与import的区别
  8. springmvc 对 jsonp 的支持
  9. 学习Tensorflow,反卷积
  10. python迭代器的原理及应用
  11. Jquery封装的Ajax
  12. MySql.Data.MySqlClient连接MySql
  13. MT【75】考察高斯函数的一道高考压轴题
  14. DLL中获取主程序句柄
  15. node.js实时编译,不需要重启
  16. jar包读取包内properties文件
  17. redis客户端hiredis
  18. Oracle序列和伪表
  19. rabbitmq集群方案
  20. C# RedisRateLimiter

热门文章

  1. Review: Basic Knowledge about WebForm
  2. .NET Core RabbitMQ探索(2)——RabbitMQ的Exchange
  3. Python基础17
  4. Docker 容器命令大全
  5. FCC-学习笔记 Spinal Tap Case
  6. EntityFrameworkCore(efcore)在与 MySQL 连接使用中的问题
  7. Android Studio 3.5+ 使用androidx的recyclerView
  8. flink Transitive Closure算法,实现寻找新的可达路径
  9. Java内存模型。
  10. python安装thrift-sasl提示缺少sasl.h文件