pytorch基础

pytorch官方文档:https://pytorch.org/docs/master/nn.html#linear-layers

import torch
from torch import nn

1 tensor:张量,表示一个多维的矩阵。

 b.numpy()能将b转换为numpy数据类型,同时使用torch.from_num py()将numpy转换为tensor。若将a的类型转换成float,a.float().

b.numpy():将b转换成numpy数据类型
torch.from_num py():把numpy转换成tensor
如果需要更改tensor的数据类型,只需要在转换后的tensor后面加上你需要的类型,eg:将a转换成float,
只需a.float()
如果电脑支持GPU,可以将Tensor 放到GPU上
torch.cuda.is_available()判断一下是否支持GPU,
如果把tensor放到GPU上,只需a.cuda()就把tensor a 放到GPU上
if torch.cuda.is_available():
a_cuda = a.cuda()
print(a_cuda)

2  torch.autograd.Variable(变量):

Variable提供了自动求导的功能,在做运算的时候需要构造一个计算图谱,然后再里面进行前向传播和反向传播
Variable和Tensor本质上没有区别,不过Variable会被放入一个计算图中,然后进行前向传播,反向传播,自动求导
Variable是在torch.autograd.variable中,将一个tensor编程Variable,Variable(a),有三个重要的组成属性:data,grad,grad_fn。
data:取出Variable里面的tensor数值,
grad_fn:得到这个Variable的操作,比如通过加减还是乘除得到,
grad:Variable的反向传播梯度
例如:
x = Variable(torch.Tensor([1],requires_grad=True)
w = Variable(torch.Tensor([2],requires_grad=True)
b = Variable(torch.Tensor([3],requires_grad=True)
y = w*x +b
y.backward()自动求导
print(x.grad)x的梯度

3.

import torch
x = torch.rand(3)
"""
读取数据
torch.utils.data.DataLoader定义一个新的迭代器
dataiter = DataLoader(myDataset,batch_size = 32,shuffle = True,collate_fn = default_colllate)
collate_fn:如何取样本
读取图片:
ImageFolder:处理图片
dset = ImageFolder(root = 'root_path',transform = None,loader = default_loader)
root :根目录,这个目录下有几个文件夹,每个文件夹表示一个类别:transform和target_transform是图片增强
loader是图片读取的办法,因为我们读取的是图片的名字,然后通过loader将图片转换成我们需要的图片类型
进入神经网络。
"""
"""
所有的层结构和损失函数都来自于torch.nn,所有的模型构建都是从这个基类nn.Module继承的
"""
# class net_name(nn.Module):
# def __init__(self,other_arguments):
# super(net_name,self).__init__()
# self.conv1 = nn.Conv2d(in_channels,out_channels,kernel_size)
# def forward(self,x):
# x = self.conv1(x)
# return x
"""
所有的网络层都是由nn这个包得到的,eg,nn.Linear
定义好模型之后,通过nn这个包定义损失函数
criterion =nn.CrossEntropyLoss()
loss = criterion(output,target)
"""
""" 4. torch.optim(优化):
实现各种优化的包,
optimizer = torch.optim.SGD(model.parameters(),lr = 0.01,momentum = 0.9)
学习率是0.01,动量是0.9的随机梯度下降,在优化之前将梯度归零,optimizer.zeros(),通过loss.backward()反向传播,
自动求导得到每个参数的梯度,最后需要optimizer.step()就可以通过梯度做一步参数更新。
梯度:导数的多变量表达式,函数的梯度形成了一个向量场,同时也是一个方向,这个方向上导数最大,且等于梯度。
"""
5. 线性模型
一维线性回归:f(xi) = wxi+b
Loss = Σ(f(xi)-yi)2
例子:
一维线性回归
import numpy as np
import torch
from torch import nn
import matplotlib.pyplot as plt
# import torch.nn as nn
x_train = np.array([[3.3],[4.4],[5.5],[6.71],[6.93],[4.168],[9.779],[6.182],[7.59],[2.167],[7.042],[10.791],[5.313],[7.997],[3.1]],dtype = np.float32)
y_train = np.array([[1.7],[2.76],[2.09],[3.19],[1.694],[1.573],[3.366],[2.596],[2.53],[1.221],[2.827],[3.465],[1.65],[2.904],[1.3]],dtype = np.float32)
x_train = torch.from_numpy(x_train)
y_train = torch.from_numpy(y_train) class LinearRegression(nn.Module):
def __init__(self):
super(LinearRegression,self).__init__()
self.linear = nn.Linear(1,1)#输出都是一维
def forward(self, x):
out = self.linear(x)
return out
if torch.cuda.is_available():
model = LinearRegression().cuda()#如果支持GPU加速,可以通过model.cuda()将模型放到GPU上
else:
model = LinearRegression() criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(),lr = 1e-3) # 训练模型
num_epochs = 100
for epoch in range(num_epochs):
if torch.cuda.is_available():
inputs = torch.autograd.Variable(x_train).cuda()
target = torch.autograd.Variable(y_train).cuda()
else:
inputs = torch.autograd.Variable(x_train)#将数据变成Variable放入计算图
target = torch.autograd.Variable(y_train)
#前向传播
out = model(inputs) # 得到网络前向传播的结果
loss = criterion(out,target)# 得到损失函数
#backword
optimizer.zero_grad()#归零梯度,每次做反向传播之前都要归零梯度,不然梯度会累加在一起,造成结果不收敛
loss.backward()
optimizer.step()
if (epoch+1) % 20 == 0:#loss.data[0]:loss是一个Variable,通过loss.data可以取出一个Tensor,通过loss.data[0]得到一个int或者float类型的数据
# print(num_epochs)
print('epoch[{}/{}],loss:{:.6f}'.format(epoch+1,num_epochs,loss))
"""
#在训练完train样本后,生成模型model要用来测试样本,在model(test)之前,需要加上model.eval(),
否则的话,有输入数据,即使不训练,它也会改变权值。这是model中含有batch normalization层所带来的的性质。
"""
model.eval()
predict = model(torch.autograd.Variable(x_train))
predict = predict.data.numpy()
plt.plot(x_train.numpy(),y_train.numpy(),'ro',label = 'Original data')
plt.plot(x_train.numpy(),predict,label = 'Filtting Line')
plt.show()
print('finished')

 

最新文章

  1. js获取cookie
  2. windows下面安装Python和pip终极教程
  3. Github+hexo绑定域名
  4. Java 日志性能优化
  5. 关于web前端(知乎上收集)
  6. 第二周PSP
  7. C实现通用数据结构--单链表
  8. 浅谈Java的输入输出流(转)
  9. 向数据库中添加内容 manageStdInfo.aspx
  10. Oracle Quality --- Setup Collection Element and Collection Plan
  11. hibernate update部分更新
  12. C#中关键字ref与out的区别【转】
  13. python 导入库问题
  14. vim - 自动补齐
  15. Redis数据库云端最佳技术实践
  16. tensorflow-Inception-v3模型训练自己的数据代码示例
  17. Redis集群(单机多实例)
  18. [PHP] 数据结构-从尾到头打印链表PHP实现
  19. C++学习6-面向对象编程基础(运算符重载、类的派生与继承、命名空间)
  20. TCP连接异常断开检测(转)

热门文章

  1. 模拟退火算法SA原理及python、java、php、c++语言代码实现TSP旅行商问题,智能优化算法,随机寻优算法,全局最短路径
  2. Docker 安装mysql以及外部访问
  3. Jmeter参数化、检查点、集合点教程
  4. Python 简易web日志查看工具&可改装为命令行工具
  5. python爬虫(4)——scrapy框架
  6. super与this用法
  7. linux 使用indent格式化代码
  8. layer.js的一些常用的技巧
  9. Rust中的闭包
  10. FFMPEG+SDL实现视频播放器