SRCNN 卷积神经网络
2024-10-07 06:52:23
2019-05-19
从GitHub下载了代码(这里)
代码量虽然不多,但是第一次学,花了时间还是挺多的。根据代码有跑出结果(基本没有改),但是对于数据集的处理还是看的很懵逼,主要是作者的实现都是用类封装,然后调用函数实现,而且每一个代码块没有测试,所以很多代码不知道什么意思,所以,我把能够拆分的进行了拆分,用jupyter重新实现下
一、数据集的理解
在加载成 dataloader 之前应先做预处理
1.对于训练集不是利用RGB训练的,而是使用YCbCr的 Y 通道
2.将训练集图像利用torchvision.transforms 里的 Resize 缩小到 128*128的大小,此时图像会变模糊
(论文中用双三次插值,所以我一直在代码中找这个,没想到用了Resize)
训练图:
Compose(
CenterCrop(size=(256, 256))
Resize(size=128, interpolation=PIL.Image.BILINEAR)
ToTensor()
)
标签:
Compose(
CenterCrop(size=(256, 256))
ToTensor()
)
3.构建dataloader()
4.前向传播
nn.Conv2d(in_channels=num_channels, out_channels=base_filter, kernel_size=9, stride=1, padding=4, bias=True),
nn.ReLU(inplace=True),
nn.Conv2d(in_channels=base_filter, out_channels=base_filter // 2, kernel_size=1, bias=True),
nn.ReLU(inplace=True),
nn.Conv2d(in_channels=base_filter // 2, out_channels=num_channels * (upscale_factor ** 2), kernel_size=5, stride=1, padding=2, bias=True),
nn.PixelShuffle(upscale_factor)
5.利用(1,1,256,256)的输出和标签做了loss
6.经过20代迭代
===> Epoch 20 starts:
200/200 [================================================================================>] Step: 151ms | Tot: 29s948ms | Loss: 0.0034
Average Loss: 0.0034
100/100 [================================================================================>] Step: 92ms | Tot: 8s353ms | PSNR: 25.9508
Average PSNR: 25.9508 dB
最新文章
- TCP通信
- hibernate 中的 lazy=”proxy” 和 lazy=”no-proxy” 的区别
- D5转Xe点滴
- 使用Ajax.BeginForm 中需要 上传文件 但 Request.files获取不到
- IP访问SQL数据库设置
- 什么是FastCGI?
- win8 远程桌面 你得凭证不工作
- java HashMap中出现反复的key, 求解释
- leveldb性能分析
- 现代3D图形编程学习-你好,三角形(译)
- cocoapods安装及使用其中 添加新源: gem sources -a https://ruby.taobao.org/
- bzoj 3473 字符串 - 后缀数组 - 树状数组
- cpanm Plack相关
- 【Java每日一题】20170216
- 【代码审计】XYHCMS V3.5任意文件下载漏洞分析
- pycharm模板
- Postman 常用测试结果验证及使用技巧
- JAVA面试相关
- 通过Spring Session实现新一代的Session管理
- unity + win8.1 apps 小游戏demo