torch.backend.cudnn.benchmark
2024-10-01 05:09:51
大部分情况下,设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题。
一般来讲,应该遵循以下准则:
- 如果网络的输入数据维度或类型上变化不大,设置 torch.backends.cudnn.benchmark = true 可以增加运行效率;
- 如果网络的输入数据在每次 iteration 都变化的话,会导致 cnDNN 每次都会去寻找一遍最优配置,这样反而会降低运行效率。
最新文章
- img.width一直是0的问题--记录(二)
- java写入和写出EXCEL(含源代码)
- ❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️html,js随笔。❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️
- IOS表情存入MYSQL数据库失败
- java Clone使用方法详解
- JAVA6开发WebService (二)——JAX-WS例子
- 多版本Python管理及Python连接MySQL
- 【转】Linux下打包压缩war和解压war包
- apache服务器配置Net的实践
- 六、CCLayer
- oracle连接数据
- vagrant在windows下的使用
- opengl微开发之1-从零開始
- 15.找出如下数组中最大的元素和最小的元素, a[][]={{3,2,6},{6,8,2,10},{5},{12,3,23}}
- Ubuntu 16.06 安装拼音输入法 设置双拼
- Linux sed 和 awk的用法
- UI设计篇·入门篇·绘制简单自定义矩形图/设置按钮按下弹起颜色变化/设置图形旋转
- CentOS7时间设置问题
- python自动化开发-[第十五天]-jquery
- elasticsearch6.0.0源码导入到idea总结