最近需要使用 nvprof 此时cuda 程序运行的性能,下面对使用过程进行简要记录,进行备忘:

  • 常用使用命令:nvprof --unified-memory-profiling off python run.py (这是因为某块内存被设置了不允许分析,导致)参考:https://docs.nvidia.com/cuda/profiler-users-guide/index.html#unified-memory-profiling
  • nvprof --unified-memory-profiling off python run.py (2>run.txt 1>out.txt)
  • nvprof --unified-memory-profiling off --print-gpu-trace python run.py
  • nvprof --unified-memory-profiling off --print-gpu-trace -o prof.nvvp python run.py
  • nvvp prof.nvvp (使用 x11 forwarding)
  • ./run.sh 2>runsh_out.txt

Non-Visual Profiler 和 Visual Profiler  的使用:

# nvprof
nvprof python train_mnist.py
nvprof --print-gpu-trace python train_mnist.py #nvvp (可以使用x11 forwarding 使用,当然更适合在本机使用)
nvprof -o prof.nvvp python train_mnist.py (在GPU集群上生成 .nvvp文件)
scp your_gpu_machine:/path/to/prof.nvvp . (scp 拷贝文件到本地)
nvvp prof.nvvp (在本地机器上进行可视化分析)

参考链接:

https://blog.csdn.net/yinhuier/article/details/80551268 (简单使用教程)

https://docs.nvidia.com/cuda/profiler-users-guide/index.html (nvidia 官网教程)

https://gist.github.com/sonots/5abc0bccec2010ac69ff74788b265086 (一个日本工程师写的文档,不错,本文大多命令摘自此文档,文档中有较为详细的实例截图,可以参考)

https://blog.csdn.net/haoqimao_hard/article/details/80557740 (CSDN 上较为简洁的博客,可以参考使用)

https://indico-jsc.fz-juelich.de/event/32/material/0/5.pdf (德国一个简单介绍的资料)

保持更新,更多内容请关注 cnblogs.com/xuyaowen; 如果对您有帮助,还请点击推荐或关注~!

最新文章

  1. 解决关键SSL安全问题和漏洞
  2. JavaWeb 学习001-登录页面-Servlet
  3. css expression
  4. python 简明教程笔记
  5. Map的迭代操作
  6. 第01讲- Android背景知识
  7. c/c++重定向输入输出
  8. PTA9
  9. DLC 基本定律与规则
  10. Jenkins入门之导航操作
  11. 自适应PC端网页制作使用REM
  12. C# 不使用递归遍历目录树中的文件和文件夹
  13. ab测试工具
  14. Win32汇编学习(11):对话框(2)
  15. Windows上传代码到github操作指导
  16. Docker容器的生命周期管理
  17. 第七章 二叉搜索树(c)平衡与等价
  18. linux每天一小步---find命令详解
  19. Safari 不能播放Video ,Chrome等可以 问题解决。
  20. Android Studio 动态调试 apk 反编译出的 smali 代码

热门文章

  1. MariaDB主从复制和读写分离
  2. C# 扩展类与分布类
  3. Jupyter修改设置
  4. python3数据分析,安装学习
  5. Sqoop 抽数报错: java.io.FileNotFoundException: File does not exist
  6. 使用 ASP.NET Core MVC 创建 Web API——响应数据的内容协商(七)
  7. Java连接MySQL数据库及简单的增删查改操作
  8. .Net WebApi 使用Session
  9. Zeus:1 Vulnhub Walkthrough
  10. iOS技术博客