RuntimeError: CUDA error: device-side assert triggered
2024-09-08 17:15:11
调试diffusion模型时在loss处报错,报错位置:
`acc_train_loss += loss.item()`
RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
在训练的损失函数位置加了断点,进行调试,发现了 unable to get repr for <class ‘torch.Tensor‘>
的错误信息
参考https://discuss.pytorch.org/t/unable-to-get-repr-for-class-torch-tensor/115627/3,使用cpu运行,报错
out = a.gather(-1, t) RuntimeError: index -1 is out of bounds for dimension 0 with size 10
确实是越界问题,在采样t-1时的样本时,t=0发生越界
修改:添加t = t.clamp_min(0)
,去除负值
最新文章
- SwiftLint——Swift代码检查及自动格式化工具
- 加载ComboBox控件
- Sharepoint学习笔记—习题系列--70-573习题解析 -(Q51-Q53)
- Xenomai
- RedHat Linux下利用sersync进行实时同步数据
- Storm集群安装详解
- 一种基于C51单片机的非抢占式的操作系统架构
- jQuery的主要用法
- 【翻译】MVC Music Store 教程-概述(一)
- jquery.validate.js 无法验证隐藏域
- mac pycharm快捷键整理
- etcd集群部署
- 学生选课系统 c语言
- Express实例代码分析1——简单的用户验证登录文件
- 微信小程序-form表单-获取用户输入文本框的值
- C#发布和调试WebService
- spring jwt springboot RESTful API认证方式
- APP接口调用流程
- 设计模式---单一职责模式之装饰模式(Decorator)
- Flume 1.5.0简单部署试用
热门文章
- 什么是RPC? (全面了解)
- [OpenCV实战]16 使用OpenCV实现多目标跟踪
- python之路48 django 视图层、模板层
- [Untiy]贪吃蛇大作战(五)——游戏主界面
- 【Basic Knowledge】Self-Attention Generative Adversarial Networks
- nodejs 升级后, vue+webpack 项目 node-sass 报错的解决方法
- 记一次使用gdb诊断gc问题全过程
- avalonia实现自定义小弹窗
- 完整工作流整合方案,自定义配置,Java+Vue+Activiti@附配套文档
- SQLSERVER 的 truncate 和 delete 有区别吗?