找回密码
 立即注册
shuwq 该用户已被删除
发表于 7 天前
4670
大家好,最近小弟在用tensorflow-gpu训练深度神经网络,环境配置为win10+CUDA9.0+cudnn-9.0-windows10-x64-v7.1+tensorflow-gpu==1.10.0一开始跑GPU训练都正常,自从有一次我调大了batchsize,然后卡机,就开始跑不了了,但是训练还是能训练的,大概迭代个几百次后就报错了,甚至有时候卡机蓝屏,每次报错的原因都不一样,我也试过了重装系统,重装pycharm,重装CUDA,CUDNN,tensorflow-gpu,都还是这样的情况,训练一会就报错了,大概报错的原因有


Check failed: status == CUDNN_STATUS_SUCCESS (7 vs. 0)Failed to set cuDNN stream


error destroy CUDA event

T:\src\github\tensorflow\tensorflow\stream_executor\cuda\cuda_event.cc:48

Error polling for event status: failed to query event: CUDA_ERROR_MISALIGNED
等等
每次报错的原因都不一样,小弟找了几个星期的原因都找不到,同样的代码在其他电脑上都能跑,唯独我电脑现在不行,求求大神们帮小弟看看,不胜感激。
使用道具 举报 回复
发新帖
您需要登录后才可以回帖 登录 | 立即注册

zzczczxczxczx