用户
 找回密码
 立即注册
发表于 2021-4-7 12:46:56
99936
报错内容:c_api.TF_GetCode(self.status.status))tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.         [[{{node model_1/conv1/convolution}}]]         [[{{node model_1/decoded_predictions/loop_over_batch/TensorArrayStack/TensorArrayGatherV3}}]]
cw1.png
使用道具 举报 回复
发表于 2021-4-7 13:21:57
抱歉,我实在看不出错误,能把这个jupyter notebook整个发出来吗?
使用道具 举报 回复 支持 反对
发表于 2021-4-7 13:59:35
本帖最后由 myf636466 于 2021-4-7 14:12 编辑

网上说是显存不够,我显卡是6G的显存,我的batch-size是8,是不是太大了?我现在把batch-size从8改为4,重新开始训练

ssd.ipynp.zip

9.82 KB, 下载次数: 1

ssd_retrain_resnet18_kitti.zip

1.06 KB, 下载次数: 1

使用道具 举报 回复 支持 反对
发表于 2021-4-7 14:08:39
nvadmin 发表于 2021-4-7 13:21
抱歉,我实在看不出错误,能把这个jupyter notebook整个发出来吗?

我把文件放在另外一个帖子里了,我觉得可能是我batch_size太大了,麻烦老师帮我看一下
使用道具 举报 回复 支持 反对
发表于 2021-4-7 16:09:22
我打开你这个jupyter notebook之后,那个评估的信息已经没了~~~,先试一下吧,如果后面还出现这个错误,麻烦把整个jupyter notebook保存,再看一下~
使用道具 举报 回复 支持 反对
发表于 2021-4-7 16:11:07
而且,你这怎么给我的事retrain的定义文件~~,跟你测试用的不是一个呀~
使用道具 举报 回复 支持 反对
发表于 2021-4-7 18:54:08
本帖最后由 myf636466 于 2021-4-7 18:56 编辑
nvadmin 发表于 2021-4-7 16:09
我打开你这个jupyter notebook之后,那个评估的信息已经没了~~~,先试一下吧,如果后面还出现这个错误,麻 ...

我修改后,重新训练10次,然后在评估模型那里还是报错。这是我整个文件,我把训练的的权重文件删除了,他大了会传不上来

ssd.zip

115.31 KB, 下载次数: 0

使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册