- 博客(3)
- 收藏
- 关注
原创 pytorch升级到1.8.0后训练报错RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
pytorch升级到1.8.0后训练报错RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED@TOC之前训练环境pytorch v1.7.1+ cuda 10.2 训练一切正常。下载yolov5 代码后 执行了pip3 install -r requirements.txt 后,发现执行训练报错:RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED按网上的操作清空rm -rf ~.N
2021-03-17 14:19:12 926 1
原创 kudu tablet server出现异常退出(Too many open files)
某台tablet server 在停机一断时间后,再次启动,某些tablet server出现异常退出,查看日志报错:打开数据文件 报”Too many open files ” 错误。该错误明显打开的文件句柄数,超过系统设置的ulimit数。ulimit -a查看:open files (-n) 65536 已经为65536了,说明tablet s...
2018-10-15 11:15:36 2212 3
原创 kudu 服务器断电无法启动
kudu 服务器断电无法启动 kudu 服务器正在大量数据写入时, 服务器异常断或非法关闭会造成 Tablet Server 的 metadata文件数据不完整,再次启动tablet server会报如下错误: Check failed: _s.ok() Bad status: Corruption: Failed to load FS layout: Could not process re...
2018-10-15 10:41:10 2254
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人