linux下显存异常处理:nvidia-smi和gpustat监控gpu

linux下查看内存和显存的使用情况

最常使用的是

1、nvidia-smi命令

nvidia-smi

图片[1]-linux下显存异常处理:nvidia-smi和gpustat监控gpu-趣考网

这个命令便可以显示出系统的gpu占用情况

如果想要查看是哪个用户占用的gpu,可以使用下面命令

ps u PID

显示如下:

图片[2]-linux下显存异常处理:nvidia-smi和gpustat监控gpu-趣考网

如果想停掉哪个程序,则可以直接使用kill命令

kill PID

2、有时明明进程中没有显示占用gpu,但是却发现显存占用上是满的,这时有可能是之前跑的程序没有正常结束,没有成功释放显存,需要显示出之前的占用记录,再将需要kill掉的进程kill掉,释放显存,这里有几种方法

第一个命令:

fuser -v /dev/nvidia*

图片[3]-linux下显存异常处理:nvidia-smi和gpustat监控gpu-趣考网

第二个命令:gpustat

gpustat是基于nvidia-smi的监控GPU的功能

安装:

pip install gpustat

使用:

图片[4]-linux下显存异常处理:nvidia-smi和gpustat监控gpu-趣考网

每秒自动刷新显示GPU状态

watch -n1 --color gpustat

图片[5]-linux下显存异常处理:nvidia-smi和gpustat监控gpu-趣考网

查看后使用CTRL+C退出全屏.

第三个命令:

ps aux|grep usr_name|grep python
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享