Linux操作系统监视NVIDIA的GPU使用情况
生活随笔
收集整理的這篇文章主要介紹了
Linux操作系统监视NVIDIA的GPU使用情况
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對于GPU相關參數介紹
- 使用命令周期性查看GPU運行情況
- 最常用的參數是 -n, 后面指定是每多少秒來執行一次命令。監視顯存:設置為每 1s 顯示一次顯存的情況:
- 使用命令ctrl+z退出
參數介紹
- Fan:顯示風扇轉速,數值在0到100%之間,是計算機的期望轉速,如果計算機不是通過風扇冷卻或者風扇壞了,顯示出來就是N/A;實際情況下如果風扇堵轉,可能打不到顯示的轉速。有的設備不會返回轉速,因為它不依賴風扇冷卻而是通過其他外設保持低溫(比如將服務器放在空調房間里)。
- Temp:顯卡內部的溫度,單位是攝氏度;
- Perf:表征性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能;
- Persistence-M:是持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這里顯示的是off的狀態。
- Pwr:能耗表示;
- Bus-Id:涉及GPU總線的相關信息;
- Disp.A:是Display Active的意思,表示GPU的顯示是否初始化;
- Memory Usage:顯存的使用率;
- Volatile GPU-Util:浮動的GPU利用率;
- Compute M:計算模式;
- 參考鏈接
Intel
安裝intel-gpu-tools工具
yum install intel-gpu-tools //安裝完畢后, 系統中會多種三個gpu工具: intel_gpu_abrt intel_gpu_time intel_gpu_top,其中,常用的是intel_gpu_top和intel_gpu_time。指定GPU、CPU運行
- 在多GPU系統里使用單一GPU。為了獲取?operations 和 Tensor 被指派到哪個設備上運行, 用?log_device_placement?新建一個?session, 并設置為?True
- tensorflow
- kreas
- 參考命令
總結
以上是生活随笔為你收集整理的Linux操作系统监视NVIDIA的GPU使用情况的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 解决Dr.com上不了网的问题
- 下一篇: Linux strtol将十六进制转化为