ubuntu 监视显卡使用情况
在使用GPU做計算,比如跑 Deep Learning代碼的時候,我們可能希望能夠實時檢測顯存的使用情況,但是Linux一般不會自帶監視現存的工具。Nvidia自帶了一個 nvidia-smi的命令行工具,會顯示顯存使用情況,但我們總不能每 10s 中就輸入一次這個命令。 這時候就需要用到 watch命令了。
watch 命令簡介
watch是做什么的?看一下系統怎么說
$ whatis watch
watch(1)??????? - execute a program periodically, showing output fullscreen
功能很明白,周期性執行某一命令,并將輸出全屏顯示
watch的基本用法是
watch [options]? command
最常用的參數是 -n, 后面指定是每多少秒來執行一次命令。
監視顯存
我們設置為每 10s 顯示一次顯存的情況
watch -n 10 nvidia-smi
結果入下圖所示
還是很清晰的
讓Linux講笑話,講唐詩?
小軟件 fortune 每次執行都會隨機說一句諺語、名言、電影臺詞等,當然都是英文的。
同樣的, fortune-zh 每次執行都會顯示一首唐詩。
有空閑時間的時候可以讓Linux講唐詩。
watch -n 30 fortune-zh
Ubuntu 15.04安裝Nvidia Quadro系列顯卡驅動:http://www.linuxdiyf.com/linux/12266.html
Ubuntu14.04 Intel+NVIDIA雙顯卡解決方案:http://www.linuxdiyf.com/linux/13529.html
Ubuntu Unity下可顯示ATI顯卡溫度、頻率的Conky配置:http://www.linuxdiyf.com/linux/9618.html
如何在Windows中通過Cygwin來使用Linux命令行:http://www.linuxdiyf.com/linux/8311.html
5個有趣的Linux命令行技巧:http://www.linuxdiyf.com/linux/12286.html
nvidia-smi 命令
nvidia-smi命令顯示的GPU各個內容的含義如下:
這是服務器上特斯拉K80的信息。?
上面的表格中:?
第一欄的Fan:N/A是風扇轉速,從0到100%之間變動。有的設備不會返回轉速,因為它不依賴風扇冷卻而是通過其他外設保持低溫。?
第二欄的Temp:是溫度,單位攝氏度。?
第三欄的Perf:是性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能。?
第四欄下方的Pwr:是能耗,上方的Persistence-M:是持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這里顯示的是off的狀態。?
第五欄的Bus-Id是涉及GPU總線的東西,domain:bus:device.function?
第六欄的Disp.A是Display Active,表示GPU的顯示是否初始化。?
第五第六欄下方的Memory Usage是顯存使用率。?
第七欄是浮動的GPU利用率。?
第八欄上方是關于ECC的東西。?
第八欄下方Compute M是計算模式。?
下面一張表示每個進程占用的顯存使用率。
顯存占用和GPU占用是兩個不一樣的東西,顯卡是由GPU和顯存等組成的,顯存和GPU的關系有點類似于內存和CPU的關系。
總結
以上是生活随笔為你收集整理的ubuntu 监视显卡使用情况的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Aspen HTFS+ 2006 (化工
- 下一篇: 查看ubuntu服务器的配置(cpu+显