linux下管理显卡,Linux中显卡用户管理相关应用及命令行
目的:管理相應顯卡環境,匯總指令方便運用與查閱。
相關文檔:常用Linux指令匯總(顯卡|讀寫|編譯|進程|用戶|掛載)
目錄
一、顯卡相關
1.1? nvidia-smi
動態顯示顯卡占用
1.2 運行程序時指定顯卡
1.3 端口號與PID號查詢
二. 用戶與進程相關
2.1 端口號與PID號查詢
2.2 通過PID查詢用戶名
2.3 查詢PID的命令行
2.4 查詢當前用戶所有進程
2.5 查看相關命令行
三、清空顯存
四、用戶及權限管理
4.1 查看已有用戶
4.2 加入新用戶
一、顯卡相關
1.1? nvidia-smi
http://hui.sohu.com/infonews/article/6337322514200395777
指令中間連著的不加空格。
第一欄的Fan:風扇轉速,從0到100%之間變動,這個速度是計算機期望的風扇轉速不是實際轉速。有的設備不會返回轉速,因為它不依賴風扇冷卻。
第二欄的Temp:是溫度。
第三欄的Perf:是性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能。
第四欄下方的Pwr:是能耗,上方的Persistence-M:是持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這里顯示的是off的狀態。
第五欄的Bus-Id是涉及GPU總線的東西,domain:bus:device.function
第六欄的Disp.A是Display Active,表示GPU的顯示是否初始化。
第五第六欄下方的Memory Usage是顯存使用率。
第七欄是浮動的GPU利用率。
第八欄上方是關于ECC的東西。
第八欄下方Compute M是計算模式。
動態顯示顯卡占用
watch -n 3 nvidia-smi
這個指令為動態顯示顯卡占用,-n后跟的參數為秒,即三秒更新一次。
1.2 運行程序時指定顯卡
https://www.cnblogs.com/darkknightzh/p/6591923.html
CUDA_VISIBLE_DEVICES=1 python my_script.py
1.3 端口號與PID號查詢
https://www.cnblogs.com/understander/p/5546458.html
由端口號查PID號? sudo netstat -antup
由PID號查端口號 sudo netstat -antup|grep PID
由進程名查詢PID號sudo ps -ef|grep 進程名
二. 用戶與進程相關
2.1 端口號與PID號查詢
https://www.cnblogs.com/understander/p/5546458.html
由端口號查PID號? sudo netstat -antup
由PID號查端口號 sudo netstat -antup|grep PID
由進程名查詢PID號sudo ps -ef|grep 進程名
netstat -an | grep 3306?? //查看所有3306端口使用情況
2.2 通過PID查詢用戶名
lsof -p [PID]
例如:
lsof -p 15223
lsof: WARNING: can't stat() tracefs file system /sys/kernel/debug/tracing
Output information may be incomplete.
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
darknet 15223 chengx cwd unknown /proc/15223/cwd (readlink: Permission denied)
darknet 15223 chengx rtd unknown /proc/15223/root (readlink: Permission denied)
darknet 15223 chengx txt unknown /proc/15223/exe (readlink: Permission denied)
darknet 15223 chengx NOFD /proc/15223/fd (opendir: Permission denied)
2.3 查詢PID的命令行
ps [PID]
$ps 54083
PID TTY STAT TIME COMMAND
54083 pts/12 Rl+ 449:08 python train-new.py
2.4 查詢當前用戶所有進程
ps -u
ps -u
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
xxr 37561 0.1 0.0 25304 6192 pts/0 Ss 21:32 0:00 -bash
xxr 39243 0.0 0.0 39100 3352 pts/0 R+ 21:33 0:00 ps -u
2.5 查看相關命令行
(torch31py36) yxxxxxxxxx@yxxxxxxxxxxx:~/share$ ps aux|grep python
xx+ 755 26.6 3.4 92192108 9059784 ? Rl 16:39 0:14 python -u train.py
xx+ 756 25.8 3.4 92185052 9052848 ? Sl 16:39 0:14 python -u train.py
xx+ 757 26.0 3.4 92187404 9055216 ? Sl 16:39 0:14 python -u train.py
xx+ 758 25.9 3.4 92180348 9048160 ? Sl 16:39 0:14 python -u train.py
xx+ 1741 0.0 0.0 15956 1020 pts/8 S+ 16:40 0:00 grep --color=auto python
xx+ 6948 184 3.9 92336040 10445620 ? Rl 5月24 8035:59 python -u train.py
xxx+ 11400 0.0 0.0 27912 9116 pts/9 S+ 1月18 0:00 python
三、清空顯存
kill掉程序之后仍然占用著顯存,需要手動清理顯存。輸入下面命令行
sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh
sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh
四、用戶及權限管理
https://www.cnblogs.com/SH-xuliang/p/8422753.html
4.1 查看已有用戶
然后輸入命令行cat /etc/passwd,直接按下回車鍵即可
4.2 加入新用戶
adduser \your_user_name
后面根據操作提示輸入密碼等即可
五、top查看CPU情況
https://www.cnblogs.com/jiqing9006/p/9270504.html
VIRT: 虛擬內存,RES:常駐內存resident memory usage,SHR:共享內存
5.1 按占用排序
輸入top后,輸入相應指令進行排序。
按CPU占用率排序:輸入大寫P
按常駐內存占用率排序:輸入大寫M
5.2 顯示細節
顯示完整命令行:c
更改刷新頻率,d+數字+enter
5.3 退出
q
總結
以上是生活随笔為你收集整理的linux下管理显卡,Linux中显卡用户管理相关应用及命令行的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何找出单链表中倒数第K个元素
- 下一篇: 红旗linux 桌面版 6.0 精简版