Linux服务器常用命令 - 记录(Anaconda/Matlab/VNC/Python)
前言
記錄自己常用的指令
VNC
Host XXX HostName xxx.xx.xx.xx (IP 地址) LocalForward 59xx(本地編號) 127.0.0.1:59xx(端口號) User xxxx vncserver :99 vncserver -localhost -geometry 1920x1080 :99 vncserver -kill :99查看當前狀態
當前用戶占用的端口號 vncserver -list所有用戶的端口號 ps -ef | grep vnc初次運行需要創建密碼
使用TightVNC Viewer 或者 RealVNC 進行遠程連接
localhost:03 (03是自己給不同服務器定義的編號 = 127.0.0.1:59xx)
查看當前運行的matlab進程(MATLAB 崩潰后沒有釋放顯存?)
Python一樣 Pytorch訓練中途意外退出,顯存沒有被釋放
共享粘貼板
vncconfig -nowin&GPU
查看GPU的利用
nvidia-smi Mon Aug 15 15:18:31 2022 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 510.73.08 Driver Version: 510.73.08 CUDA Version: 11.6 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 NVIDIA RTX A6000 On | 00000000:01:00.0 Off | Off | | 30% 37C P8 29W / 300W | 5MiB / 49140MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 1 NVIDIA RTX A6000 On | 00000000:25:00.0 Off | Off | | 30% 38C P8 25W / 300W | 111MiB / 49140MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 2 NVIDIA RTX A6000 On | 00000000:41:00.0 Off | Off | | 30% 34C P8 24W / 300W | 5MiB / 49140MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 3 NVIDIA RTX A6000 On | 00000000:81:00.0 Off | Off | | 30% 35C P8 19W / 300W | 5MiB / 49140MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 4 NVIDIA RTX A6000 On | 00000000:A1:00.0 Off | Off | | 30% 34C P8 24W / 300W | 5MiB / 49140MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ | 5 NVIDIA RTX A6000 On | 00000000:C1:00.0 Off | Off | | 30% 34C P8 26W / 300W | 5MiB / 49140MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | 0 N/A N/A 2968 G /usr/lib/xorg/Xorg 4MiB | | 1 N/A N/A 2968 G /usr/lib/xorg/Xorg 64MiB | | 1 N/A N/A 3028 G /usr/bin/sddm-greeter 44MiB | | 2 N/A N/A 2968 G /usr/lib/xorg/Xorg 4MiB | | 3 N/A N/A 2968 G /usr/lib/xorg/Xorg 4MiB | | 4 N/A N/A 2968 G /usr/lib/xorg/Xorg 4MiB | | 5 N/A N/A 2968 G /usr/lib/xorg/Xorg 4MiB | +-----------------------------------------------------------------------------+conda
安裝package
https://docs.anaconda.com/anaconda/install/linux/
安裝完成后,重啟終端。
conda activate base pip install XXXX卸載conda
rm -rf anacondaconda常用命令
創建不同的運行環境。
創建/激活/刪除
conda create -n your_env python=3.X
conda activate your_env
conda install spyder
spyder
conda deactivate
1)查看安裝了哪些包
conda list2)查看當前存在哪些虛擬環境
conda env list conda info -e3)檢查更新當前conda
conda update conda3.Python創建虛擬環境
conda create -n your_env_name python=x.x anaconda命令創建python版本為x.x,名字為your_env_name的虛擬環境。your_env_name文件可以在Anaconda安裝目錄envs文件下找到。4.激活或者切換虛擬環境
打開命令行,輸入python --version檢查當前 python 版本。
Linux: source activate your_env_nam Windows: activate your_env_name5.對虛擬環境中安裝額外的包
conda install -n your_env_name [package]6.關閉虛擬環境(即從當前環境退出返回使用PATH環境中的默認python版本)
deactivate env_name 或者`activate root`切回root環境 Linux下:source deactivate7.刪除虛擬環境
conda remove -n your_env_name --all8.刪除環境鐘的某個包
conda remove --name $your_env_name $package_namePyTorch
2021.08.18
使用GPU (RTX A6000) 訓練:
/home/qzhang/anaconda3/lib/python3.8/site-packages/torch/cuda/init.py:106: UserWarning:
RTX A6000 with CUDA capability sm_86 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37.
If you want to use the RTX A6000 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/
warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name))
之前出現過,使用
vit_model.load_state_dict(torch.load(model_load_path))
時,Python崩潰的情況。應該是因為cuda的版本問題。
找打了如下文章:
nvidia顯卡和cuda版本關系
嘗試:更新cuda
19.08.2021
實際:CUDA根本不需要更新,因為已經是最新的版本了。然而問題就處在這里:PyTorch不支持最新版的CUDA。 這一點可以在安裝Pytorch的界面看到。選擇不同的計算平臺時,安裝的cudatoolkit版本不同。
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch
NOTE: ‘conda-forge’ channel is required for cudatoolkit 11.1
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c conda-forge
總的來說,就是要根據顯卡的算力安裝合適的cuda版本,然后根據cuda的版本來決定需要的顯卡驅動。 不過,cuda和顯卡驅動基本都是向下兼容的,意味著安裝最新的cuda和顯卡驅動,基本上可以支持以前的幾乎所有顯卡。但是的但是! pytorch卻不一定支持最新版本的cuda。 比如我就遇到了,使用GPU時,python卡死的狀態。
*(這里參考了pytorch、顯卡、顯卡驅動、cuda版本是如何對應的)
因為實在服務器上跑程序,所以還得聯系同事,是否可以降級cuda的版本 T_T
試一試,永遠是最有可能的解決辦法。
看到網上有的人說,Pytorch 1.7可以支持cuda11.2, 于是自己也抱著試一試的態度試了一試,結果沒想到竟然真的解決了。
受用新不用舊思想的影響,我并沒有一開始就回滾到舊版本,而是選擇了嘗試在最新的版本上直接升級cudatoolkit. 舊的版本是10.2,升級后到11.1。使用如下代碼測試:
成功!
硬件和軟件版面如下:
顯卡:GTX A 6000
顯卡驅動:460.91.03
CUDA: 11.2
Python: 3.8.11
Pytorch:1.9
cudatoolkit: 11.1.1
cudnn:8.2.1.32
這里參考了:
Install CUDA 11.2, cuDNN 8.1.0, PyTorch v1.8.0 (or v1.9.0), and python 3.9 on RTX3090 for deep learning
Matlab
指定GPU
gpuDevice(2)
總結
以上是生活随笔為你收集整理的Linux服务器常用命令 - 记录(Anaconda/Matlab/VNC/Python)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 麦咖啡产品系列
- 下一篇: linux 其他常用命令