Skip to content

Latest commit

 

History

History
234 lines (128 loc) · 4.71 KB

深度学习服务器配置.md

File metadata and controls

234 lines (128 loc) · 4.71 KB

预备工作

学校邮箱申请

微信 -> 天津理工大学 -> 服务中心 -> 学生邮箱申请

注:

image-20220616103143114

pycharm专业版激活

image-20220707193731846

pycharm远程同步代码方法

image-20220707194014005

https://blog.csdn.net/qq_45818845/article/details/122833945

新建Python项目

pycharm远程连接服务器

代码上传

代码运行

杂项

自动抢占GPU

代码地址:

3090服务器下的 /disk0/qzm/narrow_setup_V0.4.1.py

1080服务器下的 /disk1/qzm/Code/HeadHunter/narrow_setup_V0.3.py

代码使用方法:

  1. 设置等待条件
  2. 设置需要执行的指令
  3. 运行

运行效果

FinalShell服务器管理工具安装与配置

一键安装脚本(Linux)

rm -f finalshell_install_linux.sh ;wget www.hostbuf.com/downloads/finalshell_install_linux.sh;chmod +x finalshell_install_linux.sh;./finalshell_install_linux.sh;

配置方法

image-20220630192913913

有关finalshell的更多信息

https://www.hostbuf.com/

小技巧

finalshell命令管理

image-20220628131700835

conda有关的问答

**Q:**配置/创建conda环境时,报HTTP的错

**A:**修改.condarc中的内容,改成下面的:

show_channel_urls: true
ssl_verify: true
channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/free/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
  - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

.condarc位置:

Win:C:\Users\用户名\.condarc

Linux:~/.condarc

**Q:**在执行torch.cuda.is_available()时显示False

**A:**cudatoolkit没装好,或者pytorch版本不匹配,去https://pytorch.org/get-started/previous-versions/复制合适的安装方法,如:

conda install pytorch==1.8.1 torchvision==0.9.1 torchaudio==0.8.1 cudatoolkit=10.2 -c pytorch

杂项

多条命令顺序执行语法

不管前一个命令运行成功还是出现错误,只要其运行结束,后一个都会在它之后运行

cmd1; cmd2; cmd3

只有在前一个命令成功运行结束时,下一个命令才会运行

cmd1 && cmd2 && cmd3

只有在前一个命令出现错误时,才运行下一个命令

cmd1 || cmd2 || cmd3

服务器中文件存放

image-20220616103410944

一般来说,把自己的文件放在”/disk0“或/”disk1“下,不要放到“/”下了

image-20220616104435726

快速查找服务器文件系统

可以用来查找自己要用的数据集是否别人已经下载了,如果有就可以复制一下自己用

如:搜索是否有MOT数据集

locate MOT

更新locate相关的数据库

sudo updatedb

GitHub issue搜索

搜索内容中包含“checkpoint”的所有issue

is:issue checkpoint in:body

搜索题目中包含“checkpoint”的所有issue

is:issue checkpoint in:title

更多内容见https://docs.github.com/cn/search-github/searching-on-github/searching-issues-and-pull-requests

screen命令

1.查看现有终端

screen -ls

2.创建终端

screen -S [终端名称]

3.退出终端

Ctrl+A,后按D

4.重新进入终端

screen -R [pid/name]

5.删除终端

进入终端后输入exit

6.不用进入终端就删除(谨慎使用)

screen -R [pid/Name] -X quit

从一台服务器拉取信息到另一台

如:在1080服务器上,拉取3090服务器上的 /disk0/qzm/Datasets/zips/DukeMTMC-reID.zip 到1080的 /disk1/qzm/Datasets/Zips 目录下

rsync -avuz -e 'ssh -p 13922' [email protected]:/disk0/qzm/Datasets/zips/DukeMTMC-reID.zip /disk1/qzm/Datasets/Zips

image-20220705103515991