文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

手把手教你租用服务器以及Pycharm远程连接服务器训练模型

2023-09-30 13:35

关注

由于模型优化过后训练时间太长,所以想使用显卡或者租服务器进行训练,but显卡太贵(只有A卡),那就租服务器好了,开始了解怎么租,去哪租一系列问题,果然只要开始思考,就是一个接一个的困难,直接被击碎。终于找到了AutoDL,美美的开始租服务器,结果又绊在了选择镜像上,一开始我以为是要在本地部署好相关环境,然后使用自己租的显卡,安装好了对应的cuda以及cudnn,胡乱折腾了一天,没想到使用GPU训练这么复杂。第二天继续研究,发现根本不需要在本地部署(我心态超好)起码创建虚拟环境什么安装命令给我练熟了!会了之后发现挺容易的哈哈哈哈(但我自己瞎琢磨了一两天)


本文主要解决问题:如何租用服务器、如何使用Pycharm远程连接服务器进行模型训练
如果你也是第一次租用服务器,那就接着看下去吧!希望可以快速帮到你!!!


1.租用服务器

个人认为AutoDL很不错,建议先去看帮助文档,能解决大部分问题。
快速开始,我这里选择的镜像是TensorFlow 2.9。租好之后,默认开机状态,建议关机或无卡模式开机!
image.png
如果给出的框架版本或者python版本不满足需求,可以在框架官网查看对应版本,选择对应cuda版本的Miniconda镜像,如果都不满足,随便挑选一个Miniconda镜像,在开机后自行安装相关框架、CUDA、其他版本的Python。
查看tensorflow对应的版本以及cuda版
image.png
image.png
建议多租几块,只要不开机,就不会承担费用。只租一块的话,可能出现空闲GPU不足的情况。
image.png

2.pycharm远程开发

只有专业版支持远程开发,你需要安装一个professional pycharm
Pycharm—>File—>Settings
image.png
在AutoDL->控制台->容器实例中获取你需要连接的服务器的登录指令(建议无卡模式)
image.png
image.png
继续下一步,直到看到下面的弹窗。选择System Interpreter,配置远程Python解释器地址为/root/miniconda3/bin/python
配置同步目录,意思是本地项目和远程实例中的哪个目录进行关联,这里设置为实例的数据盘子目录:/root/autodl-tmp/project/ (不建议使用默认的/tmp目录)(我这里忘记改了)
image.png

3.在服务器终端创建虚拟环境

你可以就在base中安装依赖,但我建议创建虚拟环境(使用虚拟环境可以避免包的混乱和版本冲突)

conda create -n tf-gpu python=3.8           # 构建一个虚拟环境,名为:tf-gpuconda init bash && source /root/.bashrc     # 更新bashrc中的环境变量conda activate tf-gpu                       # 切换到创建的虚拟环境:tf-gpu

image.png
image.png
image.png

4.安装软件依赖

# 切换conda虚拟环境后conda install tensorflow-gpu==2.9.0     # conda会自动解析依赖安装tensorflow 1.15.0版本需要的cuda和cudnn,无需自己独立安装

不放心有没有对应的cuda和cudnn,可使用以下命令进行查看

# 查询平台内置镜像中的cuda版本ldconfig -p | grep cuda# 查询平台内置镜像中的cudnn版本ldconfig -p | grep cudnn

image.png
image.png

# 安装完使用Python进行简单的测试:import tensorflow as tftf__version__

5.上传数据集

通过xftp上传数据集,直接手动拖拽上传即可。其他上传方式可参考AutoDL
image.png

6.运行代码

选中需要运行的文件,点击右键
image.png
image.png
复制一下,然后进入终端运行
image.png
在pycharm->terminal中会出现文字乱码情况,建议使用AutoDL的快捷工具JupyterLab进入terminal。
温馨提示:进入之后默认是base,如果创建了虚拟环境的话,一定要切换到你创建的环境中,然后运行代码!
image.png
修改Pycharm代码,会自动上传(配置远程服务器中勾选了Automatically upload复选框),如果找不到可运行的文件,重复以下步骤重新运行即可
image.png

7.自动关机

为了省钱,我们希望程序执行之后立马关机,我们可以在命令行之后加shutdown来实现

python 需要运行的文件名.py && shutdown  # 用&&拼接表示前边的命令执行成功后才会执行shutdown

怎么上传上来图片大小不一啊,看着好不舒服啊!

来源地址:https://blog.csdn.net/li26324949/article/details/130610100

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-服务器
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯