当前位置:网站首页>模型训练前后显卡占用对比、多卡训练GPU占用分析【一文读懂】
模型训练前后显卡占用对比、多卡训练GPU占用分析【一文读懂】
2022-08-03 05:52:00 【墨理学AI】
版权: 本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连
声明:作为全网 AI 领域 干货最多的博主之一,️ 不负光阴不负卿 ️
本次博文简单记录,多卡训练任务中 ,各个 GPU 资源占用情况 ,内容较为基础,后续有新的心再继续补充
训练前
2 A100-PCIE-40GB Off | 00000000:39:00.0 Off | 0 |
| N/A 26C P0 37W / 250W | 14568MiB / 40536MiB | 0% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
| 3 A100-PCIE-40GB Off | 00000000:3D:00.0 Off | 0 |
| N/A 25C P0 39W / 250W | 11497MiB / 40536MiB | 26% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
| 4 A100-PCIE-40GB Off | 00000000:9C:00.0 Off | 0 |
| N/A 35C P0 104W / 250W | 12920MiB / 40536MiB | 32% Default |
| | | Disabled |
开启训练后
------------------------------+----------------------+----------------------+
| 2 A100-PCIE-40GB Off | 00000000:39:00.0 Off | 0 |
| N/A 42C P0 236W / 250W | 35653MiB / 40536MiB | 72% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
| 3 A100-PCIE-40GB Off | 00000000:3D:00.0 Off | 0 |
| N/A 42C P0 226W / 250W | 31506MiB / 40536MiB | 42% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
| 4 A100-PCIE-40GB Off | 00000000:9C:00.0 Off | 0 |
| N/A 47C P0 214W / 250W | 32905MiB / 40536MiB | 72% Default |
| | | Disabled |
+-------------------------------+----------------------+----------------------+
GPU 占用如下
此次训练任务,使用了 2,3,4 三张卡,编号为 2 的卡是主卡,主卡 GPU 占用会多 一个 G
GPU | 开启后 | 开启前 | GPU占用(开启后 - 开启前) |
---|---|---|---|
2 | 35653MiB | 14568MiB | 21085 |
3 | 31506MiB | 11497MiB | 20009 |
4 | 32905MiB | 12920MiB | 19985 |
多卡训练GPU占用分析
多卡训练任务中,主卡需要承担和其他卡之前的通信,可以看到
- 实验一:0,1,2,3 四卡训练,0 号主卡多了 3个 通信 进程
- 实验二:4,5,6 三卡训练,4 号主卡多了 2 个通信 进程
- 因此,整体来看,多卡训练任务中,主卡会比其他卡 多占用 一个 G 左右的 GPU 资源
因此,有时候,多卡训练就可能会遇到:
RuntimeError: CUDA out of memory. Tried to allocate 模型训练 GPU 显存不够报错总结
,此时,就可能是 刚好 主卡 资源不够的原因,关于该报错的分析,可以看我下面的这篇文章:
精选专栏
计算机视觉领域 八大专栏、不少干货、有兴趣可了解一下
- ️ 图像风格转换 —— 代码环境搭建 实战教程【关注即可阅】!
- 图像修复-代码环境搭建-知识总结 实战教程 【据说还行】
- 超分重建-代码环境搭建-知识总结 解秘如何让白月光更清晰【脱单神器】
- YOLO专栏,只有实战,不讲道理 图像分类【建议收藏】!
深度学习:环境搭建,一文读懂
深度学习:趣学深度学习
落地部署应用:模型部署之转换-加速-封装
CV 和 语音数据集:数据集整理
点赞 收藏 留言 都是博主坚持写作、更新高质量博文的最大动力!
边栏推荐
- el-tabs(标签栏)的入门学习
- mysql 数据去重的三种方式[实战]
- Multi-Head-Attention原理及代码实现
- ES6中 async 函数、await表达式 的基本用法
- spark中Repartition 和 Coalesce 区别
- empty() received an invalid combination of arguments - got (tuple, dtype=NoneType, device=NoneType),
- MYSQL存储过程注释详解
- el-tree设置利用setCheckedNodessetCheckedKeys默认勾选节点,以及通过setChecked新增勾选指定节点
- UniApp 自定义条件编译详细使用流程
- 商业智能BI业务分析思维:供应链分析 – 如何控制牛鞭效应(二)
猜你喜欢
el-table实现列筛选功能,控制列的显示和隐藏(实现简单,效果满分)
Cesium加载离线地图和离线地形
重量级大咖来袭:阿里云生命科学与智能计算峰会精彩内容剧透
El - table column filter functions, control columns show and hide (effect and easy to implement full marks)
关于NOI 2022的报到通知
El - tree set using setCheckedNodessetCheckedKeys default check nodes, and a new check through setChecked specified node
ClickHouse 数据插入、更新与删除操作 SQL
prometheus 监控mysql数据库
【云原生 · Kubernetes】Kubernetes简介及基本组件
Getting Started with Chrome Plugin Development
随机推荐
ISIJ 2022收官,中国初中生再展风采
我国有关信息方面的法律法规
npx 有什么作用跟意义?为什么要有 npx?什么场景使用?
SQL——左连接(Left join)、右连接(Right join)、内连接(Inner join)
【经验分享】配置用户通过Console口登录设备示例
信息学奥赛一本通T1453:移动玩具
MySQL 日期时间类型精确到毫秒
MySQL必知必会
MySQL之DQL——查询语言
MYSQL存储过程注释详解
QT信号与槽
MySql的安装配置超详细教程与简单的建库建表方法
Content type ‘applicationx-www-form-urlencoded;charset=UTF-8‘ not supported“【已解决】
UniApp 获取当前页面标题(navigationBarTitleText)
信息学奥赛一本通T1446:素数方阵
Scala 高阶(七):集合内容汇总(上篇)
单节点部署 gpmall 商城系统(二)
CCF NOI 2022笔试题库
置顶文章-
MySQL中,对结果或条件进行字符串拼接