全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211316748.3 (22)申请日 2022.10.26 (71)申请人 小米汽车 科技有限公司 地址 100176 北京市北京经济技 术开发区 科创十街15号院5号楼6层618室 (72)发明人 刘国明  (74)专利代理 机构 北京法胜知识产权代理有限 公司 11922 专利代理师 白雪静 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/48(2006.01) (54)发明名称 GPU任务的调度方法、 装置、 设备和存 储介质 (57)摘要 本公开提供了一种GPU任务的调度方法、 装 置、 设备和存储介质, 涉及计算机技术领域。 具体 实现方案为: 响应于接收到待处理任务, 确定当 前GPU集群中各个GPU节点中空闲GPU卡的数量; 确定每个所述空闲GPU卡的第一功耗值; 根据所 述各个GPU节点中空闲GPU卡的数量及每个所述 空闲GPU卡的第一功耗值, 从所述各个GP U节点中 获取目标GPU节点; 将所述待处理任务下发给所 述目标GPU节点。 由此, 考虑到任务在不同的GPU 卡中处理时功耗可能不同的特点, 对任务进行调 度, 从而使得整个GPU 集群的功耗有效降低, 达到 了低碳和节省运营成本的效果。 权利要求书3页 说明书9页 附图3页 CN 115373860 A 2022.11.22 CN 115373860 A 1.一种GPU任务的调度方法, 其特 征在于, 包括: 响应于接收到待处 理任务, 确定当前GPU集群中各个GPU节点中空 闲GPU卡的数量; 确定每个所述空 闲GPU卡的第一功耗 值; 根据所述各个GPU节点中空闲GPU卡的数量及每个所述空闲GPU卡的第一功耗值, 从所 述各个GPU节点中获取目标GPU节点; 将所述待处 理任务下发给 所述目标GPU节点。 2.根据权利要求1所述的方法, 其特征在于, 所述确定每个所述空闲GPU卡的第一功耗 值, 包括: 基于预设的映射关系, 根据每个所述空闲GPU卡的GPU类型, 确定与所述GPU类型对应的 第一功耗 值。 3.根据权利 要求1所述的方法, 其特征在于, 所述根据所述各个GPU节点中空闲GPU卡的 数量及每 个所述空 闲GPU卡的第一功耗 值, 从所述各个GPU节点中获取目标GPU节点, 包括: 基于所述各个GPU节点中空闲GPU卡的数量, 确定各个GPU组的第一排序, 其中, 每个所 述GPU组中包 含的各GPU节点中包 含的空闲GPU卡的数量相同; 基于每个GPU节点 中包含的各空闲GPU卡的第一功耗值, 对每个GPU 组中包含的各GPU节 点进行排序, 以确定每 个GPU组各GPU节点的组内排序; 根据所述每个GPU 组对应的组内排序, 以及所述各个GPU组的第一排序, 确定所述GPU集 群中各个GPU节点的第二 排序; 基于所述第二 排序, 从所述各个GPU节点中获取目标GPU节点。 4.根据权利 要求3所述的方法, 其特征在于, 所述基于每个GPU节点中包含的各空闲GPU 卡的第一功耗值, 对每个GPU组中包含的各GPU节点进行排序, 以确 定每个GPU组各GPU节点 的组内排序, 包括: 将每个所述GPU节点的所述空闲GPU卡的第一功耗值之和, 确定为每个所述GPU节点对 应的第二功耗 值; 根据所述第二功耗值从小到大的顺序, 对所述每个GPU组中包含的GPU节点进行排序, 以确定所述每 个GPU组对应的组内排序。 5.根据权利要求3所述的方法, 其特征在于, 所述基于所述第 二排序, 从所述各个GPU节 点中获取目标GPU节点, 包括: 按照所述第二排序从前至后的顺序, 从所述各个GPU节点中获取与所述待处理任务数 量相同的GPU节点作为目标GPU节点。 6.根据权利要求3所述的方法, 其特征在于, 在所述根据所述每个GPU组对应的组内排 序, 以及所述各个GPU组的第一排序, 确 定所述GPU集群中各个GPU节点的第二排序之后, 还 包括: 响应于任一GPU节点中包 含的GPU卡均为空 闲GPU卡, 将所述任一GPU节点对应的CPU待机功率, 与所述任一GPU节点对应的第二功耗值相加, 以得到所述任一GPU节点的第三功耗 值; 基于所述任一GPU节点的第三功耗值, 对所述GPU集群中各个GPU节点的第二排序进行 调整。 7.根据权利要求1所述的方法, 其特 征在于, 还 包括:权 利 要 求 书 1/3 页 2 CN 115373860 A 2控制未接收所述待处 理任务的GPU节点的空 闲GPU卡进入低功耗状态。 8.一种GPU任务的调度装置, 其特 征在于, 包括: 第一确定模块, 用于响应于接收到待处理任务, 确定当前GPU集群中各个GPU节点中空 闲GPU卡的数量; 第二确定模块, 用于确定每 个所述空 闲GPU卡的第一功耗 值; 获取模块, 用于根据所述各个GPU节点中空闲GPU卡的数量及每个所述空闲GPU卡的第 一功耗值, 从所述各个GPU节点中获取目标GPU节点; 下发模块, 用于将所述待处 理任务下发给 所述目标GPU节点。 9.根据权利要求8所述的装置, 其特 征在于, 所述第二确定模块, 具体用于: 基于预设的映射关系, 根据每个所述空闲GPU卡的GPU类型, 确定与所述GPU类型对应的 第一功耗 值。 10.根据权利要求8所述的装置, 其特 征在于, 所述获取模块, 包括: 第一确定单元, 用于基于所述各个GPU节点 中空闲GPU卡的数量, 确定各个GPU 组的第一 排序, 其中, 每 个所述GPU组中包 含的各GPU节点中包 含的空闲GPU卡的数量相同; 排序单元, 用于基于每个GPU节点中包含的各空闲GPU卡的第一功耗值, 对每个GPU组中 包含的各GPU节点进行排序, 以确定每 个GPU组各GPU节点的组内排序; 第二确定单元, 用于根据所述每个GPU组对应的组内排序, 以及所述各个GPU组的第一 排序, 确定所述GPU集群中各个GPU节点的第二 排序; 获取单元, 用于基于所述第二 排序, 从所述各个GPU节点中获取目标GPU节点。 11.根据权利要求10所述的装置, 其特 征在于, 所述 排序单元, 具体用于: 将每个所述GPU节点的所述空闲GPU卡的第一功耗值之和, 确定为每个所述GPU节点对 应的第二功耗 值; 根据所述第二功耗值从小到大的顺序, 对所述每个GPU组中包含的GPU节点进行排序, 以确定所述每 个GPU组对应的组内排序。 12.根据权利要求10所述的装置, 其特 征在于, 所述获取 单元, 具体用于: 按照所述第二排序从前至后的顺序, 从所述各个GPU节点中获取与所述待处理任务数 量相同的GPU节点作为目标GPU节点。 13.根据权利要求10所述的装置, 其特 征在于, 所述第二确定单 元, 还用于: 响应于任一GPU节点中包 含的GPU卡均为空 闲GPU卡, 将所述任一GPU节点对应的CPU待机功率, 与所述任一GPU节点对应的第二功耗值相加, 以得到所述任一GPU节点的第三功耗 值; 基于所述任一GPU节点的第三功耗值, 对所述GPU集群中各个GPU节点的第二排序进行 调整。 14.根据权利要求8所述的装置, 其特 征在于, 还 包括: 控制模块, 用于控制未接收所述待处 理任务的GPU节点的空 闲GPU卡进入低功耗状态。 15.一种电子设备, 其特 征在于, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处权 利 要 求 书 2/3 页 3 CN 115373860 A 3

PDF文档 专利 GPU任务的调度方法、装置、设备和存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 GPU任务的调度方法、装置、设备和存储介质 第 1 页 专利 GPU任务的调度方法、装置、设备和存储介质 第 2 页 专利 GPU任务的调度方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:00:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。