团体标准
T/SCSTXXH3-2025
四川省智算中心计算资源调度 实施规范
ImplementationSpecificationfor ComputingResourceScheduling in IntelligentComputingCenterofSichuanProvince
四川省通信学会发布
目 次
1范围..2规范性引用文件.3术语、定义和缩略语.3.1术语和定义.. 2 23.2缩略语 34调度目标与思路... 44.1调度目标.4.2调度思路 55调度方法与策略 .65.1实时监控与数据采集 65.2动态调度算法... 75.3优先级管理策略.6关键技术与应用.- -106.1关键技术 -107实施方案与步骤. 6.2应用.. -11 127.1实施方案 -127.2实施步骤 -15本标准用词说明 17
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》、
智算中心作为未来计算力发展的重要基础设施,为上层应用及平台提供强大的计算能力、存储能力和网络能力.政府与企业均关注智算中心资源池的优化调度,以提升计算资源的利用率,降本增效.
随着人工智能技术的快速发展,智算中心作为支撑AI应用的基础设施,其计算资源的高效调度和优化配置成为关键,本实施规范旨在从总体层面指导智算中心如何实施计算资源的调度,涵盖资源调度目标与思路、调度方法与策略、关键技术与应用、实施方案及步骤等内容,以推动智算中心资源的高效利用和AI应用的快速发展.
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的责任.
本文件由四川省通信学会负责归口管理.
本文件起草单位:中国移动通信集团四川有限公司、中通服咨询设计研究院有限公司、成都理工大学、四川中移通信技术工程有限公司.
本文件主要起草人员:张高毅、苟浩淞、代泽均、姚光乐、刘勇、梅洲、王洪辉、陈才华、贾勇、赵仕波、彭鹏、庞璐、李瑞佳、周馨、王宇.
四川省智算中心计算资源调度实施规范
1范围
本文件规定了智算中心计算资源调度的思路、方法、关键技术及实施方案等内容. 本文件适用于指导智算中心及相关项目的计算资源调度规划、实施及优化工作.
2规范性引用文件
下列文件中的内容通过文中的规范性引用面构成本文件必不可少的条款.其中,注日期的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括的修改单)适用于本文件.
GB/T 37737 GB/T32399《信息技术云计算参考架构》 《信息技术云计算分布式块存储系统总体技术要求》《信息技术云计算概览与词汇》GB/T 32400 GB/T 35301 《信息技术云计算平台即服务(PaaS)参考架构》GB/T36327《信息技术云计算平台即服务(PaaS)应用程序管理要求》GB/T37739《信息技术云计算平台即服务部署要求》GB/T 36623 《信息技术云计算文件服务应用接口》GB/T 35293 《信息技术云计算虚拟机管理通用要求》GB/T 37732 《信息技术云计算云存储系统服务接口功能》GB/T 37734 《信息技术云计算云服务采购指南》GB/T 36325 《信息技术云计算云服务级别协议基本要求》GB/T 37735 《信息技术云计算云服务计量指标》GB/T 37741 《信息技术云计算云服务交付要求》GB/T 36326 《信息技术云计算云服务运营通用要求》GB/T 37738 《信息技术云计算云服务质量评价指标》GB/T 40690 《信息技术云计算云际计算参考架构》GB/T 37740 《信息技术云计算云平台间应用和数据迁移指南》 《信息技术云云资源监控通用要求》GB/T 37736 GB/T 34982 《云计算数据中心基本要求》GB/T 34080 《基于云计算的电子政务公共平台安全规范》GB/T 34079 《基于云计算的电子政务公共平台服务规范》GB/T 34077 《基于云计算的电子政务公共平台管理规范》
T/SCSTXXH3-2025
GB/T33780《基于云计算的电子政务公共平台技术规范》GB/T34078《基于云计算的电子政务公共平台总体规范》GB/T35279《信息安全技术云计算安全参考架构》GB/T 34942 《信息安全技术云计算服务安全能力评估方法》GB/T 31168 《信息安全技术云计算服务安全能力要求》GB/T31167《信息安全技术云计算服务安全指南》 GB/T37972《信息安全技术云计算服务运行监管框架》GB/T 38249 《信息安全技术政府网站云计算服务安全指南》
3术语、定义和缩略语
3.1术语和定义
下列术语和定义适用于本文件.
3.1.1
智算中心Intelligent ComputingCenter
智算中心是指集成了高性能计算、人工智能计算等多元化计算能力的数据中心,旨在提供高效、灵活、可扩展的计算资源,以支持复杂的数据处理、模拟仿真、深度学习等应用需求.
3.1.2
计算资源调度ComputingResource Scheduling
计算资源调度是指在智算中心内部,根据业务需求、资源状态、调度策略等因素,动态地将计资源的分配方式和时机,以实现资源的高效利用和业务性能的优化. 算资源(如CPU、GPU、NPU、内存、存储等)分配给不同的任务或应用的过程.调度算法负责确定
3.1.3
调度算法SchedulingAlgorithm
调度算法是指用于计算资源调度的数学或启发式方法,通过评估任务的优先级、资源的需求和可用性等因素,确定任务的执行顺序和资源分配方案.常见的调度算法包括先来先服务(FCFS)、最短作业优先(SJF)、优先级调度、时间片轮转(RoundRobin)等,以及针对特定应用场景的自定义算法.
3.1.4
虚拟化技术VirtualizationTechnology
虚拟化技术是一种将物理硬件资源(如计算、存储、网络等)抽象为虚拟资源的技术,使得多个虚拟机或容器可以在同一物理硬件上并行运行,且彼此之间相互隔离.虚拟化技术提高了资源的利用率和灵活性,使得计算资源可以根据业务需求进行动态调整和优化.
3.1.5
资源池ResourcePool