体
人工智能算力网络 第6部分:云际管理与调度
Artificial intelligence puting netPart 6: JointCloud management and scheduling
中关村视听产业技术创新联盟 发布
目次
前言引言.1范围..2规范性引用文件..3术语和定义..4缩略语...5软件参考架构.6功能要求.6.1算力资源管理6.2镜像管理.6.3数据管理.6.4作业管理...6.5作业调度.6.6调度策略...6.7调度性能评估 147接口要求7.1作业管理接口.7.2调度策略接口..7.3调度评估模型接口. 15附录A(资料性)接口说明 6参考文献... 22
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规则起草.
本文件是T/AI123《人工智能算力网络》的第6部分,T/AI123已经发布了以下部分:
一第1部分:总体要求:
-第6部分:云际管理与调度.
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的责任.
本文件由新一代人工智能产业技术创新战略联盟AI标准工作组提出.
本文件由中关村视听产业技术创新联盟归口.
本文件起草单位:鹏城实验室、北京大学、国防科技大学、华为技术有限公司、中科寒武纪科技股份有限公司、广东博华超高清创新中心有限公司.
本文件主要起草人:余跃、徐春香、杨晓珍、林冯军、王晖、张叶红、刘敏、曾炜、樊春、聂永丰、张鹏、朱宗卫、赵轩、张伟民、赵海英、崔晓冉.
引言
T/AI123为人工智能算力网络规定了技术要求,接口要求,调度适配协同要求,网络设施要求、运营服务要求等.
T/AI123《人工智能算力网络》拟由以下部分组成:
一一第1部分:总体要求.目的在于确立智算网络的系统参考架构、总体功能要求及接 口要求.一第2部分:异构资源统一度量和标识.目的在于确立数据、算力、模型、存储、网络等异构资源统一抽象度量和标识的方法与转换要求.一第3部分:云际数据统一存储应用接口.目的在于确立全局共享数据存储的统一技 术架构及其功能、接口、性能、可靠性要求.一第4部分:调度适配器南向接口规范.目的在于确立调度适配器与各智算中心云化管理调度系统之间的接口,实现智算中心资源获取和作业下发.第5部分:资源感知路由协议接口.目的在于确立通过智算网络资源感知路由协议-第6部分:云际管理与调度.目的在于确立异构云互联的云际资源管理与调度系统 获取资源动态信息的接口.功能及智能优化调度技术与策略.一第7部分:网络设施与互联.目的在于确立智算中心网络互联需要的网络种类、网络规格、网络功能等. 第8部分:应用层接口.目的在于确立运营层、调度层为应用层提供的服务功能及接口.第9部分:多中心协同计算.目的在于确立多中心协同计算的应用场景,抽象建模协同计算作业,作业流程、作业评估及协同计算参考架构.第10部分:基础运营服务.目的在于确立运营层基础功能,包括用户/智算中心认 证与授权、行为审计、运维监控等.第11部分:算力运营.目的在于确立算力资源的计量和费用结算方法,算力运营分析等.第12部分:数据资源流通交易统一规范与接口.目的在于确立运营层数据市场与模 型市场资源流通交易过程中的功能接口,包括数据资源发布、确权、计量计费、运营分析等.第13部分:通信网络安全.目的在于确立智算网络中通信网络认证、传输等过程中的安全技术要求.一一第14部分:数据与模型安全.目的在于确立智算网络运营及应用中数据与模型隐私 安全技术要求.