T/AI 132.2-2025 人工智能 神经网络编译器 第2部分:技术要求与测试方法.pdf

2025,AI,pdf,编译器,团体标准
文档页数:10
文档大小:781.78KB
文档格式:pdf
文档分类:团体标准
上传会员:
上传日期:
最后更新:

T/A1 132.2-2025
目次 前言..11 引言.II 1范围... 2规范性引用文件 3术语和定义 4缩略语 5概述 6技术要求 6.1一般要求, 6.2安装部署要求 6.3功能要求. 6.4兼容性要求 6.5可扩展性要求 7测试方法. 7.1测试要求 7.2安装部署测试 7.3功能测试 7.4兼容性测试 7.5可扩展性测试
T/A1 132. 2-2025
前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。

本文件是T/AI132《人工智能神经网络编译器》的第2部分,T/AI132已经发布以下部分: 第2部分:技术要求与测试方法。

请注意本文件的某些内容可能涉及专利。

本文件的发布机构不承担识别专利的责任。

本文件由新一代人工智能产业技术创新战略联盟AI标准工作组提出。

本文件由中关村视听产业技术创新联盟归口。

本文件起草单位:浪潮电子信息产业股份有限公司、北京大学、北京百度网讯科技有限公司、北京 大学长沙计算与数字经济研究院、中科寒武纪科技股份有限公司、上海原科技股份有限公司、华为技 术有限公司。

本文件主要起草人:郭振华、赵雅倩、杨超、蒋晓琳、勾海鹏、胡帅、王思善、关贺、唐轶男、王 丽、李仁刚。

1I
T/A1132.2-2025
引言 T/AI132《人工智能神经网络编译器》旨在为人工智能上层深度学习框架和下层AI硬件加速设备 之间的统一映射提供规范化指引和依据。

拟由两个部分构成。

一第1部分:接口与优化技术规范。

目的在于规范神经网络编译器前后端接口、中间表示接口以 及编译器优化接口等内容。

一第2部分:技术要求与测试方法。

目的在于规范神经网络编译器基础能力的技术要求和对应的 测试方法。

I11
T/A1 132. 2-2025 人工智能神经网络编译器第2部分:技术要求与测试方法
1范围 本文件规定了人工智能神经网络编译器的技术要求和测试方法。

本文件适用于神经网络编译器的设计参考与测试评估,为神经网络编译器技术发展提供参考规范 和功能指引。

2规范性引用文件 本文件没有规范性引用文件。

3术语和定义 下列术语和定义适用于本文件。

3. 1 计算图putationalgraph 对一系列算子和数据流转编排之后形成的有向无环图的描述。

3. 2 深度学习框架deeplearningframework 用于构建和训练神经网络模型的一套工具和库。

神经网络编译器neuralnetworkpiler 输入深度学习框架模型定义文件,输出能够在不同硬件高效执行的代码的翻译器或解释器。

3. 4 神经网络编译器前端neuralnetworkpilerfrontend 神经网络编译器的一部分,负责与硬件无关的处理,包括接收深度学习框架的模型输入、将计算图 转换至统一的高层IR并进行硬件无关的优化、将高层IR送给神经网络编译器后端。

3.5 神经网络编译器后端neuralnetwork pilerbackend 神经网络编译器的一部分,负责将高层IR转化为低层IR、针对特定输出硬件执行低层IR的特定优化、 生成对应的硬件代码指令、调用各硬件设备执行计算。

4缩略语 下列缩略语适用于本文件。

Al人工智能(Artificial Intelligence) ASIC专用集成电路(Application-SpecificIntegrated Circuit) CPU中央处理器(Central ProcessingUnit) CUDA统一计算设备架构(Compute UnifiedDeviceArchitecture) GPU图形处理器(Graphics ProcessingUnit) IR中间表示(Intermediate Representation) LLVM底层虚拟机(LowLevelVirtualMachine) 5概述 神经网络编译器的通用设计架构主要包含两部分:编译器前端和编译器后端。

在部署深度学习算法 模型的训练和推理时,模型可以被深度学习框架表示为计算图,计算图在神经网络编译器中被转换为多 级IR,其中高层IR在编译器前端,低层IR在编译器后端。

T/A1 132. 2-2025 a)编译前端主要负责与硬件无关的处理,其主要功能是接收来自不同深度学习框架的模型输入, 并将计算图转换至统一的高层IR,之后对高层IR进行硬件无关的优化,再将其送给编译后端: b)编译后端的主要功能是将优化后的高层IR转化为低层IR,然后针对特定输出硬件执行低层IR 的特定优化,并生成对应的硬件代码指令,最后通过不同的硬件接入方式调用各硬件设备执行 计算。

...

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:丝雨へい飘渺
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)