Y
中华人民共和国广播电视和网络视听行业标准 GY/T363-2023
三维声编解码及渲染 3D audio coding and rendering
2023-02-01发布2023-02-01实施
国家广播电视总局发布
GY/T 363-2023
目次
前言IIT 引言 1范围. 2规范性引用文件 3术语和定义 4缩略语 5约定, 5.1概述. 5.2算术运算符 5.3逻辑运算符 5.4关系运算符 5.5位运算符 5.6赋值.. 5.7助记符.. 5.8数学函数. 5.9位流语法规则6 6三维声编解码及渲染框架8 7通用码率音频解码10 7.1概述...10 7.2位流解复用语法语义及解码过程14 7.3区间解码、逆量化和神经网络逆变换语法语义及解码过程19 7.4频谱逆分组处理语法语义及解码过程,24 7.5双声道立体声比特分配和上混语法语义及解码过程25 7.6多声道比特分配和上混语法语义及解码过程30 7.7HOA比特分配和上混..32 7.8解码后处理语法语义及解码过程37 7.9频带扩展解码语法语义及解码过程,38 7.10逆时域噪声整形语法语义及解码过程46 7. 11逆频域噪声整形语法语义及解码过程48 7.12逆MDCT解码过程50 7.13HOA空间解码.50 8无损音频解码,56 9元数据解码.56 9.1元数据位流语法语义56
GY/T 363-2023 9.2静态元数据解码语法语义57 9.3动态元数据解码语法语义57 9.4基本静态元数据解码语法语义58 9.5基本静态元数据节目层解码语法语义60 9.6基本静态元数据内容层解码语法语义61 9.7基本静态元数据对象层解码语法语义63 9.8基本静态元数据对话字段解码语法语义65 9.9基本静态元数据封装层解码语法语义,65 9.10)基本静态元数据通道层解码语法语义68 9. 11基本静态元数据对象互动字段解码语法语义69 9.12基本静态元数据扬声器位置解码语法语义71 9.13基本静态元数据响度字段解码语法语义71 9.14基本静态元数据节目参考屏幕字段解码语法语义73 9.15动态元数据Level1解码语法语义74 9.16动态元数据Level2解码语法语义76 9.17解码过程78 附录A(规范性)三维声编码位流语法语义,81 A.1语法.81 A.2语义...86 附录B(规范性)音频码表.93 附录C(规范性)元数据参数,250 附录D(资料性)三维声渲染..252 D.1扬声器渲染252 D.2双耳渲染261 附录E(资料性)通用码率音频编码.270 E.1编码框架270 E.2编码预处理275 E.3下混281 E.4神经网络变换与量化编码287 E.5HOA空间编码..294 E.6编码神经网络参数表,295 附录F(资料性)元数据编码.327 附录G(资料性)本文件编码元数据与ITU-RBS.2076-2中元数据的对应关系.328 参考文献.334
II
GY/T363--2023
前言
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规 定起草。
本文件由全国广播电影电视标准化技术委员会(SAC/TC239)归口。
本文件起草单位:中央广播电视总台、国家广播电视总局广播电视规划院、国家广播电视总局广播 电视科学研究院、清华大学、华为技术有限公司、上海海思技术有限公司、北京抖音信息服务有限公司、 赛因芯微(北京)电子科技有限公司、世界超高清视频产业联盟。
本文件主要起草人:姜文波、关朝洋、周芸、窦维蓓、宁金辉、王喆、郭晓强、张建东、焦健波、 吴健、黄传增、庞超、柳德荣、鹿楠楠、邹志铭、刘汉源、胡潇、吴强、汪芮、翟南、高原、史俊杰、 张南鹏、叶煦舟、张正普、万玉鹏、李小雨、王倩男、李琳、曹徐洋、王东飞、李达、刘石磊、李峰、 张文刚、张鸿宇。
III
GY/T363-2023
引言
本文件的发布机构提请注意,声明符合本文件时,可能涉及到7.3~7.7、7.9、7.10、7.13、E.2~ E.4与音频编解码技术相关的专利、D.1与扬声器渲染技术相关的专利、D.2与双耳渲染技术相关的专利 的使用。
专利列表如下: 序号章条编号专利号专利名称专利权利人 16、附录A200710175993. 6编码集成系统和方法与解码集成系统和方法清华大学 27.3202110559102. 7编解码方法、装置、设备、存储介质及计算机华为技术有限公司
程序 37.3202110596023. 3音频数据编解码方法和相关装置及计算机可读华为技术有限公司
存储介质 47.4202110865328. X种音频信号的编解码方法和装置华为技术有限公司 57.5200710135833. 9立体声音频...