团 体 标 准
T/A1127.3-2024
信息技术视觉特征编码 第3部分:深度学习特征
Information technology Visual feature coding
Part 3: Deep learning feature
中关村视听产业技术创新联盟 发布
目次
前言引言... III1范围.2规范性引用文件4约定.. 3术语和定义 .1 14.1概述4.2算术运算符.4.3逻辑运算符 4.4关系运算符. 24.5位运算符 .3 .34.6赋值5语法和语义. 4.7位流语法、解析过程和解码过程的描述方法 .45.1深度学习特征编码语法. .6 .65.2深度学习特征编码语义 .86深度学习特征编码..6.1概述 6.2哈希学习编码流程. .96.3乘积量化编码流程 .9 .96.4长度可调整深度学习特征编码. .12附录A (资料性)深度哈希编码检索流程 .14附录B (规范性)哈希学习 16(资料性)乘积量化码书的训练 .17
前言
起草. 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规则
本文件是T/AI127《信息技术视觉特征编码》的第3部分.T/AI127已经发布了如下部分:
一第2部分:手工设计特征:一第4部分:深度特征图: 一第3部分:深度学习特征:一第5部分:语义分割图:一第6部分:结构点序列.
本文件由新一代人工智能产业技术创新战略联盟AI标准工作组提出.
本文件由中关村视听产业技术创新联盟归口.
本文件起草单位:鹏城实验室,北京大学,青岛海信网络科技股份有限公司,青岛图灵科技有限公司,浙江邦盛科技股份有限公司
本文件起草人:段凌宇,刘关含,白燕,楼航,王雯雯,冯栋,高峰,陈卓,杨文瀚,王新宇,陈伟,赵海英,崔晓冉.
引言
本文件规定了对视觉特征表示与编码技术的规范,旨在确立适用于手工设计特征、深度学习特征、深度特征图、语义分割图、结构点序列的视觉特征压缩规范,以及特征码流设计与系统构建规范,拟由六个部分组成:
一一第1部分:系统.目的在于设计特征编码系统,提供整合特征码流的规范,实现特征高效交互与协同应用.
一一第2部分:手工设计特征.目的在于确立适用于传统手工设计特征的表示与压缩标准.
一第3部分:深度学习特征.目的在于确立适用于从深度学习模型中提取的高维特征向量的表示与压缩标准.
与压缩标准. 一一第4部分:深度特征图.目的在于确立适用于从深度学习模型中提取的通用深度特征图的表示
一一第5部分:语义分割图.目的在于确立适用于语义分割图的高效表征与无损压缩标准.
一一第6部分:结构点序列.目的在于确立适用于结构点序列的时空域高效表征与压缩标准.
专利名称如下: 本文件的发布机构提请注意,声明符合本文件时,可能涉及到XX、XX中如下X项相关专利的使用.
本文件的发布机构提请注意,声明符合本文件时,可能涉及到6.1、6.2与《基于深度度量学习的目标精确检索方法》(专利号:ZL201710060334.1):6.1、6.2与《在网上搜索多媒体文件的方法和装置》(专利号:ZL201310193569.X):6.1、6.2与《一种基于二值码字典树的搜索方法》(专利号:ZL201710142528.6):6.1、6.2与《图像搜索方法及装置、图像搜索系统》(专利号: ZL201510041221.8)相关专利的使用.
本文件的发布机构对于该专利的真实性、有效性和范围无任何立场.
该专利持有人已向本文件的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下,就专利授权许可进行谈判.该专利持有人的声明已在本文件的发布机构备案,相关信息可以通过以下联系方式获得:
专利持有人:北京大学
地址:北京市海淀区颐和园路5号理科2号楼,邮编:100871
联系人:段凌宇
通讯地址:北京市海淀区颐和园路5号,北京大学,视频与视觉技术国家工程中心
邮政编码:100098
电子邮件:lingyu@.cn
电话:
hl:
的责任. 请注意除上述专利外,本文件的某些内容仍可能涉及专利.本文件的发布机构不承担识别这些专利