YD
中华人民共和国通信行业标准
YD/T4393.2--2023
虚拟数字人指标要求和评估方法 第2部分:2D真人形象类合成技术
Technicalrequirementsandevaluationmethodsfordigitalhuman- Part2:2Dreal-personimagesynthetictechnology
中华人民共和国工业和信息化部 发布
目次
前言 .11引言.. III1范围.2规范性引用文件.3术语、定义和缩略语.3.1术语和定义3.2缩略语4具体指标及评估方法 4.1评估方法概述 24.2形象. 24.3语音.4.4动作 4.5多模态输出4.6整体
前言
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定内容起草.
本文件为《虚拟数字人指标要求和评估方法》系列标准,该标准的结构和名称预计如下.
第1部分:参考框架.
第2部分:2D真人形象类合成技术.
本文件为《虚拟数字人指标要求和评估方法》第2部分.
请注意本文件的某些内容可能涉及专利,本文件的发布机构不承担识别这些专利的责任.
本文件由中国通信标准化协会提出并归口.
本文件起草单位:中国信息通信研究院、深圳市腾讯计算机系统有限公司、南京新一代人工智能研究院有限公司.
本文件主要起草人:颜媚、石霖、冯波、柴华、桂保坤、李露、莫小帅、张丹.
引言
在人工智能、虚拟现实等新技术浪潮的带动下,虚拟数字人制作过程得到有效简化、各方面性能获得飞跃式提升,开始从外观的数字化逐渐深入行为的交互化、思想的智能化.以虚拟主播、虚拟员工等为代表的数字人成功进入大众视野,并以多元化姿态在影视、游戏、传媒、文旅、金融等众多领域大放异彩.但由于技术实力和成本等原因,市场上数字人产品质量良筹不齐,缺乏相关标准规范来对虚拟数字人产品进行规范和约束.
市场环境,特开展数字人相关应用的标准化工作. 为引导数字人产业健康发展,增强用户对数字人应用的信心,保护优质的应用提供商,营造良好的
《虚拟数字人指标要求和评估方法》拟分为以下两个部分.
一第1部分:参考框架.目的在于提出数字人应用系统的逻辑框架,并分别从形象、语音、动作、
交互处理、多模态输入、多模态输出等维度明确其技术评估指标.
-第2部分:2D真人形象类合成技术,目的在于明确2D真人形象类数字人合成技术的指标要求以及具体的评估方法.
本文件为《虚拟数字人指标要求和评估方法第2部分:2D真人形象类合成技术》,主要规定了2D虚拟真人形象合成技术在形象、语音、动作、多模态输出等方面的指标要求及评估方法.
虚拟数字人指标要求和评估方法
第2部分:2D真人形象类合成技术
1范围
模态输出等方面指标的评估方法. 本文件规定了2D虚拟真人形象合成技术相关指标的评估方法,主要描述了形象、语音、动作、多
本文件适用于指导第三方测评机构对2D虚拟真人形象合成技术的评估、验收等工作.
2规范性引用文件
下列文件对于本文件的应用是必不可少的.凡是注日期的引用文件,仅所注日期的版本适用于本文件.凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件.
YD/T4393.1-2023虚拟数字人指标要求和评估方法第1部分:参考框架
3术语、定义和缩略语
3.1术语和定义
下列术语和定义适用于本文件.
2D真人形象类数字人2-Dimensionalrealpersondigitalhuman
通过提取真人视频中的声音、唇形、表情动作等特征,运用语音、唇形、表情合成及深度学习等技术联合建模训练而成的数字人.
3.2缩略语
下列缩略语适用于本文件.
FPS 每秒帧数 Frames Per Seconds2D 二维 2-Dimensional3D 三维 3-Dimensional