YD
中华人民共和国通信行业标准
YD/T6391.5-2025
Technicalrequirementsofmediaprocessingservice Part5:Intelligence processing
中华人民共和国工业和信息化部 发布
目次
前言... II引言.... III1范围2规范性引用文件3术语和定义.4缩略语5AI处理在媒体处理服务中的定位6基本业务要求.7关键功能要求8关键性能指标9面向基础设施的适配能力10运营能力支持要求,11运维能力支持要求12安全保障能力支持要求,13完备性能力支持要求.
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》给出的规定起草.
本文件是YD/T6391《媒体处理服务技术要求》的第5部分,YD/T6391已经发布了以下部分.
第1部分:功能性框架. 一第2部分:管理平台.第3部分:视频处理.第4部分:音频处理.一第5部分:智能处理.
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别这些专利的责任.
本文件由中国通信标准化协会提出并归口.
本文件起草单位:中国联合网络通信集团有限公司、北京百度网讯科技有限公司、阿里云计算有限公司、中兴通讯股份有限公司.
本文件主要起草人:贾武、邢怀飞、蔡鼎、缪川扬、乔治、陈俊江.
引言
随着互联网技术的发展,多媒体内容带来的网络流量,特别是音频和视频服务爆炸性增长.同时,视频服务已被广泛应用于娱乐、金融、教育、医疗等领域,4K/8K和虚拟现实(VR)/增强现实(AR)视频业务将流行.直播和短视频服务的兴起,推动了专业生产内容(PGC)和用户生成内容(UGC,如网络直播和短视频业务)的内容发展.面对这些大量的媒体内容,需要对媒体内容进行满足业务需求的媒体处理,为内容提供者快速、经济地提供服务.
一是减少内容提供方、业务提供方的成本.通过在云端部署媒体处理业务功能,规模化处理内容提供方及业务提供方对各类媒体视频的处理,大大节省业务提供方单独提供媒体处理的成本,并降低其技 术研发成本.
二是丰富业务形态,提升用户体验.媒体处理业务在云端进行批量化部署于应用,在CDN分发之前可进行各类媒体处理,通过各类媒体处理应用,丰富业务形态,可开发各类增值性业务,又可提升用户对视频业务的体验.
由于视频数据量巨大,媒体处理方式多样,本地计算系统的处理方式已经不能满足当前视频业务的计算要求.目前,计算技术得到了广泛的应用.媒体处理服务(MPS)基于云计算技术的概念,为各种视频服务中的音频和视频的处理提供了一种低成本、易使用、有弹性、按需使用、高度可扩展的方法.在一个典型的从头到尾的MPS流程中,视频内容首先由内容提供者采集.在视频被上传到云服务器后,MPS开始工作.为了适应不同的网络环境和终端,视颊通常会在云端进行转码处理.个性化的增值服务包括数据统计服务、内容审查服务、实时水印服务等.经过媒体处理后,视频内容被CDN分发并加速到终端设备:视频内容被解码并在终端设备上插放,
媒体处理服务技术要求系列标准结构和名称如下.
第1部分:功能性框架.目的在于规定媒体处理的功能性框架,主要包括处理域的功能要求(含总体要求、业务指配要求、可用性和可扩展性要求、业务管理需求)、安全要求,各功能块之间的参考点划分及定义,同时提供了应用场景.一第2部分:管理平台.目的在于规定媒体处理服务中管理平台相关的需求、架构和功能技术要求.一第3部分:视频处理.目的在于规定媒体处理服务中视频处理相关的业务需求、功能要求、系统架构的技术要求.一第4部分:音频处理.目的在于规定媒体处理服务中音频处理相关的业务需求、功能要求、系一第5部分:智能处理,目的在于规定媒体处理服务中智能处理相关的多模态分析、特定内容检 统架构的技术要求.测等
媒体处理服务技术要求第5部分:智能处理
1范围
本文件规定了媒体处理服务中智能处理相关的多模态分析、特定内容检测等技术要求.本文件适用于面向公众客户和企业客户的云端媒体处理服务平台中的智能处理子功能块.
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括的修改单)适用于本文件.
YD/T6391.1-2025媒体处理服务技术要求第1部分:功能性框架
ITU-TH.644.7(2023)媒体处理服务功能架构(Functional architecture for media processing services)
3术语和定义
下列术语和定义适用于本文件.
3.1
媒体处理服务mediaprocessing service
一种用于多媒体数据转码的云服务,可提供一种经济高效、简单易用、弹性大、可扩展性强的方法,将音频和视频转换成适合在PC、电视和移动界面上播放的格式,还可对海量数据进行基于深度学习的技术处理,对媒体的文字、语音等内容进行多模式场景分析,实现智能审核、内容理解、智能编辑等功能.
4缩略语
下列缩略语适用于本文件.
CDN IV 人工智能 Artificial IntelligenceCPU 中央处理器 内容分发网络 Content Delivery Network Central Processing UnitCUDA 一种通用并行计算架构 Compute Unified Device Architecture