GB/T 21023-2007中文语音识别系统通用技术规范.pdf

文档页数：15

文档大小：4.12MB

文档格式：pdf

文档分类：推荐性国家标准

上传会员：zidan

上传日期：2007-08-12

最后更新：2007-08-12

中华人民共和国国家标准

GB/T21023-2007

中文语音识别系统通用技术规范

General specification for Chinese speech recognition system

中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会发布

目

1范围. 前言2规范性引用文件3术语和定义4语音识别系统分类及表述 24.1基于用途的分类 4.2基于词汇量的分类4.3基于所能识别的说话人群的分类4.4基于系统工作模式的分类4.5语音识别系统的应用环境4.7语音识别系统表述规范 4.6语音识别系统使用背景环境5语音识别系统性能指标5.1概述5.3响应时间指标 5.2识别性能分类指标5.4系统分类指标要求6语音输入和识别输出6.1语音识别输人准则7语音识别系统性能测试方法 6.2语音识别输出准则7.1概述7.2测试语料设计7.3测试语音录制7.5基于现场口呼的测试方法 7.4基于语音识别标准库的测试方法7.6测试报告内容8语音识别标准库及规范8.1概述..8.3语音识别标准库的标注 8.2语音识别标准库语音特性的描述8.4语音识别标准库的来源 8 88.5语音识别标准库的数据转换附录A（资料性附录）听写系统有关符号读法附录B（资料性附录）语音识别用无调汉语拼音表参考文献 12

前言

请注意本标准的某些内容有可能涉及专利.本标准的发布机构不承担识别这些专利的责任.本标准的附录A、附录B是资料性附录. 本标准由中华人民共和国信息产业部提出.本标准由全国信息技术标准化技术委员会归口，本标准由中国电子技术标准化研究所、中国科学院自动化研究所、清华大学、中国社会科学院语言研究所起草. 本标准主要起草人：徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚.

中文语音识别系统通用技术规范

1范围

本标准规定了中文语音识别系统的基本术语、分类、技术指标、测试方法、输人/输出以及中文语音识别标准库等.

用于指导中文语音识别系统的研制、应用和测试. 本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统，本标准的制定和实施主要

2规范性引用文件

的修改单（不包括勘误的内容）或修订版均不适用于本标准，然而，鼓励根据本标准达成协议的各方研究下列文件中的条款通过本标准的引用而成为本标准的条款.凡是注日期的引用文件，其随后是否可使用这些文件的最新版本.凡是不注日期的引用文件，其最新版本适用于本标准.

GB18030-2005信息技术中文编码字符集

3术语和定义

下列术语和定义适用于本标准.

3.1语音识别speechrecognition

将人类的声音信号转化为文字或者指令的过程.

3.2语音识别系统speechrecognition system具有语音识别功能的开发工具、软件、装置或应用.

3. 3 词汇表vocabulary list语音识别系统所包含和处理的词汇，

3. 4 激活词汇active word语音识别系统在某个时间点能同时识别的词汇.

3.5发音utterance 用户输人的一个语音单位，可以是词、短语或句子，发音单元之间需有有意、明显停顿.

3. 6孤立字语音isolatedword speech以字为发音单元，字与字之间需有有意、明显停顿的语音.

3. 7 连接词语音connected word speech以词为发音单元，词与词之间需有有意、明显停顿的语音.

3. 8连续语音continuous sPeech 词与词之间无需刻意停顿的自然发音语音.注：包括朗读语音和自然语音.

3.9

GB/T 21023-2007

汉语通用语Mandarin and its dialect variation注：为中国人跨地区交流时最常见之普通话. 普通话以及普通话的地方变体，

3. 10同构语音数据isomorphic speech data除说话人不同外，其他语音属性相同或基本相同的语音数据集合.

3.11 语音识别工作模式workingmodefor speechrecognition语音识别系统对说话方式、内容以及句型等的限制.

3. 12标准配置standard configuration注：如CPU、内存、网络、麦克风、A/D精度要求等，由生产厂家给出. 正常运行语音识别所需要的基本计算机配置.

3. 13系统自适应speaker adaption语音识别系统通过用户发音完成对识别模型参数修改的自适应过程.

3. 14用户自适应user adaption用户熟悉应用系统、了解自动语音识别系统特性的学习过程.

3.15 测除错误deletion error用户所发语音在语音识别结果中没有出现的错误.

3.16插入错误insertion error用户没有发的语音在识别结果中出现的错误，

3.17 替换错误substitution error用户所发语音被识别成其他语音的语音识别错误.

3.18参加评估的语音识别系统.

3. 19测试系统testing system对被测系统进行评估的系统和体系.

3. 20 副语言学paralinguistic feature言语中非音段的语音特征以及种种非语音信号.注：这些行为被充分用来对总的交际效应作出贡献.

4语音识别系统分类及表述

语音识别系统可以基于不同的用途、不同的词汇量、所能适应的不同人群、不同的工作模式、不同的应用平台进行分类.基本分类可以融合，例如某个系统可以是“基于PC平台的超大词汇量特定人群书2

资源链接请先登录（扫码可直接登录、免注册）

①本文档内容版权归属内容提供方。如果您对本资料有版权申诉，请及时联系我方进行处理（联系方式详见页脚）。
②由于网络或浏览器兼容性等问题导致下载失败，请加客服微信处理（详见下载弹窗提示），感谢理解。
③本资料由其他用户上传，本站不保证质量、数量等令人满意，若存在资料虚假不完整，请及时联系客服投诉处理。
④本站仅收取资料上传人设置的下载费中的一部分分成，用以平摊存储及运营成本。本站仅为用户提供资料分享平台，且会员之间资料免费共享（平台无费用分成），不提供其他经营性业务。

投稿会员：zidan

GB/T 21023-2007中文语音识别系统通用技术规范.pdf

推荐内容/By 规范库

手机扫码、免注册、直接登录