GB/T 21023-2007中文语音识别系统通用技术规范.pdf

标准化,系统分类,识别,词汇量,语音,推荐性国家标准
文档页数:15
文档大小:4.12MB
文档格式:pdf
文档分类:推荐性国家标准
上传会员:
上传日期:
最后更新:

中华人民共和国国家标准

GB/T21023-2007

中文语音识别系统通用技术规范

General specification for Chinese speech recognition system

中华人民共和国国家质量监督检验检疫总局 中国国家标准化管理委员会 发布

1范围. 前言2规范性引用文件3术语和定义4语音识别系统分类及表述 24.1基于用途的分类 4.2基于词汇量的分类4.3基于所能识别的说话人群的分类4.4基于系统工作模式的分类4.5语音识别系统的应用环境4.7语音识别系统表述规范 4.6语音识别系统使用背景环境5语音识别系统性能指标5.1概述5.3响应时间指标 5.2识别性能分类指标5.4系统分类指标要求6语音输入和识别输出6.1语音识别输人准则7语音识别系统性能测试方法 6.2语音识别输出准则7.1概述7.2测试语料设计7.3测试语音录制7.5基于现场口呼的测试方法 7.4基于语音识别标准库的测试方法7.6测试报告内容8语音识别标准库及规范8.1概述..8.3语音识别标准库的标注 8.2语音识别标准库语音特性的描述8.4语音识别标准库的来源 8 88.5语音识别标准库的数据转换附录A(资料性附录)听写系统有关符号读法 附录B(资料性附录)语音识别用无调汉语拼音表参考文献 12

前言

请注意本标准的某些内容有可能涉及专利.本标准的发布机构不承担识别这些专利的责任.本标准的附录A、附录B是资料性附录. 本标准由中华人民共和国信息产业部提出.本标准由全国信息技术标准化技术委员会归口,本标准由中国电子技术标准化研究所、中国科学院自动化研究所、清华大学、中国社会科学院语言研究所起草. 本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚.

中文语音识别系统通用技术规范

1范围

本标准规定了中文语音识别系统的基本术语、分类、技术指标、测试方法、输人/输出以及中文语音识别标准库等.

用于指导中文语音识别系统的研制、应用和测试. 本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统,本标准的制定和实施主要

2规范性引用文件

的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 下列文件中的条款通过本标准的引用而成为本标准的条款.凡是注日期的引用文件,其随后是否可使用这些文件的最新版本.凡是不注日期的引用文件,其最新版本适用于本标准.

GB18030-2005信息技术中文编码字符集

3术语和定义

下列术语和定义适用于本标准.

3.1语音识别speechrecognition

将人类的声音信号转化为文字或者指令的过程.

3.2语音识别系统speechrecognition system具有语音识别功能的开发工具、软件、装置或应用.

3. 3 词汇表vocabulary list语音识别系统所包含和处理的词汇,

3. 4 激活词汇active word语音识别系统在某个时间点能同时识别的词汇.

3.5发音utterance 用户输人的一个语音单位,可以是词、短语或句子,发音单元之间需有有意、明显停顿.

3. 6孤立字语音isolatedword speech以字为发音单元,字与字之间需有有意、明显停顿的语音.

3. 7 连接词语音connected word speech以词为发音单元,词与词之间需有有意、明显停顿的语音.

3. 8连续语音continuous sPeech 词与词之间无需刻意停顿的自然发音语音.注:包括朗读语音和自然语音.

3.9

GB/T 21023-2007

汉语通用语Mandarin and its dialect variation注:为中国人跨地区交流时最常见之普通话. 普通话以及普通话的地方变体,

3. 10同构语音数据isomorphic speech data除说话人不同外,其他语音属性相同或基本相同的语音数据集合.

3.11 语音识别工作模式workingmodefor speechrecognition语音识别系统对说话方式、内容以及句型等的限制.

3. 12标准配置standard configuration注:如CPU、内存、网络、麦克风、A/D精度要求等,由生产厂家给出. 正常运行语音识别所需要的基本计算机配置.

3. 13系统自适应speaker adaption语音识别系统通过用户发音完成对识别模型参数修改的自适应过程.

3. 14用户自适应user adaption用户熟悉应用系统、了解自动语音识别系统特性的学习过程.

3.15 测除错误deletion error用户所发语音在语音识别结果中没有出现的错误.

3.16插入错误insertion error用户没有发的语音在识别结果中出现的错误,

3.17 替换错误substitution error用户所发语音被识别成其他语音的语音识别错误.

3.18参加评估的语音识别系统.

3. 19测试系统testing system对被测系统进行评估的系统和体系.

3. 20 副语言学paralinguistic feature言语中非音段的语音特征以及种种非语音信号.注:这些行为被充分用来对总的交际效应作出贡献.

4语音识别系统分类及表述

语音识别系统可以基于不同的用途、不同的词汇量、所能适应的不同人群、不同的工作模式、不同的应用平台进行分类.基本分类可以融合,例如某个系统可以是“基于PC平台的超大词汇量特定人群书2

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。
④本站仅收取资料上传人设置的下载费中的一部分分成,用以平摊存储及运营成本。本站仅为用户提供资料分享平台,且会员之间资料免费共享(平台无费用分成),不提供其他经营性业务。
投稿会员:zidan
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)