中华人民共和国国家标准
GB/T17961-2010 代替GB/T17961-2000
印刷体汉字识别系统要求与测试方法
Requirements and test methods for printed Chinese character recognition system
中国国家标准化管理委员会 中华人民共和国国家质量监督检验检疫总局 发布
前言
本标准代替GB/T17961-2000(印刷体汉字识别系统要求与测试方法》. 本标准与GB/T179612000的主要差别如下:增加了识别字符集、字体范围及输出文档格式等功能要求;一提高了识别正确率和识别速度的要求;一细化了测试方法;本标准的附录A是规范性附录,附录B和附录C是资料性附录. 增加了资料性附录B和资料性附录C.本标准由全国信息技术标准化技术委员会提出并归口.本标准主要起草单位:汉王科技股份有限公司、中国电子技术标准化研究所.本标准主要起草人:刘迎建、王欣、刘昌平、刘正珍、陈静、江世盛、李鑫梅.本标准所代替标准的历次版本发布情况为: GB/T 179612000
印刷体汉字识别系统要求与测试方法
1范围
本标准规定了印刷体汉字识别系统的功能、技术要求、测试方法等.本标准适用于运行在微型计算机的印刷体汉字识别系统.
2规范性引用文件
下列文件中的条款通过本标准的引用面成为本标准的条款.凡是注日期的引用文件,其随后的修改单(不包括勘误的内容)或修订版均不适用于本标准,然面,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本.凡是不注日期的引用文件,其最新版本适用于本标准.
GB2312-1980信息交换用汉字编码字符集基本集 GB180302005信息技术中文编码字符集
3术语和定义
下列术语和定义适用于本标准.
3.1
印剧体汉字识别系统printed Chinese character recognition system
运行于微型计算机中,可以将通过光学输人设备转换面成的具有汉字符号的印刷品的图像数据,转化为计算机系统中相应字符的软件系统.
3.2 二值图像binary image用黑白两个灰度级表示的图像.
灰度图像gray scale image
用从黑色到白色之间亮度值表示的图像.
3.4 彩色图像colorimage表示色彩信息的图像.本标准指用红、绿、蓝三个基色分量表示的图像.
3.5光学输入设备optical input device 利用光电工作原理,把纸介质上的影像信息转换成像素数据输人到计算机中的设备.
4缩略语
BMP 位图图片 (Bitmap)HTML 超文本置标语言 (Hyper Text Makeup Language)JPEG PDF 联合图像专家组格式 便携式文档格式 (Joint Picture Experts Group) (Portable Document Format)RTF 富文档格式 (Rich Text Format)TIFF 已标记图像文件格式 (Tagged Image File Format)