GB/T 15387.2-2014
术语数据库开发指南
1范围
GB/T15387的本部分规定了术语数据库(简称“术语库”)术语条目的结构、术语库的功能、术语数 据规范化、术语库扩充等内容。
本部分适用于术语库的研究、开发、维护及其管理工作。
其他涉及术语数据库的工作也可参照 使用。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。
凡是注日期的引用文件,仅注日期的版本适用于本文 件。
凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件。
GB/T3792.1文献著录第1部分:总则 GB/T3860文献主题标引I规则 GB/T8566信息技术软件生存周期过程(ISO/IEC12207:1995、ISO/IEC12207:1995/Amd. 1:2002、ISO/IEC12207:1995/Amd.2:2004,MOD) GB/T13418文字条目通用排序规则(neqISO7154:1983) GB/T13725一2001建立术语数据库的一般原则与方法 GB/T13745学科分类与代码 GB/T15237.1一2000术语工作词汇第1部分:理论与应用 GB/T15387.1一2014术语数据库开发文件编制指南 GB/T16786-2007术语工作计算机应用数据类目(ISO12620:1999,NEQ) GB/T17532-2005术语工作计算机应用词汇(ISO1087-2:2000,MOD)
3术语和定义
GB/T15237.1-2000、GB/T16786-2007、GB/T17532一2005界定的术语和定义以及下列术语 和定义适用于本文件。
3.1 术语term 在特定专业领域中一般概念的词语指称。
[GB/T15237.1-2000,定义3.4.3] 3.2 数据库database 按照预定结构组织成的数据集合。
[GB/T17532-2005,定义7.5] 3.3 术语数据库terminologicaldatabase 包含术语数据的数据库。
1
GB/T 15387.2-2014 [GB/T17532-2005,定义7.6] 3.4 数据元dataelement 在一定的上下文中具有不可分割的数据单元。
[GB/T17532-2005,定义7.11] 3.5 记录record 作为一个单位来对待的数据元的集合。
[GB/T17532-2005,定义7.9] 3.6 数据字段datafield 为特定的数据元而保存在一个记录中的变长或定长的部分。
[GB/T17532-2005,定义7.12] 3.7 数据类目datacategory 数据元类型dataelement type 关于给定数据字段的类型说明。
[GB/T17532--2005,定义7.14] 3.8 标识符identifier 用于标识或命名某个数据类目的一个或多个字符。
[GB/T17532-2005,定义7.15] 3.9 术语条目terminologicalentry 术语数据集合中所包含的与一个概念相关的术语数据。
[GB/T17532-2005,定义3.22]
4术语条目结构
在术语库中,根据不同的使用目的、每个术语条目由描述该术语的一组数据元构成。
术语条目 中具有相同元属性的数据元形成数据字段。
4.1字段数量 应根据术语库应用的需求确定字段数量,既要按照规范化的要求,最大程度地满足用户需要,又要 避免浪费。
4.2字段名称 字段名称应使用易记、易识别的字符串,如拼音或对应的英文单词,或者其简写。
示例1: 字段名称:序号(xuhao/number) 缩写:xh(汉语拼音)或No.(英语) 示例2: 字段名称:定义(dingyi/definition) 2
GB/T15387.2-2014
缩写:dy(汉语拼音)或def(英语缩写) 4.3字段标识符 字段标识符可使用字母或数字,以字母开头,可使用下划线。
字段标识符及其编制原则与方法,应 在提供给用户的文件中注明。
4.4字段数据类型 4.4.1字符型 可以是汉字、字母、数字、特殊符号等。
术语、定义等应使用字符型字段。
4.4.2数字型 可以是整数、小数、正数和负数等。
序号等应使用数字型字段。
4.4.3日期型 日期型数据字段结构为:CCYYMMDD。
示例:20010515表示2001年5月15日。
术语源的生成日期(例如标准发布日期、辞书出版日期等)、术语记录的生成日期等应使用日期型 字段。
4.4.4其他 术语数据还可能涉及其他字段数据类型,例如逻辑数据类型等。
4.5字段长 术语库应尽可能使用变长字段,使用定长字段时应考虑使用方便及节约存储空间等因素。
4.6字段间关系 根据术语数据元之间关系的特点,字段间的关系可以是一对一(1:1)、一对多(1:N)或多对多关 系(M:N)。
4.7字段的强制级别 4.7.1设定依据 字段的强制级别,应根据该术语库的使用目的而确定。
4.7.2必选字段 当术语数据类目是构成术语条自所必备的最小信息时,使用此类字段。
例如,面向概念的术语库中
不允许空缺。
4.7.3可选字段 当术语数据类目是构成术语条目所必要的信息时,使用此类字段,但允许空缺。
例如,面向翻译的 术语库中的同义词、术语的缩略形式等。
GB/T 15387.2-2014
4.7.4补充字段 当术语数据类目并非是构成术语条目的必要信息时,使用此类字段。
例如,词性语法信息、语境等。
4.8字段的可重复性
同一字段。
4.9字段的组合性 术语库中,任意个数据字段可根据需要进行组合,构成新的条目。
4.10相互参照 不同记录之间(如一条术语参照另一条术语)、不同的文件之间(如主文件与倒排文件)、不同数据库 之间(如图形数据库与文本数据库之间,不同语种数据库之间)均宜相互关联参见。
5术语库的功能
5.1用户界面 5.1.1用户界面功能要求 术语库应能提供良好的文字处理环境和友好的用户界面。
界面应具备下列功能。
5.1.2人机交互功能 使用者通过键盘或其他输人设备向机器输人提问、控制或其他有关信息,机器通过显示屏幕或其他 输出设备给使用者提供解答、提示或其他有关信息。
5.1.3选单驱动功能 应根据需要设置系统管理和用户查询使用的不同选单,应设计一个选单系统为用户显示多重选择, 根据需要可设计多级选单。
示例: 一级选单:主功能选择。
例如数据输入、数据维护与更新、数据检索、排序和打印等; 二级选单:子功能选择,单项功能中的子项、条件等。
例如数据检索功能中的浏览、设定检索式、显示检索结果等; 三级选单:需要设计的下一层细化功能选择。
5.1.4提示功能 提示的内容主要包括: 出错提示:指示错误的性质和类型,以至于如何改正; 拒绝接收提示:指示、告警无效或错误的操作; -操作步骤提示。
5.1.5求助功能 求助功能可使用窗口技术或调用辅助库,辅助屏予以实现,此状态应易于进人和退出、返回原操作 状态。
主要包括: 4
GB/T15387.2-2014
正确操作的具体、详细的说明; 一有关内容的资料,如出现的代码及其含义说明; 一一有关屏幕显示内容的解释,参数值的含义与范围,命令或功能选择描述。
5.1.6其他功能 为满足用户操作所提供的其他功能,如浏览等。
5.2数据检索 5.2.1检索形式 术语库除应能检索单一术语及相应信息(定义、外文对应词等)外,还应根据需要设计下列几种类型 的检索。
5.2.2内部属性检索 根据分类语言、叙词语言进行检索。
分类语言检索得出的是适合某一分类的某一领域内成体系的 全部术语;叙词语言检索出的是某一术语可能涉及的术语,包括其他领域内的相关术语。
5.2.3外部属性检索 主要包括: “一按术语源书目编自数据检索出该文献所包含的术语; 按源机构(或责任者)检索出该机构所编纂(制定)的术语; 一一按年代检索出术语编纂的年度变化情况。
5.2.4组合属性检索 主要包括同属性或不同属性的组合检索。
检索技术应满足GB/T13725一2001中8.2的规定。
5.3查重与数据校验 应设计查重功能,数据校验功能应按GB/T13725一2001中8.1.2的规定设计。
5.4术语库重组与重构 根据需要,设计数据库重组功能,自动的回收已删除记录所占的存储空间,并重新加以利用。
必要时,可改变存取控制、硬件配置、数据库分布以及修改数据结构等。
5.5恢复、备份和重新启动 应支持术语库的恢复、备份和重新启动。
由于误操作、程序出错或其他意外原因(例如掉电)需要重 新启动时,使用备份。
由于人为或意外原因造成术语库的破坏时,应能: a)查明错误的原因; b)查明错误的影响; c)纠正错误; d)纠正后继续工作。
5.6定义默认值 应按照GB/T13725一2001中8.1.3的要求根据需要定义默认值,便于字段内容的自动或半自动生 5...