中华人民共和国卫生行业标准
WS/T305-2023代替WS/T305-2009
卫生健康信息数据集元数据标准
Metadata specification of health information dataset
中华人民共和国国家卫生健康委员会 发布
前言
本标准为推荐性标准.
本标准代替WS/T305-2009《卫生信息数据集元数据规范》.与VS/T305-2009相比,主要为编辑性修改.
国家卫生健康委统计信息中心负责协调性和格式审查,由国家卫生健康委规划发展与信息化司负责 本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨询,由业务管理、法规司负责统筹管理.
军军医大学. 本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空
本标准主要起草人:刘丽华、王珊、张黎黎、李林、王霞、刘建超、胡建平.
卫生健康信息数据集元数据标准
1范围
参考元数据、引用信息与代码表. 本标准规定了数据集元数据内容框架、卫生健康信息数据集核心元数据、卫生健康信息数据集
本标准适用于作为卫生健康信息数据集属性的统一规范化描述,也可用于卫生健康领域针对数据集制定专用元数据标准的依据.
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款.其中,注日期的引用文件,仅该日期对应的版本适用于本标准:不注日期的引用文件,其最新版本(包括的修改单)适用于本标准.
GB/T2260中华人民共和国行政区划代码GB/T7408数据元和交换格式信息交换日期和时间表示方法WS/T306卫生健康信息数据集分类与编码规则 RFC2396统一资源定义符:通用语法
3术语和缩略语
下列术语和缩略语适用于本标准.
3.1术语
3.1.1元数据metadata定义和描述其他数据的数据.
3. 1. 2数据集dataset具有一定主题,可以标识并可以被计算机化处理的数据集合.
3.1.3元数据元素metadataelement 元数据的基本单元.
3.1. 4元数据实体metadataentity一组说明数据相同特性的元数据元素.可以包含一个或若干个元数据实体.
3.1.6数据元dataelement
用一组属性规定其定义、标识、表示和允许值的数据单元.
3.2缩略语
XML:可扩展标记语言(Extensible Markup Language)
4数据集概述
4.1数据集基本概念
对数据集概念的详细解释可见WS/T306.
4.2卫生健康信息数据集
对卫生健康信息数据集的阐述可见WS/T306.
5卫生健康信息数据集元数据概述
5.1元数据内容组成
卫生健康信息数据集元数据规定了两个层次的元数据内容的集合:核心元数据与参考元数据,其中参考元数据包含了核心元数据,它们之间的内容包含关系见图1.
图1核心元数据与参考元数据的内容包含关系
5.2元数据结层次构
元数据结构:元数据元素、元数据实体和元数据子集.
元数据元素是元数据的最基本的信息单元.例如,数据集名称、数据集标识符、元数据创建日期等,是最基本的属性信息单元,用元数据元素来表示.
元数据实体是同类元数据元素的集合,用于一些需要组合若干个更加基本的信息来表达的属性.,,,,,交和发布方”和“关键词说明”这类属性用元数据实体来表示.
元数据子集由共同说明数据集某一类属性的元数据元素与元数据实体组成,例如标识信息、内容信息、分发信息等.
5.3元数据的摘要描述
5.3.1元数据的摘要描述符
所列的描述符针对元数据的元素、实体与子集进行定义.“约束”表示一个描述符是“必选”(M), 主要采用摘要描述方法定义和描述卫生健康信息数据集的元数据内容.摘要描述的方法通过表1还是“条件选”(C),或者是“可选”(0),摘要描述符见表1.
表1摘要描述符
描述符 约束 备注定义 中文名称 M M英文名称 M取值规则 数据类型 M C 捕述元数据元素时必选,捕述元数据子集、实体时不选短名 M子元素 C M 捕述元数据子集、实体时必选,捕述元数据元素时不选
注解
5.3.2中文名称
元数据子集、实体或元素的中文名称,即为核心元数据的元数据实体或元数据元素的中文名称.
5.3.3定义
描述元数据子集、实体或元素的基本内容,是卫生健康信息数据集某个属性和特征的概念与说明,
5.3.4英文名称
元数据子集、实体或元数据元素的英文名称,一般使用英文全称.
英文名称中,词汇均采用无缝连写.元数据子集与实体英文名称的每个词汇的首字母均为大写,元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写.
5.3.5数据类型
对元数据的有效值域和允许对该值域内的值进行有效操作的规定.
元数据实体与元数据子集的数据类型为复合型,元数据元素的数据类型包括为数值型、布尔型、字符串、日期型和复合型等.
当元数据元素的数据类型为复合型的时候,表明该元数据元素使用了引用信息中的引用数据类型.
,,,Y,,质回, 引用数据类型是由一组元素组成、能被重复引用的元素集合.例如,“数据集提交和发布方”政编码”和“电子邮件地址”这一组子元素来表示,为了表达的方便,卫生健康信息元数据定义了一个叫做“负责方”的数据类型见本标准9.1.1条款,供“数据集提交和发布方”和“元数据维护方”进行引用.
5.3.6取值规则
元数据子集、实体或元素取值方式的说明.
5.3.7短名
元数据元素、实体或子集的英文缩写名称,具体缩写规则如下:
a)短名在本标准范围内必须唯一.b)对存在国际或行业惯用英文缩写词汇的元数据元素或元数据实体,采用惯用英文缩写作短名.e)对于根据英文名称或自定义的短名,在可以保证其(本标准范围中的短名范围内)唯一性的情况下取每个词汇的前3位字母作为其短名,当如此取词时发现不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加1位.如果仍然不能满足唯一性要求,则 照此顺延.d)元数据子集、元素和元数据实体的短名中,词汇均采用无缝连写.元数据子集与实体短名