WS 中华人民共和国卫生行业标准
WS/T306--2023代替WS/T306-2009
卫生健康信息数据集分类与编码规则
Rules for health information dataset classifying and coding
中华人民共和国国家卫生健康委员会 发布
前言
本标准为推荐性标准.
本标准代替WS/T306-2009《卫生信息数据集分类与编码规则》.与WS/T306-2009相比,主要为编辑性修改.
本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨询,由国家卫生健康委统计信息中心负责协调性和格式审查,由国家卫生健康委规划发展与信息化司负责业务管理、法规司负责统筹管理.
本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空军军医大学.
本标准主要起草人:刘丽华、张黎黎、冯丹、李顺飞、王珊、王霞、胡建平.
卫生健康信息数据集分类与编码规则
1范围
本标准适用于卫生健康领域各类卫生健康信息数据集分类与编码方案的制定. 本标准规定了卫生健康信息数据集分类与编码需遵循的基本原则、技术方法以及应用规则.
2规范性引用文件
仅该日期对应的版本适用于本标准:不注日期的引用文件,其最新版本(包括的修改单)适用于本 下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款.其中,注日期的引用文件,标准.
GB/T2260中华人民共和国行政区划代码GB/T2659世界各国和地区名称代码 GB/T7027信息分类和编码的基本原则与方法GB/T10113分类与编码通用术语GB/T11714全国组织机构代码编制规则GB/T13745学科分类与代码GB/T 14396疾病分类与代码
3术语和定义
GB/T10113中确立的及下列术语和定义适用于本标准.
具有一定主题,可以标识并可以被计算机化处理的数据集合.
在分类的基础上,给数据集赋予的有一定规律性、计算机容易识别与处理的符号.
3. 3
数据集标引ldatasetindexing
指分析数据集的内容属性及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予数据集检索标识的过程.
4数据集概述
4.1数据集基本概念
数据集是具有主题的、可标识的、能被计算机处理的数据集合.
a)主题:围绕着某一项特定任务或活动进行数据规划和设计时,对其内容进行的系统归纳和描述.通常在一起形成相同的类,将不同属性的主题区分开形成不同的类:层级性是指主题可被划分成若干子 数据集主题应具有划分性和层级性,划分性是指主题间可通过不同的命名,将相同属性的主题归并主题或子子主题.
b)可标识:指能通过规范的名称和标识符等对数据集进行标记,以供识别.标识与名称的取值需要通过具体的命名或编码规则来规范.c)能被计算机处理:指可以通过计算机技术(软硬件、网络),对数据集内容进行发布、交换、管理和查询应用.这些数据可以由不同的物理存储格式来实现,按照数据元的定义与数据类型,在计算机系统中以数值、日期、字符、图像等不同的类型表达.d)数据集合:指由按照数据元所形成的若干数据记录所构成的集合.例如,病案首页数据集由主索引、入出转、诊疗、护理、手术、费用等不同数据组成.
4.2数据集基本属性
每个数据集所具有的属性都包括通用属性和特有属性两部分.数据集的通用属性包括数据集主题、标识、实体和数据项又称“基本属性”.数据集特有属性包括类别、区域、专业、学科、建立时间、涉及的疾病等.
4.3卫生健康信息数据集
绩效评价等需求,按照数据集概念设计、归纳、整合的主题信息集合.卫生健康领域的数据集主要可以 卫生健康信息数据集是在卫生健康领域,为满足政府卫生决策、业务处理、科学研究、信息发布与归纳为三个方面:
a)信息发布类统计数据集:如中国卫生健康统计年鉴中卫生机构设置及规模、卫生人员资源的地区分布、卫生经费的筹集及分配等数据集,各类卫生机构的统计月报、年报,以及满足某一专项统计需求通过统计收集、归纳、整理、报告形成的数据集.b)业务系统建设类的基本数据集:包括医疗服务、公共卫生、药品供应、医疗保障、卫生管理等领域为了满足业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳 的各个子系统(或者功能模块)所包含的最小数据元素的集合.如:儿童出生登记、食品卫生许可、个人健康档案、住院病人入出转、居民死亡登记报告等基本数据集.c)为满足特定目的收集整理制作的数据集:包括通过调查、观察、监测、检测、试验、实验等方式获取的满足科学研究、业务咨询或卫生服务决策等需求的数据集.如:近年来国家投入建设的国家人口健康科学数据集、卫生服务调查数据集、疾病及危险因素调查等内容的数据集.
5数据集分类
5.1分类基本原则
a)系统性原则:综合考虑数据集主题一致性,按其内在联系进行系统化排列,确保类目唯一、结构合理、层次清晰,减少瓦余.c)可扩展性原则:保证分类体系框架适应数据集不断丰富的内容和日益增长的种类与数量. b)实用性原则:满足数据集分类编目的简便性、可操作和通用性需求和数据集查询的一致性理解.d)兼顾科学性原则:自顶向下,优先选择最能代表卫生健康信息数据集主题的语言、词条定义类目名称,编制受控分类体系表.e)稳定性原则:使用稳定的因素作为分类依据,同时提高分类体系的可延展性或兼容性,促进稳定性.
5.2分类方法
5.2.1主题优先法
二级、三级类目等,见表1. 卫生健康信息数据集分类体系首先依据主题构建主分类框架,分类框架各层级类目可表示为一级、
表1卫生健康信息数据集主分类框架
一级类目 二级类目 三级类目 n级类目 数据集系列一级类目1 二级类目1 三级类目1 n级类目1 数据集1 数据集2n级类目2 .....三级类目2 n级类目1 ...... .....n级类目2 .....三级类目3 n级类目1 .....n级类目2 .....n级类目1..... n级类目2二级类目2 三级类目1 n级类目1 ............ .......... .....
5.2.2多属性复分法
卫生健康信息数据集以相同主题构建,同时在若干相同主题数据集中,又根据其个性,如时间、地域、疾病、学科、机构等多属性,构成辅助分类体系,即复分类体系.
卫生健康信息数据集复分类见图1:
图1卫生健康信息数据集-复分类
5.2.3组配分类法
分类的规则.在某个主分类下的卫生健康信息数据集的组配分类示意见图2: 组配分类法是按照多维度、交叉性方式,将数据集主分类框架与复分类表组合使用,对数据集进行