卫生健康数据质量控制规范 第2部分:数据质量控制规则标准
Standardforquality control of healthdata
Part 2:Data quality control rules and standards
四川省卫生信息学会发布
目
前 言1.范围2.规范性引用文件 33.术语和缩路语4.质量控制规则 3表4-2-1 数据质控指标分类与代码表 27表4-2-2数据质量指标分类等级代码表 28表4-2-3医疗三监管数据质量统计分析类指标 28
前言
T/SHIA7-2018<>分为2部分:
----第1部分:数据质量控制平台功能规范
----第2部分:数据质量控制规则标准
本部分为T/SHIA7的第2部分.
本标准内容由四川省卫生信息学会人口健康信息标准专业委员会提出并归口.
本标准的主要起草单位:四川省卫生信息学会、四川省卫生信息学会人口健康信息标准专业委员会、四川省卫生和计划生育信息中心.
本标准参与起草单位:万达信息股份有限公司、成都信通网易科技有限公司、四川久远银海科技有限公司、北京东华医为科技有限公司、成都中联信息产业有限公司、杭州创业软件股份有限公司、成都金盘电子科大多媒体技术有限公司.
本标准的主要起草人:周力、林晓东、丁智刚、潘惊萍、沈明辉、吴天智、彭小菊、罗维、彭先清、林阳、范戎、向海平、严华、段占祺、张子武、毛云鹏、邓韧、谢绍伦、白云虎、熊飞.
卫生健康数据质量控制规范
第2部分:数据质量规则标准
1.范围
本部分规定了数据质量规则标则、指标及其指标描述.本部分适用于数据质量控制平台的质量数据得用、发布及共享.
2.规范性引用文件
下列文件对于本文件的应用是必不可少的.凡是注日期的引用文件,仅注日期的版本适用于本文件.凡是不注日期的引用文件,其最新版本(包括修改单)适用于本文件.
1)GB32100-2015法人和其他组织统一社会信用代码编码规则2)GB/T14396-2016疾病分类与代码3)GB/T 15657-1995 中医病证分类与代码表4)GB/T16751.3-1997 治法部分5)WS364-2011卫生信息数据元值域代码:6)T/SHIA5.6-2017区域卫生信息互联互通标准应用指南第6部分:基本卫生术语及编码集7)T/SHIA6-2018全民健康信息批量采集交换中间库标准
3.术语和缩略语
3.1.缩略语
以下缩略语适用于本文件.
DQ 数据质量 Data QualityDQA 数据质量分析 Data Quality AnalysisMDM 主数据管理Master Data Management
4.质量控制规则
建立数据质量校验规则库,用以确保校验的灵活性.其校验规则详见4.1部分内容.
4.1.数据质量校验规则
数据质量校验规则主要包括基于最大值/最小值校验、基于正则表达式校验、基于SQL语句校验.
表4-1-1基于最大值/最小值校验规则模版
序 业务表名(数 表字段名 最大/最小值号 据集) (数据元) 参考 异常值 说明年龄值(-3)不在TB_HZXX NL(年龄) 0~150 内. 取值范围(0~150)-..--. ...... ......
2.基于正则表达式校验规则的模版如表4-2所示.
表4-1-2基于正则表达式校验规则模版
序 业务表名 表字段名 正则表达式 异常值 说明号 规则 ZJLX(证件类型)TB_HZXX(患者 Z.JLX(证件 值(08)不在取值基本信息表) 类型) (0[17]|99) 范围(0[1-7]|99)内..... ......
3.基于SQL语句的质控规则校验规则库.
基于SQL语句的校验规则主要包括:
(1)字段不能为空值或NULL值,在SQL语句中基格式为{表字段名称)is not nul1(如:GRBSLX isnotnul1(个人标识类型不能为空)等),具体内容详见表4-1-3-1.
表4-1-3-1医疗三监管空值字段列表
序号 业务表名 字段名 中文名 说明1 XI8 YLJGDM 医疗机构代码 个人标识类型 核心字段 核心字段2 3 HS889 个人标识号 核心字段4 ZJL.X 证件类型 核心字段5 Z JHM 证件号码 重点核心字段6 XB 性别 核心字段7 忠者基本信息 XM 姓名 核心字段8 (TB_HZXX) HZLX 患者类型 核心字段9 CSRQ 出生日期 婚姻状况10 11 csD 出生地12 民族13 国籍14 DM 电话号码
1以下列出的内容均为医疗三监管平台要求的内容,其标准来源于T/SHIA6.2-2018部分.