体
Medicalreal-worlddatagovernance-Construction ofmondatamodel
中国标准化协会发布
目次
前言... III引言... IV1范围..2规范性引用文件. 13术语和定义 14缩略语 25数据治理的CDM构建概述 35.1构建目标与原则 35.2流程总览 36数据治理的CDM构建方法 46.1需求分析与数据源定义, 46.2数据模型设计 46.3术语标准化与映射. .56.4数据集成与整合.. .66.5模型验证与质量评估. .66.6模型维护与演进. .67CDM建设的附加要求.. 77.1数据治理基本要求. .77.2偏倚控制要求... 87.3分析结果的可重复性 8参考文献.
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草.
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的责任.
本文件起草单位:北京大学医学部、国家药品监督管理局药品评价中心、万达信息股份有限公司、宁波市郸州区疾病预防控制中心、宁波市卫生信息中心、浙江宁数健康大数据运营有限公司、海南乐城真实世界研究院、上海申康医院发展中心、中国医学科学院阜外医院、首都医科大学附属北京安定医院、宁波市第二医院、河北省儿童医院、中国中医科学院西苑医院、青岛市第三人民医 院、长治市人民医院、艾昆纬企业管理咨询(上海)有限公司、阿斯利康投资(中国)有限公司、复旦大学智能医学研究院、上海交通大学转化医学研究院、南京医科大学公共卫生学院、深圳理工大学、西安交通大学药学院、新疆医科大学中医学院、石河子大学公共卫生学院.
本文件主要起草人:孙凤、詹思延、宋海波、邓刚、王丹、张敬谊、林鸿波、朱宇、孙烨祥、殷玥琪、唐玲、叶栋、杜芳菲、李潮、袁玮鸿、何萍、夏寒、郭娟娟、张伟丽、洪晶、陈亚红、丰雷、 王巍巍、胡爱荣、陈琴、股铮、李静、MuiVanZandt、肖阳、刘雷、吕晖、刘俊昌、王聪慧、唐少文、杨智荣、高乐、杨帆、高铸烨、曲华、刘玉强、郭恒、张向辉、SengChanYou、SangWoukCho、谢俊卿、EricYukFaiWan、陈勇、步凡、冯梦凌、杨祖罐、杨爱民、胥洋、杨羽、郑泳祺、陈晓薇、章萌、刘力嘉、于业贤、宋宇飞、王馨平、冯志强、龙子临、陈博庆、孙瑞、李德阳.
引言
通用数据模型在医疗领域真实世界数据治理中的重要性不仅体现在其跨系统、跨平台的数据一致性与互操作性,更在于解决当前未采用通用数据模型时存在的问题.多源数据结构与术语异构导致的可比性不足,缺乏统一的数据治理工具或方法,影响过程可追溯与结果复核:单个研究反复开 展数据治理工作,导致研究成本高、周期长.通用数据模型通过对数据结构的标准化,使不同来源的数据集成,便于分析和共享,这不仅能够提升数据质量和利用效率,减少重复的数据清洗和转换工作,还可以支持构建联邦式数据网络,在协同分析的同时无需共享患者层级的数据,从而支持科学决策,提高监管效率.
近年来,各国监管机构纷纷探索将真实世界数据纳入药品全生命周期监管.在真实世界研究中,医疗领域真实世界数据作为重要数据来源,在治理过程中尤其依赖于通用数据模型的支撑,通过标准化的数据结构和流程实现跨机构、跨人群的研究可比性与可重复性.
在我国先后发布的《真实世界证据支持药物研发与审评的指导原则(试行)》和《药物真实世界研究设计与方案框架指导原则(试行)》等政策文件中数据治理部分已提出鼓励采用通用数据模型, 但尚缺乏针对多来源数据整合场景下通用数据模型构建与使用的系统性技术规范.基于上述背景,本文件针对支持医疗领域真实世界数据的通用数据模型构建过程中所涉及的关键技术进行说明.