CCS C 10 ICS11.120.10
T
团体标准
T/SBIAORG0002-2025
基于大语言模型的药物警戒个例安全性 报告人工智能辅助信息提取规范 Specifications of AI-assisted data extraction for individual case safety reports in pharmacovigilance based onlargelanguage models
2025-05-08发布2025-05-09实施 上海市生物医药行业协会发布
T/SBIAORG 0002-2025
目次
前言 1范围 2规范性引用文件 3术语和定义 4总体考量 5大语言模型在个例安全性报告信息提取场景下的系统实施 6系统使用和质量控制 7数据安全和隐私保护 8利益相关方沟通 参考文献.
T/SBIAORG 0002-2025
前言
起草。
请注意本文件的某些内容可能涉及专利。
本文件的发布机构不承担识别专利的责任。
本文件由上海市药品和医疗器械不良反应监测中心提出。
本文件由上海市生物医药行业协会归口。
本文件起草单位:上海市药品和医疗器械不良反应监测中心、上海罗氏制药有限公司、上海商汤科技 开发有限公司、上海复宏汉霖生物制药有限公司、上海复星医药(集团)股份有限公司、江苏恒瑞医药股份 有限公司。
本文件主要起草人:许晋、胡骏、巢艾伦、杨依哈、栾国琴、黄天娇、袁博、步伐、浦义虎、韩澎、黎洋。
T/SBIAORG 0002-2025
基于大语言模型的药物警戒个例安全性 报告人工智能辅助信息提取规范
1范围
本文件规定了应用大语言模型技术处理药物警戒个例安全性报告数据的考量点与要求。
本文件适用于药品上市许可持有人、境外上市许可持有人的境内责任人、药品经营企业等组织和机 构。
此外,也能为药品监管部门、医疗机构及相关技术开发商和服务提供商,在开发、实施和使用基于大 语言模型的药物警戒数据处理系统时提供参考。
2规范性引用文件
本文件没有规范性引用文件。
3术语和定义
下列术语和定义适用于本文件。
3. 1 药物警戒pharmacovigilance 对药品不良反应及其他与用药有关的有害反应进行监测、识别、评估和控制。
[来源:《中华人民共和国药品管理法》.第十二条] 3. 2 大语言模型large language model;LLM 生成式人工智能的一种,专注于文本生成的模型。
[来源:《欧洲药品管理局在监管科学及药品监管活动中使用大型语言模型的指导原则》,第二部分] 3. 3 生成式人工智能技术generative artificial intelligence 具有文本、图片、音频、视频等内容生成能力的模型及相关技术。
[来源:《生成式人工智能服务管理暂行办法》,第二十二条] 3. 4 微调fine-tuning 为提升人工智能模型的预测精确度,一种先以大型广泛领域数据集训练,再以小型专门领域数据集 继续训练的附加训练技术。
[来源 :GB/T 41867-2022,3.2.31] 3. 5 多模态数据multi-modal data 多种形态的数据。
注:包含结构化数据(例如业务系统数据等)半结构化数据(例如XML文件,JSON文件等)和非结构化数据(例如 文本、语音和图像视频等)。
[来源:GB/T 42135-2022.3.1]
T/SBIAORG 0002-2025 3.6 知识knowledge 通过学习、实践或探索所获得的认识、判断或技能。
[来源:GB/T23703.2-2010,2.1] 3.7 知识库knowledge base 用于知识管理的一种特殊的数据库,以使于有关领域知识的采集、整理及提取。
3.8 词元token 文档中非空的连续字形或音素序列。
[来源:1SO 24611;2012,3.21] 3. 9 提示词prompt 提示语 使用大模型进行微调或下游任务处理时,插入到输人样本中的指令或信息对象。
[来源:GB/T 45288.1-2025,3.5] 3.10 提示工程promptengineering 人工智能中执行任务的描述文本被嵌人到输入中的一个额念。
4总体考量
在大语言模型系统的开发、部署、验证和质量控制的全生命周期中,应遵循以下原则,以确保安全、负 责和有效地使用LLM系统。
a)人工审查和监督(HumanOversight):确保LLM系统在整个开发和使用过程中始终有人工审查 和监督。
b)可问责(Accountability):建立明确的责任分配和归属制度。
c)透明性(Transparency):保持系统的透明度,并能够向相关方提供准确和...