中华人民共和国国家标准
GB/T24779-2009
Guidance on the validation of (Q)SAR models for chemicalsproperties-Health effects
中国国家标准化管理委员会 中华人民共和国国家质量监督检验检疫总局 发布
前言
活性关系[(Q)SAR]模型的验证的指南文件》(英文版),其有关的技术内容与上述文件完全一致. 本标准参考采用经济合作与发展组织(OECD)指南文件ENV/JM/MONO(2007)2《(定量)结构
本标准附录A为资料性附录.
本标准由全国危险化学品管理标准化技术委员会(SAC/TC251)提出并归口.
本标准负责起草单位:国家质检总局进出口化学品安全研究中心.
江苏出人境检验检疫局. 本标准参加起草单位:中国检验检疫科学研究院、湖北出人境检验检疫局、中化化工标准化研究所、
本标准主要起草人:程艳、陈会明、李晞、宋乃宁、周新、崔海容、郭坚.
本标准系首次发布.
引言
欧盟于2007年6月1日立法通过《化学品的注册、评估、授权和限制法规(以下简称REACH法国为应对欧盟REACH法规,制定了化学品安全系列标准,等同转化了欧盟REACH法规的相关技术 规),并于2008年6月1日正式实施.该法规实施以后对进人欧盟市场上的化学品进行统一管理.我内容.
欧盟REACH法规和联合国《全球化学品统一分类和标签制度》(GHS)为了减少动物试验,明确规定了(Q)SAR模型预测方法在特定情况下可用于化学品性质的预测.
本标准是为了应对欧盟REACH法规,在技术指标上参考采用了OECD指南文件ENV/JM/规EUR21866EN2005《(定量)结构-活性关系的特征:初步指南3(英文版),并且其有关的技术内容与上述文件完全一致,建立了化学品卫生毒理性质(Q)SAR模型的验证指南.
化学品性质(Q)SAR模型的验证指南 卫生毒理性质
1范围
本标准规定了化学品卫生毒理性质(Q)SAR模型的验证指南.本标准适用于现有的以及将来开发的各种(Q)SAR模型.
2术语和定义
下列术语和定义适用于本标准.
2.1
分子描述符moleculardescriptor
分子的结构或物理化学性质,或者能够代表分子特殊性质的分子结构的一部分,被用作(Q)SAR模型的独立变量.
2.2终点endpoint 能被测量因而能被模型化的任何物理化学的、生物的或者环境的效应.
2.3应用范国(AD)applicabilitydomain
模型在给定的可靠性条件下,对化学品性质进行预测时的响应和化学结构的空间范围.
从化学品的结构和/或物理化学性质的信息来预测终点的方法和过程.
2.5建模集training set
用来建立(Q)SAR模型的化合物,能从中得到有关化合物的测量性质或效应.
2.6
测试集test set
测试集与建模集相对应,是指不包含在建模集中的一系列化合物,被用于对(Q)SAR模型的预测能力进行评价.
3验证原则
3.1确定的终点;3.2明确的运算算法: 3.3确定的应用范围:3.4对符合度、适用度和预测能力的合适的评价:3.5如果可能,提供机制解释.
4验证原则闻述
4.1确定的终点
4.1.1在采用(Q)SAR模型对化学品卫生毒理性质进行预测时,常用的终点为卫生毒理学参数,包括
半数致死剂量(LD).无可见有害作用水平(NOAEL)、急性毒性、皮肤刺激性、皮肤腐蚀性、眼刺激性、眼腐蚀性、皮肤过敏性、染色体型畸变、神经毒性、细胞存活率、光毒性等.
4.1.2在采用(Q)SAR模型对化学品卫生毒理性质进行预测时常用的分子描述符包括正辛醇/水分 配系数、疏水性、亲电性、电荷性、拓扑结构等.
4.1.3一个确定的终点至少包含以下因素:a)产生建模集数据的详细信息;b)测试方案的不同不会导致终点数值的明显不同: c)测试方案内部因素的不同不会导致结果的不同:d)(Q)SAR预测的化学品对象的范围包含在测试方案的化学品对象范围内:e)(Q)SAR预测的终点与测试方案的终点相同;{)科学定义的终点能够反映化学品结构间的不同.
4.2明确的运算算法
当评价(Q)SAR预测模型的运算算法时,需要考虑下列因素:
a)终点数值和描述符数值的数据集:b)对描述符的来源和测量的说明;c)对测试集和建模集的描述,并对异常点的别除说明理由; d)对数学模型进行描述;e)对模型运行进行描述的统计学参数:f)构成(Q)SAR预测模型的参数以及参数数值.
4.3确定的应用范围
4.3.1在(Q)SAR预测模型的适用广度和预测结果的可靠性之间存在着平衡:模型的适用范围越广泛,预测结果的整体可靠性越低.
4.3.2(Q)SAR模型的应用范围需要考虑以下因素:a)建立与应用范围相关联的可信度范围;b)建立对应用范围的限制方法: c)评价应用范围的限制方法,以更好地理解其长处、局限性和适用性;d)将应用范围限制方法与传统的统计学方法联合应用.
4.4对符合度、适用度和预测能力的合适的评价
4.4.1模型应具有统计学意义,许多统计学方法都能用来评价(Q)SAR模型的符合度、适用度和预测 能力,并对模型运行进行评价.
4.4.2一个具有高度统计学可执行意义的模型包括以下一个或几个特征:
a)当采用最少数量的变量时,具有最高的可能的预测能力;b)预测变量之间的关联很小.
4.4.3一个具有低的统计学可执行意义的模型包括以下一个或几个特征:
4.5如果可能提供机制解释
鼓励在对(Q)SAR模型验证过程中寻找出机制解释,能够增加对于统计有效性和应用范围的理解.
5验证的报告格式
5.1(Q)SAR模型验证的报告格式是构建和总结模型重要信息的框架,包括: