中华人民共和国国家标准
GB/T24780-2009
Guidance on the validation of (Q)SAR models for chemicals propertiesPhysicochemical properties
中国国家标准化管理委员会 中华人民共和国国家质量监督检验检疫总局 发布
前言
活性关系[(Q)SAR]模型的验证的指南文件》(英文版),其有关的技术内容与上述文件完全一致. 本标准参考采用经济合作与发展组织(OECD)指南文件ENV/JM/MONO(2007)2C(定量)结构
本标准附录A为资料性附录.
本标准由全国危险化学品管理标准化技术委员会(SAC/TC251)提出并归口.
本标准负责起草单位:国家质检总局进出口化学品安全研究中心.
山东出人境检验检疫局. 本标准参加起草单位:中国检验检疫科学研究院、湖北出人境检验检疫局、中化化工标准化研究所、
本标准主要起草人:程艳、陈会明、李骄、宋乃宁、周新、崔海容、郭坚.
本标准系首次发布.
引言
欧盟于2007年6月1日立法通过《化学品的注册、评估、授权和限制法规)(以下简称REACH法规),并于2008年6月1日正式实施.该法规实施以后对进人欧盟市场上的化学品进行统一管理.我 国为应对欧盟REACH法规,制定了化学品安全系列标准,等同转化了欧盟REACH法规的相关技术内容.
欧盟REACH法规和联合国《全球化学品统一分类和标签制度》(GHS)为了减少动物试验,明确规定了(Q)SAR模型预测方法在特定情况下可用于化学品性质的预测.
本标准是为了应对欧盟REACH法规,在技术指标上参考采用了OECD指南文件ENV/JM/MONO(2007)2《(定量)结构-活性关系[(Q)SAR3模型的验证的指南文件》(英文版)和REACH技术法规EUR21866EN2005((定量)结构-活性关系的特征:初步指南3(英文版),并且其有关的技术内容与上述文件完全一致,建立了化学品理化性质(Q)SAR模型的验证指南.
化学品性质(Q)SAR模型的验证指南 理化性质
1范围
本标准规定了化学品理化性质(Q)SAR模型的验证指南.本标准适用于现有的以及将来开发的各种(Q)SAR模型.
2术语和定义
下列术语和定义适用于本标准.
对模型运行进行评价的信息量的最小绝对量,表达了在建模集中模型描述符估算变量的程度.
适用度robustness
当对建模集实施干扰以及当模型从受干扰的建模集中重新建立时,模型参数的稳定性以及因此而导致的预测结果的稳定性,提供了模型参数对建模集变化的敏感性的指示.
2.3
预测能力predictivity
对所建模型预测化学物质性质的能力的评价,采用对测试集中的化学物质性质的预测来进行评价.
3验证原则
3.1确定的终点. 3.2明确的运算算法.3.3确定的应用范围.3.4对符合度、适用度和预测能力的合适的评价.3.5如果可能,提供机制解释.
4验证原则闻述
4.1确定的终点
4.1.1在采用(Q)SAR模型对化学品理化性质进行预测时,常用的终点为物理化学参数,包括熔点/凝点、沸点、蒸汽压、水溶解度、正辛醇/水分配系数(K)、相对密度、表面张力、闪点等.4.1.2在采用(Q)SAR模型对化学品理化性质进行预测时,常用的描述符包括正辛醇/水分配系数 (K)、水溶解度、分子质量、分子体积等.4.1.3一个确定的终点至少包含以下因素:a)产生建模集数据的详细信息;b)测试方案的不同不会导致终点数值的明显不同:d)(Q)SAR预测的化学品对象的范围包含在测试方案的化学品对象范围内: c)测试方案内部因素的不同不会导致结果的不同:e)(Q)SAR预测的终点与测试方案的终点相同;
GB/T 24780-2009
f)科学定义的终点能够反映化学品结构间的不同.
4.2明确的运算算法
当评价(Q)SAR预测模型的运算算法时,需要考虑下列因素:
a)终点数值和描述符数值的数据集:b)对描述符的来源和测量的说明:c)对测试集和建模集的描述,并对异常点的剔除说明理由;d)对数学模型进行描述;e)对模型运行进行描述的统计学参数; f)构成(Q)SAR预测模型的参数以及参数数值.
4.3确定的应用范围
4.3.1(Q)SAR的应用范围是多维空间中的一个理论区域,在这个区域中(Q)SAR模型的预测具有一定的可靠性.
4.3.2(Q)SAR模型的应用范围需要考虑以下因素:a)建立与应用范围相关联的可信度范围;b)建立对应用范围的限制方法:c)评价应用范围的限制方法,以更好地理解其长处、局限性和适用性:d)将应用范围限制方法与传统的统计学方法联合应用.
4.4对符合度、适用度和预测能力的合适的评价
4.4.1包含两类信息:a)模型的内部运行的评价,包括符合度和适用度,主要是应用建模集来确定;
b)模型的外部评价,包括预测能力,主要是采用合适的测试集来确定.
4.4.3一个具有低的统计学可执行意义的模型包括以下一个或几个特征:a)缺乏一个或多个相关变量,如:没有足够的拟合能力; b)在拟合度和预测能力之间具有显著差别;c)一个或多个(噪声)变量偶尔会与响应相关:d)预测变量之间有高度的相关性.
4.5如果可能,提供机制解释
4.5.1鼓励在对(Q)SAR模型验证过程中寻找出机制解释,能够增加对于统计有效性和应用范围的理解. 4.5.2当机制解释是可能的时候,将在前述原则的基础上更增进了(Q)SAR模型预测的可靠性.
5验证的报告格式
5.1(Q)SAR模型验证的报告格式是构建和总结模型重要信息的框架,包括:
a)模型的来源;b)模型的类型;c)模型的验证;d)可能的模型应用,等.
5.2附录A给出了化学品理化性质的(Q)SAR模型的验证指南示例.