中华人民共和国国家标准
GB/T 35537-2017
Requirements of the high-throughput gene sequencing result evaluation
中国国家标准化管理委员会 中华人民共和国国家质量监督检验检疫总局 发布
前言
本标准按照GB/T1.1-2009给出的规则起草.
本标准由全国生化检测标准化技术委员会(SAC/TC387)提出并归口.
华大基因科技有限公司、中国食品药品检定研究院. 本标准起草单位:深圳华大基因研究院、广东省标准化研究院、广东产品质量监督检验研究院、深圳
本标准主要起草人:杨焕明、徐讯、蒋慧、章文蔚、席风、王娟、谭嘉力、谢强、杜佳婷、李倩一、李岱怡、程磊、于竞、胡藏、黄杰、宋祚锯、张娟.
高通量基因测序结果评价要求
1范围
本标准规定了高通量基因测序结果评价要求涉及的术语和定义、高通量基因测序结果评价的评价指标和判定依据.
本标准适用于非单分子测序的基于DNA序列研究的连接酶法测序和聚合酵法测序的结果评价.
2规范性引用文件
下列文件对于本文件的应用是必不可少的.凡是注日期的引用文件,仅注日期的版本适用于本文件.凡是不注日期的引用文件,其最新版本(包括的修改单)适用于本文件.
GB/T30989高通量基因测序技术规程
3术语和定义及缩略语
3.1术语和定义
GB/T30989界定的以及下列术语和定义适用于本文件.
3.1.1 高通量基因测序结果high-throughput gene sequencingresult测序仪器所产生的数据结果,又称为测序结果.
3.1.2测序平均长度average read length of sequencing注:通常以碱基数表示. 测序仪器单次测序能达到的平均读长,
3.1.3
3.1.4
碱基测序准确率sequencingaccuracy
对已知序列的参考品进行测序,经过碱基识别后比对到已知序列上,统计比对正确的碱基数占测序获得的总碱基数比例.
3.1.5
聚合酶法测序sequencingby synthesis
基于碱基互补原理,在聚合酶参与下的基因测序方法.
3.1.6
连接酶法测序sequencingby ligation
基于碱基互补原理,在连接酵参与下的基因测序方法.
3.2缩略语
下列缩略语适用于本文件.DNA-脱氧核糖核酸(deoxyribonucleic acid)PCR-聚合酶链式反应(polymerase chain reaction)
4高通量基因测序结果评价指标
4.1评价指标与分类
经过高通量测序过程中参数指标统计分析,按照测序方法的不同,对高通量基因测序结果评价分为连接酶法测序评价和聚合酵法测序评价,选择测序通量、碱基测序准确率、测序平均长度这三个能够反 映单次测序结果进行评价.
4.2连接酶法测序结果评价要求
连接酶法测序结果评价如表1所示.
表1连接酶法测序结果评价要求
评价指标 要求测序通量 ≥500 M Reads碱基测序准确率 99.0%测序平均长度 dq0
4.3聚合酶法测序结果评价要求
聚合酶法测序结果评价如表2所示.
表2聚合酶法测序结果评价要求
评价指标 要求测序通量 ≥3 M Reads测序平均长度 碱基测序准确率 >99 0%
5评价指标检测方法
5.1测序通量
按照各测序仪器厂商提供的测序样品制备流程和测序操作进行待测序样品处理、质控和测序,待测序反应完成后,测序仪使用测序信号收集器(根据标记信号的不同选用相应不同的收集器,如图像信号收集器中的高精度CMOS,电信号收集器中的半导体传感器,光谱信号搜集器中的光谱成像仪等),对测序信号完成搜集.再通过信号分析软件,对采集得到的信号进行分析,将信号图转变为核苷酸序列信息.通常以序列数表示.单末端或双末编测序产生的一条序列信息,计为一条序列数.
5.2碱基测序准确率
对已知序列的参考品进行测序,经过碱基识别后比对到已知序列上,统计比对正确的碱基数占测序获得的总碱基数比例,通常以百分数表示.
5.3测序平均长度
根据测序通量所得到的序列数,统计序列数的碱基长度,计算序列数总长度.测序平均长度等于序列数总长度与序列数总数的比值.
6结果评价程序
测序仪输出序列信息后,统计测序通量和测序平均长度,并对测序过程中加人的测序参考品进行分析,将测序参考品得到的原始序列比对到参考品的标准基因组序列,统计基于碱基(base)测序准确率.测序数据处理标准流程如图1所示,处理完成后输出碱基测序准确率指标.测序参考品的测序过程,参见附录A.
图1高通量基因测序仪测序数据处理流程图