T/SDTS
T/SDTS002-2025
山东省茶叶学会发布
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草.
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的责任.
本文件由山东省茶叶学会提出并归口.
本文件起草单位:山东省农业科学院茶叶研究所、青岛农业大学.
本文件主要起草人:丁兆堂、王玉、孙立涛、申加枝、范凯、钱文俊.
茶树基因型与表型关联建模技术规范
1范围
本文件规定了茶树基因型与表型关联建模的技术要求,包括数据预处理、群体遗传结构分析、关联分析方法、环境因素校正及结果解读等内容.
本文件适用于茶树品种选育、抗逆性研究及品质改良等领域.
2规范性引用文件
引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款.其中,注日期的的修改单)适用于本文件.
无相关引用文件.
3术语和定义
3.1
基因型
指茶树个体或群体在基因水平上的遗传构成.
3.2
表型
指茶树在特定环境条件下表现出的形态、生理、生化及产量相关特征.
3.3
关联分析
研究基因型与表型性状之间的统计关系,主要方法包括全基因组关联分析(GWAS)和数量性状位点(QTL)分析.
4数据预处理
4.1基因型数据
采用高通量测序(如WGS、GBS)获取SNP数据.4.1.1质量控制:使用FastQC检查数据质量,Trimmomatic去除低质量序列.4.1.2比对参考基因组:使用BWA或HISAT2对序列比对至茶树参考基因组.4.1.3变异检测:采用GATK、SAMtools进行SNP/INDEL检测,筛选质量值≥30、覆盖深度≥4.1.4缺失数据填补:使用BEAGLE或Impute2处理缺失基因型数据. 10的高质量变异位点.
T/SDTS
4.2表型数据
5群体遗传结构分析
6关联建模分析
6.1全基因组关联分析(GTAS)
6.2QTL作图分析
7环境因素校正与多变量分析
8结果解读与育种应用
9附录
9.1实验方法
9.1.1高通量测序实验方法
4.2.1采用标准化方法(Z-score或Min-Max归一化)处理连续变量.4.2.2计算最佳线性无偏预测值(BLUP)降低环境误差.4.2.3采用PCA或MDS去除异常值,确保数据质量.
5.1采用PCA(主成分分析)、MDS(多维尺度分析)评估群体结构.5.2计算LD衰减(连锁不平衡衰减)优化标记选择策略.5.3使用STRUCTURE、ADMIXTURE软件推测茶树种质的遗传背景.
6.1.1单标记分析(SMA):采用广义线性模型(GLM),适用于简单性状.6.1.3FarmCPU:结合固定效应和随机效应,提高检测效能. 6.1.2混合线性模型(MLM):结合PCA和亲缘关系矩阵,适用于复杂性状.6.1.4MLMM:适用于多基因控制性状,提高检测效率.
6.2.2结合GWAS与QTL作图进行联合分析,提高候选基因识别精度. 6.2.1采用连锁分析或全基因组关联分析进行QTL作图.
7.1采用LMM(线性混合模型)或BLUP方法剔除非遗传变异. 7.2多环境关联分析(ME-GWAS)提高基因鉴定的稳定性.7.3结合机器学习方法(XGBoost、随机森林)优化基因-表型预测模型.
8.1结合GWAS和QTL.分析筛选候选基因,并进行功能注释.8.2采用基因共表达网络分析(WGCNA)挖掘功能相关基因模块.8.3结合标记辅助选择(MAS).优化茶树品种选育策略.8.4通过CRISPR/Cas9基因编辑进行功能验证.
附录内容包括实验方法、数据格式示例、统计分析参数等.
DNA提取:采用CTAB法或商业化DNA提取试剂盒,从茶树叶片或嫩梢中提取高质量的