5.1 概述
靶向区域测序是对感兴趣的基因区域设计芯片和探针,进行区域DNA富集后高精确度的序列分析,相比于全基因组和转录组测序,靶向区域测序的目标序列较少,可达到的测序深度较高,成本较低,可以获得质量较高的测序结果。该测序常用于临床上进行疾病相关致病基因和易感基因的信息获取,用于临床指导个性化治疗方案的制定。
5.2 生物信息数据分析流程
5.2.1 测序质量控制
去除两端接头序列和污染,选取测序质量较高的碱基(base quality score>20)。
5.2.2 测序序列比对
用bowtie或者BWA等方法,与已经基因组进行序列比较,选择质量较高的序列(quality score >20)。
5.2.3 去除重复
序列PCR扩增过程中,可能会出现同一段序列多次扩增,导致假阳性结果的出现,通常的做法是将这些重复的序列去除。
5.2.4 测序序列层叠分析
在获得质量较高的测序序列后,进行单个基因组位点的碱基层叠分析,从而可以得到单个碱基的详细信息,包括单个碱基测序深度,出现突变的碱基位置和数量,SV区域。进一步分析后可用于预测个体水平或者群体水平的基因变化趋势,进行疾病的关联性分析和群体进化根源分析。
5.2.5 分析结果注释
对获得的基因结构变化信息,进行统计学分析比较,产出包括真实的基因突变确认,基因结构变化确定,基因区域拷贝数确认,以及变化的基因对于个体疾病发展的影响预测。