高通量测序技术

2024-02-15

    高通量测序技术 :

具有代表性的测序公司与测序技术包括Roche/454的焦磷酸测序,Illumina的边合成边测序,ABI/SLOiD的连接测序。

测序技术的核心目的是获得DNA或RNA片段中的碱基序列,基本原理是首先将基因组打断成小的片段,然后测序,最后通过生物信息学分析技术实现片段的拼接,并在此基础上有一系列的应用。

经过几十年的发展,测序技术已经经过了几代的发展历程。第一代以ABI的3500为代表,主要采用Sanger毛细管电泳法测序。Sanger测序采用DNA复制原理,反应体系中包括目标DNA片断、脱氧三磷酸核苷酸(dNTP)、双脱氧三磷酸核苷酸(ddNTP)、测序引物及DNA聚合酶等。测序反应的核心就是其使用的ddNTP:由于缺少3’-OH基团,不具有与另一个dNTP连接形成磷酸二酯键的能力,这些ddNTP可用来中止DNA链的延伸。此外,这些ddNTP上连接有放射性同位素或荧光标记基团,因此可以被自动化的仪器或凝胶成像系统检测到。该测序方法的读长能达到600~1000bp,优点是高读长、准确性高、能很好地处理重复序列和多聚序列;缺点是通量低(只有1Mb),样品制备成本高,难以做大量的平行测序。

二代测序技术就是高通量测序技术。常见的高通量测序技术普遍具有通量高、成本低、读长短、错误率高等特点,而不同的测序技术和设备之间又存在通量、读长的区别。测序原理方面,Roche GS FLX System采用的是一种基于焦磷酸测序原理而建立起来的高通量基因组测序系统。在测序时,使用了一种称为“Pico TiterPlate”(PTP)的平板,它含有160多万个由光纤组成的孔,孔中载有化学发光反应所需的各种酶和底物。测序开始时,放置在四个单独的试剂瓶里的四种碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在各种酶的作用下,经过一个合成反应和一个化学发光反应,最终将荧光素氧化成氧化荧光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号,由此一一对应,就可以准确、快速地确定待测模板的碱基序列。

Illumina Hiseq是一种基于单分子簇的边合成边测序技术,其原理是基于专有的可逆终止化学反应。测序时,将基因组DNA的随机片段附着到光学透明的玻璃表面(即Flow cell),这些DNA片段经过延伸和桥式扩增后,在Flow cell上形成了数以亿计的Cluster,每个Cluster是具有数千份相同模板的单分子簇。然后,利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的SBS(边合成边测序)技术对待测的模板DNA进行测序。SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的参考序列,把SOLiD颜色序列定位到参考序列上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在的SNP位点。

无论哪种测序平台,大概的测序流程都包括DNA提取、文库构建、簇生成、测序、测序数据分析几个步骤。以Illumina平台为例,DNA提取后需要进行浓度、纯度的质检。文库的构建过程包括基因组核酸打断、补齐黏性末端、加接头、加条形码标记、定性及定量的质检等。然后是将核酸片段种到芯片上进行扩增的簇生成,之后放到测序仪上进行测序,利用仪器自带的软件读取原始序列。最后进行质量控制、比对等初步分析,后期再进行更专业、更有目的性的生物信息学分析。

随着测序技术及生物信息学技术的发展,二代测序短读长、错误率高的问题已经逐渐被解决,同时,测序成本的急剧降低使得大规模的基因组测序成为可能。Illumina最新开发的HiSeq X10通过联合10台HiSeq,实现了成本的再度下降,使得基因组测序正式进入1000美元时代。二代测序技术也在越来越多的层面开展应用,一方面是全基因组测序、全外显子组测序及目标区域测序等DNA层面的测序,鉴定不同人种、群体及特定表型下的基因型差异。另一方面,通过基于RNA-Seq、miRNA-Seq、lncRNA-Seq的完整转录组研究,为系统全面地了解基因功能提供了大量的数据基础。此外,ChIP-Seq、重亚硫酸盐测序等多种测序技术在各种表观、调控功能的研究中得到了极大的应用和推广。这些相关技术在普通人群层面、细胞层面、组织层面、疾病人群及动植物等多个领域的应用,为理解正常情况下不同人种特异的遗传变异、组织细胞的特异性表达与调控机制等提供了理论依据,同时为多种复杂疾病、罕见疾病的机制研究提供了重要的技术支持,鉴定了一系列疾病相关的常见变异、罕见变异及基因,为理解疾病的致病机理、为疾病的精准治疗提供了重要的支持。同时,这些技术在动植物育种中的应用也使得相关的育种培养更加精细、精准化。随着测序成本的进一步降低,精准医学的概念日益深入人心,高通量测序技术将不只在基础科研层面得到应用,还将在老百姓的现实生活有更大的应用前景,包括目前的无创产前检查、肿瘤的精准化用药及未来更多的精准化治疗方案。

随着高通量测序技术的发展,该技术已经在心理疾患的遗传学研究中得到了成功的应用。最著名的例子是国际合作组织CONVERGE使用低覆盖度的二代测序鉴别出了两个与重度复发型抑郁症相关的基因。