基因是指携带有遗传信息的DNA序列,是控制性状的基本遗传单位,一段具有功能性的DNA序列。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。人类约有两万至两万五千个基因。广义上的基因检测指通过血液、组织或细胞分泌物,对染色体、DNA分子进行检测的一系列技术。目前在医疗领域,基因检测除直接人体DNA分子外,还可通过检测人体内微生物基因信息,判断受检者健康状况和疾病风险。
一般情况下,基因通过复制把遗传信息忠实地传给下一代,使其呈现出与亲体相似的性状如身高、血型等。有些基因与人体健康状况密切相关,其不一定直接导致某种疾病发生,也可能通过影响个体,如对某些病毒、细菌的免疫力,间接“参与”疾病发生过程。如果某些基因在复制过程中出现错误,或受后天环境影响发生突变也可能增加个体患病几率。而了解这些基因信息,有助于人类更好地应对疾病和健康风险。
基因检测技术分类
目前应用较广的基因检测技术大致分三类:基因测序、以核酸扩增为基础的PCR技术,以荧光杂交检测为基础的FISH技术。这三类技术沟通构成了基因检测基础,大部分基因检测项目都有赖于这三项基础技术开展。此外,基因芯片技术应用范围也较广。
PCR技术(聚合酶链式反应技术),可放大、扩增特定DNA片段,通常用于人体基因少量突变位点检测、细菌或病毒基因检测,并在二代基因测序过程中扮演重要角色。该技术优点是灵敏度高、操作相对简便,但中间样本制备过程可能存在交叉污染。
FISH技术(荧光原位杂交技术),可利用已知的DNA变异序列,与被检测的样本DNA序列杂交、互补配对,从而发现样本DNA的异常情况。基因芯片技术则是将大量已知DNA序列做成探针,集成在同一芯片上与标记样品分子进行杂交,从而获得样本序列信息。该技术优点是成本相对较低、效率较高,但难以发现未知区域信息。
基因芯片又称DNA微阵列(DNA micro-array), 是把大量已知序列探针集成在同一个基片(如玻片、膜)上, 经过标记的若干靶核苷酸序列与芯片特定位点上的探针杂交, 通过检测杂交信号, 对生物细胞或组织中大量的基因信息进行分析。
基因测序技术,采用生物化学和光学技术结合,将DNA序列中ATCG四种碱基逐一转化为电化学信号,通过光学检测设备识读,报告图为四种颜色的峰谷图,根据信号强弱来识别四种碱基。测序技术的优势在于,可以逐一读出全部基因序列,双向测序是基因检测结果金标准,可以用于检测未知基因;缺点是测序对样本DNA浓度和纯度要求比较高,实验操作技术要求比较高,且每次实验只能检测一个位点或一段序列。
与PCR和FISH技术相比,基因测序技术可直接读取DNA分子的30亿个碱基序列,具有高通量、数据量大的特点。其中二代基因测序是当下基因检测最热门的技术。基因测序技术的缺点是操作复杂、对样本DNA浓度和纯度要求较高,且数据庞杂。
表1. 基因检测技术对比
基因测序三代技术
基因测序从1977年的第一代Sanger测序技术发展至今,已经有40年的发展历程。1987年,Applied Biosciences公司基于Sanger测序原理发布第一台自动测序仪,第一代测序读长长,准确率高,后来成为人类基因组计划的主力机型,而现在也依然是测序的金标准。尽管第一代测序在准确度的优势明显,但是存在成本高、通量低等缺点,制约其大规模商业应用。经过技术发展和流程优化,以罗氏454、illumina、Life的Solid系统为主的第二代测序技术出现,促使测序成本以超摩尔定律下降,并且大幅提高测序速度,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周。但是缺点就是读长太短,后续需要通过生物信息学软件进行数据组装。2008-2010年密集出现的第三代测序技术可谓惊艳全球。第三代测序技术是单分子测序,由于不需要对样本进行扩增等前期准备工作,测序时间大幅缩小,理论准确性将提高,成本进一步下降,相比于第二代测序技术优势明显,但是目前由于准确性低、测序信号易丢失等因素,尚且处于科研阶段。第四代测序技术更加先进,但也存在第三代技术的问题,短期内无法商用。
第一代基因测序法即Sanger法,采用的是直接测序法,是1975年由桑格(Sanger)和考尔森(Coulson)提出的经典的链终止法。其基本原理即双脱氧核苷三磷酸(ddNTP)缺乏PCR延伸所需的3′-OH,因此每当DNA链加入分子ddNTP,延伸便终止。每一次DNA测序是由4个独立的反应组成,将模板、引物和4种含有不同的放射性同位素标记的核苷酸的ddNTP分别与DNA聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的DNA片段存在于反应体系中,具有单个碱基差别的DNA序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带,依据电泳条带读取DNA双链的碱基序列。第一代基因测序技术代表为ABI公司3700系列荧光标记自动核酸分析仪,Sanger测序法是测序技术的金标准,其测序长度可达1000bp,准确性几乎100%,但存在通量低、成本高、耗时长的不足,严重影响其大规模应用。人类基因组计划主要是基于第一代基因测序技术平台。
图1. 第一代测序法原理
第二代测序技术(也称下一代测序NGS,大规模平行测序Massively Parallel Sequencing,高通量测序High-throughput sequencing),是2005年以来发展的新一代测序技术。核心原理是边合成边测序,其基本步骤包括文库制备、单克隆DNA簇的产生和测序反应,可以同时并行分析阵列上的DNA样本。与第一代测序技术相比,第二代测序技术具有高通量、低读长、敏感性高、成本低的特点。代表性测序平台主要包括Roche公司的454测序平台、Illumina公司的Solexa测序平台、ABI公司的Solid系统、Life Technologies公司的Ion Torrent个人化操作基因组测序仪。第二代测序技术在大幅提高了测序速度的同时,还大大地降低了测序成本,并且保持了较高准确性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但其序列读长方面比起第一代测序技术则要短很多,大多只有100bp-150bp,这就意味着需要更严格复杂的序列拼接技术,不仅可能产生误差,也花费了部分时间。目前第二代测序技术是主流,约占测序设备的80%以上。
图2. 第二代测序法原理
第三代测序技术以纳米孔单分子测序技术为代表,最大的特点就是单分子测序,测序过程无需进行PCR扩增。基本原理是:DNA聚合酶和模板结合,4色荧色标记4种碱基(即dNTP),在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。该技术简化了样品处理过程,避免了扩增可能引入的错配,且不受鸟嘌呤和胞嘧啶或腺嘌呤和胸腺嘧啶含量的影响,具有速度快和长读长等优点,但通量较低,测序准确率较差,目前尚不成熟。第三代测序平台包括美国Helicos公司的HeliScope遗传分析系统和Pacific的PacBio RS单分子实时测序系统。
表2.基因测序三代技术及仪器平台对比
前述三种基因检测技术,包括基因测序技术、PCR技术、FISH技术等,最早都集中出现在上世纪七、八十年代。其中,PCR技术因操作相对简单、成本更低,率先得到大规模应用。而基因测序技术直到二代测序(NGS)的出现,才加速了其商业化进程。但基因检测行业真正进入快速发展阶段,实际上有赖于基因测序技术的发展。基因测序技术让人类第一次,能够获得个体全基因组几乎所有信息,这是人类能够破译基因密码,认识疾病和基因关系的前提条件。基因测序技术发展至今,经历了三次演变,每一代测序技术都各有优、劣势,彼此之间互为补充,而不是相互替代。二测序技术是现在应用最广的技术,三代测序技术目前用于科学研究中。
原创文章,作者:dongshuai,如若转载,请注明出处:http://boke.6ke.com.cn/?p=19374