一文讀懂高通量測(cè)序技術(shù)與研究(套路和實(shí)例分析)
導(dǎo)語(yǔ)
高通量測(cè)序技術(shù)和普通基因測(cè)序最大的不同在于,高通量測(cè)序能一次并行對(duì)幾十萬(wàn)到幾百萬(wàn)條DNA分子進(jìn)行序列測(cè)定,也就是基因測(cè)序里的“批處理”。
高通量測(cè)序經(jīng)過(guò)近十年來(lái)的迅猛發(fā)展,已經(jīng)深入到生命科學(xué)的各個(gè)領(lǐng)域,不僅有力地推動(dòng)了基礎(chǔ)研究的發(fā)展,也在逐漸征服臨床應(yīng)用。所謂的高通量測(cè)序技術(shù),又名大規(guī)模平行測(cè)序,是將DNA(或者cDNA)隨機(jī)片段化、加接頭,制備測(cè)序文庫(kù),通過(guò)對(duì)文庫(kù)中數(shù)以萬(wàn)計(jì)的克隆(Colony)進(jìn)行延伸反應(yīng),檢測(cè)對(duì)應(yīng)的信號(hào),最終獲取序列信息。與Sanger法為代表的傳統(tǒng)測(cè)序法相比,高通量測(cè)序技術(shù)在處理大規(guī)模樣品時(shí)具有顯著的優(yōu)勢(shì),又快(兩天)又多(數(shù)百萬(wàn)克隆),成為目前組學(xué)研究的主要技術(shù)。
當(dāng)前主要的測(cè)序技術(shù)平臺(tái),主要分為:
solexa測(cè)序技術(shù)(即大家耳熟能詳?shù)膇llumina測(cè)序平臺(tái));
454測(cè)序技術(shù)(讀長(zhǎng)長(zhǎng),但是準(zhǔn)確度較低,成本較高,即焦磷酸測(cè)序技術(shù),少量市場(chǎng)占有);
solid測(cè)序技術(shù)(雙色編碼技術(shù),目前基本在市場(chǎng)上見(jiàn)不到了)
那么高通量測(cè)序技術(shù)可以幫助我們做到什么呢?
基因組層面的應(yīng)用
對(duì)于疾病診斷領(lǐng)域,全基因組重測(cè)序技術(shù)是一種非常有力的手段。所謂的全基因組重測(cè)序,即對(duì)基因組序列已知物種的個(gè)體(比如人,小鼠等)進(jìn)行基因組測(cè)序,并進(jìn)行差異信息分析的方法?;谌蚪M測(cè)序,可以快速的尋找到大量的遺傳差異,從而實(shí)現(xiàn)遺傳進(jìn)化分析及重要性狀候選基因的預(yù)測(cè),找到大量的SNP,InDel,結(jié)構(gòu)變異(SVs)等變異信息,從而獲取生物群體的遺傳特征。
臨床上,常規(guī)的產(chǎn)前診斷技術(shù)是需要通過(guò)穿刺(絨毛穿刺、羊膜腔穿刺等)的方法取得胎兒的組織進(jìn)行遺傳學(xué)檢測(cè),這可能導(dǎo)致一定的流產(chǎn)風(fēng)險(xiǎn)。而在1997年,Lo團(tuán)隊(duì)[1]發(fā)現(xiàn)了孕婦外周血中存在有胎兒的游離DNA,而高通量測(cè)序技術(shù)可以針對(duì)短序列DNA進(jìn)行精準(zhǔn)的測(cè)序。
2010年,Lo團(tuán)隊(duì)借助測(cè)序技術(shù)完成了母血中胎兒的全部組基因組圖譜的繪制,證實(shí)了利用cffDNA(cell free fetal DNA)進(jìn)行胎兒基因檢測(cè)是完全可行的。目前應(yīng)用高通量測(cè)序技術(shù)的三體綜合征產(chǎn)前基因診斷技術(shù)已經(jīng)開(kāi)展臨床試點(diǎn)。
動(dòng)植物基因組分析流程(引用自諾禾致源)
一個(gè)人樣品的全基因組測(cè)序,目前的價(jià)格在1.3萬(wàn)人民幣左右。然而大量的基因組區(qū)域是不編碼蛋白質(zhì)的,甚至對(duì)于特定疾病或者表型來(lái)說(shuō),參與調(diào)控的關(guān)鍵基因是已知的,所以研究者更關(guān)心的是某一個(gè)特定區(qū)域的表達(dá)情況。這時(shí)候,外顯子組和目標(biāo)區(qū)域測(cè)序就非常適合了。
所謂的外顯子組(exome)是一個(gè)物種基因組中全部外顯子區(qū)域的總和,通過(guò)探針?lè)ú东@基因組中全部外顯子序列,然后使用高通量測(cè)序技術(shù)對(duì)外顯子組測(cè)序,可以直接的發(fā)現(xiàn)與蛋白質(zhì)功能變異相關(guān)的遺傳突變。相對(duì)于全基因組測(cè)序,外顯子測(cè)序更加的經(jīng)濟(jì),只需9000人民幣。而對(duì)于感興趣的特定基因組區(qū)域,可以進(jìn)行目標(biāo)區(qū)域的深度測(cè)序。這就更便宜了,200個(gè)擴(kuò)增子(產(chǎn)物長(zhǎng)度<300bp),如果來(lái)自同一個(gè)模板,則只需400塊!
那么,除了以上介紹的兩種主流的基因組測(cè)序方法之外,還衍生出了其他的分析方法,比如簡(jiǎn)化基因組測(cè)序,可以對(duì)重要的和復(fù)雜性高的QTLS(quantitative trait loci,數(shù)量性狀位點(diǎn))精細(xì)定位。簡(jiǎn)化代表文庫(kù)測(cè)序,對(duì)群體中不同基因型的個(gè)體采用相同的內(nèi)切酶酶切,回收相同大小范圍的酶切片段并測(cè)序,可以降低基因組分析的復(fù)雜性。酶切位點(diǎn)相關(guān)DNA測(cè)序(RAD-seq)等一些新興的測(cè)序分析技術(shù)。
轉(zhuǎn)錄組測(cè)序
在基因組分析上更進(jìn)一步,我們會(huì)對(duì)基因表達(dá),可變剪切,基因結(jié)構(gòu)變化等內(nèi)容感興趣。所以我們需要使用到轉(zhuǎn)錄組測(cè)序,即RNA-seq。也就是從總的RNA中富集出單鏈mRNA,再反轉(zhuǎn)錄成雙鏈cDNA,隨后進(jìn)行高通量測(cè)序,并與基因組DNA序列進(jìn)行比對(duì)。
通過(guò)RNA-seq,還可以發(fā)現(xiàn)新的轉(zhuǎn)錄物。長(zhǎng)鏈非編碼RNA(lncRNA)是當(dāng)前研究的熱點(diǎn),其功能廣泛,涉及到個(gè)體發(fā)育、干細(xì)胞分化、細(xì)胞代謝、腫瘤發(fā)生發(fā)展等眾多方面。最早的大規(guī)模發(fā)掘lncRNA的工作是通過(guò)芯片完成的,但是后來(lái)人們發(fā)現(xiàn),高通量測(cè)序特別適合用于發(fā)掘新的lncRNA。
RNA-seq分析標(biāo)準(zhǔn)流程(引用自諾禾致源)
近年來(lái),在人、小鼠、大鼠、果蠅、斑馬魚(yú)、豬等物種中,通過(guò)RNA-seq,發(fā)現(xiàn)了一大批的lncRNA。進(jìn)一步研究證實(shí)有的lncRNA具有調(diào)控各種生物過(guò)程的能力。這方面的工作比較簡(jiǎn)單,也形成了一定的套路,對(duì)于廣大的生命科學(xué)研究人員來(lái)說(shuō)是較容易出成果的一個(gè)領(lǐng)域。
除lncRNA外,環(huán)狀RNA(circRNAs)研究也是RNA-seq的一個(gè)重要應(yīng)用方向。circRNAs是一類特殊的非編碼RNA分子,也是RNA領(lǐng)域最新的研究熱點(diǎn)。與傳統(tǒng)的線性RNA不同,circRNA分子呈封閉環(huán)狀結(jié)構(gòu),不受RNA外切酶影響,表達(dá)更穩(wěn)定,不易降解。
有研究表明circRNA可能通過(guò)miRNA-sponge的方式來(lái)調(diào)控miRNA對(duì)靶基因的抑制作用,在某些疾病中具有重要意義。通過(guò)RNA-seq,可以找到融合(fusion)的序列接口,從而發(fā)掘新的circRNA。這項(xiàng)技術(shù)已經(jīng)得到了許多重要的應(yīng)用。
同時(shí),我們也常常用到DGE(digital gene expression)技術(shù)。其基本原理是對(duì)cDNA進(jìn)行雙酶切,從而每一條mRNA都會(huì)得到一個(gè)對(duì)應(yīng)的標(biāo)簽,隨后進(jìn)行高通量測(cè)序,比較不同樣本之間各種標(biāo)簽的數(shù)目,從而找出差異化的標(biāo)簽,即差異化的mRNA。
microRNA測(cè)序
microRNA是一類內(nèi)源小分子RNA,通常在轉(zhuǎn)錄后水平,負(fù)調(diào)節(jié)基因表達(dá)來(lái)發(fā)揮作用,控制了多種生物和代謝途徑中眾多基因的表達(dá),在生物生長(zhǎng)和發(fā)育中扮演重要角色,目前microRNA測(cè)序技術(shù)普遍用于動(dòng)植物表觀遺傳學(xué)研究。
除以上介紹的測(cè)序技術(shù)之外,常用的測(cè)序技術(shù)還有:
MeDIP-Seq技術(shù)(methylation DNA immunoprecipitationsequencing,甲基化DNA免疫共沉淀),是研究甲基化的一種有效的手段。由于在哺乳動(dòng)物中甲基化一般發(fā)生在CpG的胞嘧啶5位碳原子上,所以可通過(guò)特異性結(jié)合甲基化DNA的蛋白MBD2b或5’-甲基胞嘧啶抗體富集高甲基化的DNA片段,并結(jié)合第二代高通量測(cè)序,對(duì)富集到的DNA片段進(jìn)行測(cè)序,從而檢測(cè)全基因組范圍內(nèi)的甲基化位點(diǎn)。
ChIP-seq,染色質(zhì)免疫共沉淀技術(shù),研究體內(nèi)蛋白與DNA相互作用的一種方法先通過(guò)ChIP 特異性地富集與目的蛋白相結(jié)合的DNA片段, 而后對(duì)所得DNA片段進(jìn)行高通量測(cè)序。
下面是兩個(gè)在CNS研究中運(yùn)用高通量的實(shí)例。
高通亮案例:經(jīng)典之作及牛文推薦
案例1:FPR1突變與蒽環(huán)類藥物腫瘤治療
Chemotherapy-induced antitumor immunity requiresformyl peptide receptor 1
作為精準(zhǔn)治療的一部分,尤其是高通量測(cè)序在基礎(chǔ)研究和臨床治療中的應(yīng)用,本文算是一篇典范文章了。從它臨床樣本的測(cè)序結(jié)果入手,分析得到了靶向基因,不但為該藥物的個(gè)性化治療提供了依據(jù)和檢測(cè)指標(biāo),也為深入挖掘藥物的治療機(jī)制提供了切入點(diǎn),值得大家學(xué)習(xí)。
這篇文章中,研究人員通過(guò)遺傳測(cè)序方法,試圖發(fā)現(xiàn)與蒽環(huán)類藥物引起的抗腫瘤免疫相關(guān)的基因。這里主要集中在測(cè)序結(jié)果的單核苷酸多態(tài)性(SNPs)分析,發(fā)現(xiàn)有一個(gè)SNP相關(guān)的基因,F(xiàn)PR1功能缺失性突變可以顯著降低蒽環(huán)類藥物的作用。
之后通過(guò)進(jìn)一步分析發(fā)現(xiàn)FPR1作用于宿主的免疫細(xì)胞,而非腫瘤細(xì)胞本身。既然免疫細(xì)胞表達(dá)受體蛋白FPR1起抗腫瘤作用,那么腫瘤細(xì)胞必然需要表達(dá)該受體的配體蛋白參與進(jìn)來(lái)。對(duì)FPR1已知的四個(gè)配體排查,發(fā)現(xiàn)其中annexin A1配體,在介導(dǎo)免疫細(xì)胞和腫瘤細(xì)胞之間的相互接觸中起關(guān)鍵性作用。
作為精準(zhǔn)治療的一部分,尤其是高通量測(cè)序在基礎(chǔ)研究和臨床治療中的應(yīng)用,本文也算是一篇典范文章了。從臨床樣本的測(cè)序結(jié)果入手,分析得到了靶向基因,不但為該藥物的個(gè)性化治療提供了依據(jù)和檢測(cè)指標(biāo),也為深入挖掘藥物的治療機(jī)制提供了切入點(diǎn)。
案例2:高通量測(cè)序與結(jié)直腸癌
ErikaVacchelli, et al. Chemotherapy-induced antitumor immunity requiresformyl peptide receptor 1, Science, aad0779.
該文通過(guò)對(duì)KRAS正常的結(jié)直腸癌病人的樣本進(jìn)行了高通量測(cè)序分析,檢測(cè)單抗治療(包括帕尼單抗和西妥昔單抗)后腫瘤細(xì)胞的遺傳學(xué)突變。該文作為高通量測(cè)序在精準(zhǔn)治療應(yīng)用中的實(shí)例,實(shí)在是不可多得的一篇好文。研究結(jié)果對(duì)于指導(dǎo)臨床治療也是具有非常重要的意義,尤其是抗體治療增敏突變的發(fā)現(xiàn),應(yīng)該也算首次報(bào)道。
首先實(shí)驗(yàn)流程主要包括以下三部分:一是臨床病人的腫瘤標(biāo)本,包括原位結(jié)直腸癌和肝轉(zhuǎn)移;二是利用臨床腫瘤建立小鼠的移植瘤模型;三是針對(duì)移植瘤模型的抗體治療反應(yīng)設(shè)計(jì)聯(lián)合靶向治療策略。整體如下:
第二步,根據(jù)上述實(shí)驗(yàn)設(shè)計(jì)建立移植瘤模型,對(duì)116個(gè)標(biāo)本進(jìn)行全基因組測(cè)序,分別發(fā)現(xiàn)了針對(duì)抗體治療具有抗性和增敏作用的基因突變。
第三步,對(duì)測(cè)序得到的幾種基因突變分別在原位瘤和轉(zhuǎn)移瘤中進(jìn)行了比較,驗(yàn)證抗體治療抗性突變的作用。
最后,利用移植瘤模型,分析抗體治療抗性突變和增敏突變后重新設(shè)計(jì)聯(lián)合靶向治療,達(dá)到個(gè)性化治療目的。
總體來(lái)說(shuō),高通量測(cè)序技術(shù)的誕生可以說(shuō)是基因組學(xué)研究領(lǐng)域一個(gè)具有里程碑意義的事件。該技術(shù)使得核酸測(cè)序的單堿基成本與第一代測(cè)序技術(shù)相比急劇下降。但是同時(shí)由于數(shù)據(jù)量的大幅度上升,全基因組測(cè)序臨床應(yīng)用的瓶頸在于信息的分析和解讀能力不足。
如何更好的分析數(shù)據(jù),挖掘數(shù)據(jù),驗(yàn)證結(jié)果,成為一個(gè)更大的難點(diǎn),是當(dāng)前生物研究的關(guān)鍵步驟, 具有巨大的現(xiàn)實(shí)意義。因此學(xué)習(xí)“高通量測(cè)序與數(shù)據(jù)分析”大勢(shì)所趨,幫您躋身科研前列。
-
財(cái)報(bào)
-
政策法規(guī)
-
焦點(diǎn)事件
-
焦點(diǎn)事件
-
科技前沿
-
科技前沿
-
焦點(diǎn)事件
-
焦點(diǎn)事件