別讓你的reads再做布朗運(yùn)動(dòng)了
—羅氏RNA序列捕獲還原真實(shí)不同豐度RNA表達(dá)!
近年來(lái),遺傳變異通過(guò)表達(dá)水平的改變從而影響癌癥、糖尿病、心臟病等復(fù)雜疾病的發(fā)病日益受到研究者的重視。與之相關(guān)的全轉(zhuǎn)錄組分析也越來(lái)越成為研究熱點(diǎn)。
常規(guī)的RNA測(cè)序(RNA-seq)能檢測(cè)基因的表達(dá)豐度,檢測(cè)未注釋的基因,以及由于剪切而形成的復(fù)雜的基因亞型。然而由于轉(zhuǎn)錄本的表達(dá)豐度寬泛的動(dòng)態(tài)范圍,小部分高表達(dá)的轉(zhuǎn)錄本占據(jù)了細(xì)胞里大部分的RNA分子,因此在RNA測(cè)序的結(jié)果里,微量表達(dá)的轉(zhuǎn)錄本reads覆蓋度往往不夠,這使得后續(xù)的數(shù)據(jù)分析想要準(zhǔn)確的拼接這些轉(zhuǎn)錄本或是對(duì)其定量簡(jiǎn)直難上加難。
圖1:傳統(tǒng)RNA-Seq面臨的挑戰(zhàn):少部分高表達(dá)的基因占據(jù)了測(cè)序數(shù)據(jù)中的絕大多數(shù)reads,而感興趣的目的基因如果屬于低表達(dá)基因,其reads量則在測(cè)序數(shù)據(jù)里所占的比例少得可憐。
近日,由FDA牽頭的旨在評(píng)估RNA-seq準(zhǔn)確性、可重復(fù)性及信息量的測(cè)序質(zhì)量控制項(xiàng)目(SEQC/MAQC-III)初步結(jié)果發(fā)表,為評(píng)估RNA-seq數(shù)據(jù)分析提供了寶貴的資源,同時(shí)也讓人們看到了RNA-seq的短板:對(duì)于低表達(dá)量的基因,測(cè)序結(jié)果可重復(fù)性低,想要測(cè)到這些基因,只能增大測(cè)序深度;原本被人們認(rèn)為是RNA-seq檢測(cè)優(yōu)勢(shì)的可變剪切的檢測(cè),由于覆蓋junction的Reads太少而變得不靠譜;對(duì)于新剪切位點(diǎn)的發(fā)現(xiàn),評(píng)估結(jié)果顯示測(cè)得越多,發(fā)現(xiàn)的越多,測(cè)到1.2Tb reads時(shí)仍舊沒(méi)有盡頭……1
對(duì)于SEQC項(xiàng)目暴露出的RNA-Seq的局限我們并非束手無(wú)策,利用靶向RNA-seq能完美的解決以上困擾。對(duì)感興趣的目的基因相關(guān)RNA進(jìn)行靶向捕獲后再測(cè)序,能夠極大的增加測(cè)序覆蓋度,由此大大提高基因檢測(cè)的靈敏度、定量能力以及對(duì)于微量表達(dá)的轉(zhuǎn)錄本的拼接能力。
加爾文研究所(Garvan Institute)的Tim Mercer以及John Mattick近期在Nature Protocol上發(fā)表文章,詳細(xì)闡釋了利用羅氏NimbleGen SeqCap EZ Choice 探針捕獲cDNA后測(cè)序的方法。他們認(rèn)為:與全轉(zhuǎn)錄組RNA-Seq相比,RNA CaptureSeq是一個(gè)更加高效的對(duì)基因表達(dá)進(jìn)行定性定量研究的方法。CaptureSeq的方法除了能準(zhǔn)確保留除高表達(dá)的基因外的其他基因在原來(lái)RNA樣本中的相對(duì)表達(dá)豐度,在樣本制備的過(guò)程中還可以引入混樣(multiplex)的操作方法來(lái)提高捕獲效率,由此試劑成本也大大降低2。
圖2. SeqCap RNA 靶向捕獲流程,無(wú)需專門去除rRNA或進(jìn)行poly A富集
羅氏即將推出的靶向RNA-Seq產(chǎn)品正是基于與加爾文研究所的合作。SeqCap RNA 序列捕獲系列產(chǎn)品包括針對(duì)長(zhǎng)鏈非編碼RNA的 lncRNA Enrichment Kit,針對(duì)小于7Mb或是長(zhǎng)達(dá)100Mb的任何用戶感興趣的人類RNA區(qū)域的捕獲產(chǎn)品,以及用戶定制的針對(duì)長(zhǎng)達(dá)200Mb非人類RNA目標(biāo)捕獲產(chǎn)品。同時(shí)推出的還有一系列與之配套的樣品制備試劑與完善的實(shí)驗(yàn)流程。屆時(shí),研究者還可以通過(guò)升級(jí)后的在線探針設(shè)計(jì)軟件NimbleDesign快速地自行設(shè)計(jì)屬于自己獨(dú)一無(wú)二的序列捕獲探針。
羅氏NimbleGen的SeqCap RNA序列捕獲產(chǎn)品將帶來(lái)更快的實(shí)驗(yàn)流程,更真實(shí)的實(shí)驗(yàn)結(jié)果,完美地解決常規(guī)的RNA-Seq可能導(dǎo)致的由于目的基因reads數(shù)過(guò)少而引發(fā)的一系列后續(xù)數(shù)據(jù)分析問(wèn)題。新產(chǎn)品上市在即,敬請(qǐng)期待!
1. SEQC/MAQC-III Consortium. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium[J]. Nature Biotechnology, 2014.
2. Mercer T R, Clark M B, Crawford J, et al. Targeted sequencing for gene discovery and quantification using RNA CaptureSeq[J]. Nature protocols, 2014, 9(5): 989-1009.