長鏈非編碼 RNAs(long non-coding RNAs,lncRNAs)是一類長度在200nt以上且不編碼蛋白質(zhì)的RNA,以帶polyA尾和不帶polyA尾兩種形式廣泛存在于各種生物體內(nèi),參與細(xì)胞內(nèi)多種過程調(diào)控,具有跨物種的低保守性,組織特異性表達(dá)和豐度低等特點(diǎn)。
近年來的研究表明,lncRNA參與了X染色體沉默、基因組印記、染色質(zhì)修飾、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾和核內(nèi)運(yùn)輸?shù)榷喾N重要的調(diào)控過程,但絕大部分lncRNA的功能目前仍不清楚。應(yīng)用高通量測序技術(shù),研究人員能夠快速獲得與疾病或者特定生物學(xué)過程相關(guān)的lncRNA 并進(jìn)行深入研究。
實(shí)驗(yàn)方案
測序策略:Illumina 平臺 PE150
數(shù)據(jù)量:12G clean data
技術(shù)優(yōu)勢
(1)任意物種檢測:相對傳統(tǒng)芯片而言,無需預(yù)先設(shè)計特異性探針,因此無需了解物種基因或基因組信息,能夠直接對任何物種進(jìn)行最全面的轉(zhuǎn)錄組分析;
(2)分辨率高:可以檢測轉(zhuǎn)錄本中單堿基的差異;
(3)檢測范圍廣:從幾個到數(shù)十萬個拷貝精確計數(shù),可同時鑒定正常和稀有的轉(zhuǎn)錄本;
(4)信息分析廣:可以做基因差異表達(dá)分析、可變剪切、融合基因分析;新轉(zhuǎn)錄本預(yù)測及注釋。
數(shù)據(jù)分析
標(biāo)準(zhǔn)信息分析
(1)數(shù)據(jù)過濾及質(zhì)量評估
(2)核糖體RNA去除率計算
(3)比對參考基因組及統(tǒng)計
(4)基因表達(dá)水平分析
(5)基因表達(dá)差異及聚類分析
(6)差異基因KEGG生物通路富集分析(僅限于模式物種)
(7)差異基因GO功能富集分析(僅限于模式物種)
(8)已知mRNA表達(dá)量分析
(9)已知mRNA差異表達(dá)及聚類分析
(10)已知lncRNA表達(dá)量分析
(11)已知lncRNA差異表達(dá)及聚類分析
(12)預(yù)測新lncRNA
(13)新lncRNA鑒定和表達(dá)量分析
(14)新lncRNA差異表達(dá)及聚類分析
(15)新lncRNA家族分析
(16)SNP和InDel檢測與注釋
(17)生物學(xué)重復(fù)樣品間相關(guān)性分析
(18)蛋白互作網(wǎng)絡(luò)分析
(19)基因融合
(20)主成份分析(PCA)
(21)特征性差異表達(dá)基因分析
(22)lncRNA保守性分析
(23)可變剪切
高級分析
(1)已知mRNA-lncRNA共表達(dá)網(wǎng)絡(luò)構(gòu)建
(2)基因結(jié)構(gòu)優(yōu)化及優(yōu)化基因的表達(dá)值計算
(3)eQTL分析
技術(shù)流程
案例分析
案例(1)瘦豬和肥胖豬組織中l(wèi)ncRNA的表達(dá)水平不同
該研究對豬的兩個品種陸川和杜洛克的肝臟、肌肉和脂肪組織分別進(jìn)行了lncRNA測序,共鑒定出4868個lncRNA轉(zhuǎn)錄本,其中3235個為新轉(zhuǎn)錄本,而且lncRNA和mRNA的表達(dá)模式是組織特異性的。脂肪組織中差異表達(dá)的lncRNA具有794個潛在的靶基因,這些靶基因富集到脂肪細(xì)胞因子信號通路、PI3k-Akt信號通路和鈣離子信號通路。此外,差異表達(dá)的lncRNA位于13個脂肪相關(guān)的數(shù)量性狀位點(diǎn),其中包括65個QTL_ID。接著,分析了同一QTL_ID中的lncRNA和mRNA,并通過qPCR證實(shí)了其在兩個QTL_ID中的共表達(dá)。該研究為兩個豬品種脂肪代謝差異的分子機(jī)理提供了新的觀點(diǎn),為進(jìn)一步研究lncRNA在肥胖發(fā)育中的調(diào)控作用奠定了重要基礎(chǔ)。
圖1 組織中l(wèi)ncRNA和mRNA的差異表達(dá)
圖2 lncRNA和mRNA差異表達(dá)的熱圖
案例(2)長非編碼RNA控制造血干細(xì)胞功能
造血干細(xì)胞(hematopoietic stem cell,HSC)具有獨(dú)特的基因表達(dá)程序,能夠自我更新和分化成各類成熟血細(xì)胞。長非編碼RNA(lncRNA)已成為基因表達(dá)和細(xì)胞命運(yùn)決定的重要調(diào)節(jié)因子,盡管它們在HSC中的功能尚不清楚。該研究對純化的HSC進(jìn)行l(wèi)ncRNA測序,鑒定出323個未注釋的lncRNA。比較這些lncRNA在差異譜系中的表達(dá)顯示159個lncRNA富集于HSC,其中一些可能是是HSC特異性的(LncHSC)。這些lncRNA基因與編碼蛋白基因具有相似的表觀遺傳學(xué)特征,如通過DNA甲基化調(diào)節(jié)表達(dá)。敲低兩種LncHSC對HSC自我更新和譜系定型產(chǎn)生了的不同影響。該研究結(jié)果表明,lncRNA在HSC調(diào)控中起重要作用,為HSC調(diào)控的遺傳回路提供了一個新的思路。
圖1 HSC特異的lncRNA的鑒定
參考文獻(xiàn)
[1] Yu et al. Comparative analyses of long non-coding RNA in lean and obese pig. Oncotarget, 2017.
[2] Luo et al. Long non-coding RNAs control hematopoietic stem cell function. Cell Stem Cell, 2015.