蜜桃av秘 乱码一区二区三区,苍井空一级婬片A片,波多野结衣无码视频在线观看,在线观看午夜成人一区二区三区

【成功案例】湖羊骨骼肌發(fā)育過程中全基因組范圍LncRNAs的顯著變化

Genome-Wide Analysis Reveals Extensive Changes?in LncRNAs during Skeletal Muscle Development?in Hu Sheep

湖羊骨骼肌發(fā)育過程中全基因組范圍LncRNAs的顯著變化

?

雜志:?genes?

影響因子:3.600

PMID:?28763026

?

?

 

研究背景

羊肉具有蛋白含量高、脂肪和膽固醇含量低等優(yōu)點(diǎn),促進(jìn)羊的肌肉生長可提高羊肉產(chǎn)量。過去關(guān)于羊骨骼肌生長的研究主要集中在蛋白質(zhì)編碼基因,然而基因組絕大部分是非編碼序列。長非編碼RNA(lncRNAs)是一種重要的非編碼RNA,越來越多研究發(fā)現(xiàn)某些功能型的lncRNAs是新的肌肉調(diào)節(jié)元件,發(fā)揮重要作用。關(guān)于羊肌肉相關(guān)lncRNA的轉(zhuǎn)錄組學(xué)研究較少,尤其關(guān)于湖羊的研究更少, lncRNA在羊骨骼肌生長過程中的表達(dá)類型和潛在作用大部分都是未知的,因此了解羊不同生長時(shí)期肌肉轉(zhuǎn)錄組的動態(tài)變化具有重要意義。

本文擬研究湖羊三個(gè)關(guān)鍵生長階段(110天胎兒期,5天幼年期,2歲成年期)肌肉lncRNA的表達(dá)模式和潛在作用,篩選差異表達(dá)lncRNA的和DEGs(差異表達(dá)基因)的靶基因。同時(shí)通過lncRNA-gene網(wǎng)絡(luò)預(yù)測湖羊肌肉生長的lncRNA潛在調(diào)控因子,獲得湖羊肌纖維生長相關(guān)的轉(zhuǎn)錄水平的候選調(diào)節(jié)因子。

材料和方法

材料:相同的自然光環(huán)境下飼養(yǎng)的胎兒期、幼年期、成年期湖羊,每個(gè)時(shí)期選取3個(gè)隨機(jī)樣本,取既定部位(12和13胸椎之間)的LD肌肉樣本,采樣后即刻液氮冷凍提取RNA。

測序平臺:Illumina platform

分析平臺:百邁客云平臺(BMKCloud),分析內(nèi)容如下:

在百邁客云平臺上,對胎兒期、幼年期、成年期湖羊肌肉細(xì)胞進(jìn)行RNA-seq測序后轉(zhuǎn)錄組拼接。進(jìn)行注釋后,先排除<200個(gè)核苷酸或單外顯子的轉(zhuǎn)錄子,再用CPC,CNCI,PFAM,CPAT等工具從未知轉(zhuǎn)錄組中篩選候選lncRNA。四種方法FPKM>0.1的轉(zhuǎn)錄子交集定義為lncRNA轉(zhuǎn)錄子。

應(yīng)用DEGseq packages (1.10.1)?來分析組間的表達(dá)差異,F(xiàn)DR值<5%,log2(倍數(shù)變化)的絕對值被定義為差異化表達(dá)。

預(yù)測差異表達(dá)的lncRNA的順式靶基因和反式靶基因。

為分析lncRNA的主要功能,通過NCBI的Nr、GO、KEGG、COG數(shù)據(jù)庫比對進(jìn)行靶基因和DEGs注釋,KS≤0.05,信號通路矯正p值≤0.05的GO term被定義為顯著富集的。

為進(jìn)一步研究lncRNA和他們的靶基因的相互作用,建立LncRNA-Gene共表達(dá)網(wǎng)絡(luò)。

結(jié)果:

1.測序拼接和轉(zhuǎn)錄組分析

胎兒期、幼年期、成年期3組RNA-seq序列質(zhì)控后,經(jīng)過去接頭、多聚尾、低質(zhì)量序列后,每組平均獲得了65578070,65591958,71241551的拼接序列,9個(gè)文庫平均GC含量為54.39%,每個(gè)樣本Q30值≥91.71%,?92%以上與O. aries參考基因組特異性匹配,分析顯示胎兒期有45.1%的序列與外顯子區(qū)域匹配,后期階段匹配度更高(幼年期53.8%、成年期53.7%),在幼年、成年期組的內(nèi)含子和基因間序列比例低于胎兒期。(表1)

表1.矯正后序列與不同階段湖羊參考基因組比對

2.lncRNA篩選和特征性描述
為研究湖羊肌肉lncRNA的基本特征,篩選lncRNA并與mRNA比對。CPC、CNCI、PFKM、CPAT交集部分有6924個(gè)lncRNA轉(zhuǎn)錄子,包括已知的保守lncRNA,肌肉分化相關(guān)的lncMD(圖1A)

圖1 A 韋恩圖 ?圖1B. lncRNA和mRNA在每個(gè)染色體上的分布比例。紅色和黑色線條分布代表lncRNA和mRNA,藍(lán)色線條代表相應(yīng)染色體在基因組中的大小比例

lncRNA轉(zhuǎn)錄子分為4606個(gè)lincRNA(66.5%),1131個(gè)內(nèi)含子lncRNA(16.3%),1187個(gè)反義lncRNA(17.1%)。與mRNA類似,lncRNA轉(zhuǎn)錄子在26對染色體和X染色體中分布廣泛,但線粒體中不存在。而且lncRNA在幾個(gè)染色體中的比例與染色體大小比例一致,尤其是18號染色體,表明在此研究中相應(yīng)lncRNA可能體現(xiàn)重要功能(圖1B)

比較lncRNA和mRNA的外顯子特征,結(jié)果顯示大部分lncRNA每個(gè)轉(zhuǎn)錄子包含2-5個(gè)外顯子(均值3.3),比mRNA少(均值7.9,圖1C)

圖1C 湖羊lncRNA每個(gè)轉(zhuǎn)錄子外顯子數(shù) ?????圖1D 湖羊lncRNA外顯子大小分布

另外大部分lncRNA包含2個(gè)外顯子,而包含2個(gè)外顯子的mRNA僅占比3.9%,明顯低于lncRNA。lncRNA中外顯子平均長度相對長于mRNA,大部分小于200bp(圖1D)。與蛋白編碼基因一致,在肌肉生長過程中同一階段lncRNA表達(dá)趨勢相似,且平均表達(dá)水平比與蛋白編碼基因低(圖2A,B)

每組重復(fù)間的相關(guān)性分析顯示相關(guān)性高(圖3A-C),而且在6924個(gè)表達(dá)的lncRNA轉(zhuǎn)錄子中,于某一生長階段特異性表達(dá)的占比33.03%,這個(gè)比例在蛋白編碼基因中較低(4%),提示lncRNA的特殊意義和動態(tài)特性。胎兒期特異性lncRNA為1042個(gè),遠(yuǎn)高于幼年期(626)和成年期(619),表明lncRNA在早期發(fā)展階段的重要意義。

圖2A胎兒期、幼年期、成年期湖羊肌肉lncRNA的FPKM分布

圖2B胎兒期、幼年期、成年期湖羊肌肉蛋白編碼基因的FPKM分布

圖3 每組重復(fù)間的相關(guān)系數(shù)分析(A胎兒期組,B幼年期組,C成年期組)

3.差異表達(dá)分析及靶點(diǎn)基因預(yù)測

3個(gè)時(shí)期兩兩比較分析顯示在胎兒期vs幼年期、幼年期vs成年期、胎兒期vs成年期(對照組vs實(shí)驗(yàn)組),分別有27、14、92個(gè)lncRNA,239 270 1437個(gè)基因是特異性表達(dá)的。(|log2FC| > 1, FDR < 0.05).值得一提的是,幼年期vs成年期組差異表達(dá)的lncRNA量最低,在胎兒期vs幼年期組和幼年期vs成年期組,DEGs的數(shù)量幾乎一樣多,表明產(chǎn)前和產(chǎn)后盡管在時(shí)間只相差1一個(gè)月,但是轉(zhuǎn)錄水平的差異較大(圖4A-D)。

圖4 對比組差異表達(dá)lncRNA和基因的數(shù)量(A 不同對比組差異表達(dá)lncRNA數(shù)量的韋恩圖 B 不同對比組DEGs數(shù)量的韋恩圖C不同對比組差異表達(dá)lncRNA總數(shù) D不同對比組DEGs總數(shù))

差異表達(dá)的lncRNA中,在胎兒期vs幼年期有36個(gè)上調(diào)lncRNA,42個(gè)下調(diào)lncRNA,幼年期vs成年期有13個(gè)上調(diào)lncRNA,28個(gè)下調(diào)lncRNA,胎兒期vs成年期有68個(gè)上調(diào)lncRNA,78個(gè)下調(diào)lncRNA。DEGs中,胎兒期vs幼年期組有1028個(gè)上調(diào)基因和487個(gè)下調(diào)基因、幼年期vs成年期組有659個(gè)上調(diào)基因和900個(gè)下調(diào)基因、胎兒期vs成年期有1862個(gè)上調(diào)基因和1749個(gè)下調(diào)基因。差異表達(dá)的lncRNA和DEGs的分層集群顯示幼年期和成年期的表達(dá)模式相似而與胎兒期有所差異(圖4E,F)。

圖4 E 差異表達(dá)的lncRNA的分層集群 ?F DEGs的分層集群

為進(jìn)一步評估RNA測序的結(jié)果,選擇MYOG(從胎兒期富集的與晚期肌肉細(xì)胞分化相關(guān)的基因),MYH7(肌肉結(jié)構(gòu)基因),5種差異表達(dá)的lncRNA,4種DEGs進(jìn)行qRT-PCR分析。表達(dá)量與RNA-Seq結(jié)果一致。結(jié)果表明表達(dá)與測序結(jié)果有較好相關(guān)性,表明測序結(jié)果可行度高。

lncRNA可以通過與靶基因順式和反式作用發(fā)揮功能,通過兩兩對比分析,預(yù)測相鄰上下游100kb的和或差異表達(dá)lncRNA的互補(bǔ)蛋白編碼基因。得到共201個(gè)靶基因。

圖5 qRT-PCR和RNA-Seq分別驗(yàn)證不同時(shí)期湖羊肌肉差異表達(dá)lncRNA和基因的表達(dá)水平

4.差異表達(dá)的lncRNA和mRNA靶基因的生信分析

為進(jìn)一步研究差異表達(dá)的lncRNA,通過與NR / GO/ COG和KEGG數(shù)據(jù)庫比對,對lncRNA和DEGs的靶基因做注釋。

表2 差異表達(dá)lncRNA和DEGs的功能注釋

基于GO數(shù)據(jù)庫,靶基因和DEGs被分別歸到生物學(xué)過程,細(xì)胞構(gòu)成,分子功能三個(gè)功能類別,而且在所有比對中,在肌肉生長過程中發(fā)揮重要作用的器官形成,骨骼肌系統(tǒng)發(fā)展與應(yīng)激被歸類為顯著富集的GO terms。

圖6不同對比組的差異表達(dá)lncRNA和基因的靶基因的top GO分析(A不同對比組的差異表達(dá)lncRNA top20個(gè)GO terms B不同對比組的DEGs top20個(gè)GO terms)

COG功能聚類分析把差異表達(dá)的lncRNA和基因分別歸為17和24個(gè)類別。在胎兒vs幼年期組,氨基酸轉(zhuǎn)運(yùn)合成,碳水化合物轉(zhuǎn)運(yùn)合成,離子轉(zhuǎn)錄合成的靶基因和DEGs的比例比其他兩個(gè)對比組高,提示這類基因在產(chǎn)前階段肌肉發(fā)育過程中的重要性。此外,對靶基因和DEGs分析顯示,在幼年期vs成年期組信號轉(zhuǎn)導(dǎo)機(jī)制和細(xì)胞骨架比其他對比組比例更高,表明這類terms和相應(yīng)基因在產(chǎn)后肌肉生長中的重要意義(圖7)。

圖7 差異表達(dá)lncRNA和DEGs的靶基因的COG分類(A 差異表達(dá)lncRNA的靶基因的COG分析 BDEGs的靶基因的COG分析)

 

根據(jù)KEGG分析,胎兒組vs幼年組,幼年組vs成年組,胎兒組vs成年組的21、6、51個(gè)lncRNA的靶基因分別與40、16、48個(gè)通路對應(yīng)。雖然每個(gè)對比組的差異表達(dá)lncRNA的靶基因數(shù)量少,通路(MAPK信號通路,間隙結(jié)合,鈣信號通路,胰島素信號通路,激動蛋白細(xì)胞骨架調(diào)節(jié))是可被誘導(dǎo)的。這些通路中,MAPK信號通路在胎兒組vs幼兒組,胎兒組vs成年組中最常見,提示此通路和相關(guān)lncRNA可能參與了湖羊肌肉的生長調(diào)控。

在胎兒期vs幼年期,胎兒期vs成年期對比組,氧化磷酸化,碳代謝和心肌收縮是DEGs數(shù)量最高的前三個(gè)通路,在幼年期vs成年期組卻不是。值得注意的是,途徑如糖酵解和生成,脂肪酸降解,氨基酸合成的和過氧物酶體增殖激活受體?(PPAR)信號通路特異性存在于胎兒期vs幼年期組,提示這些途徑中DEGs在早期肌纖維生長過程中的重要作用。此外磷酸肌醇激酶-3-激酶蛋白激酶B(PI3k-Akt)信號通路和類固醇合成在幼年期vs成年期組中特異性存在,強(qiáng)化了它們在產(chǎn)后肌肉生長中的作用。總之,差異表達(dá)的lncRNA和DEGs在肌肉生長調(diào)節(jié)方面顯示了巨大潛力。

表3 不同對比組的DEGs的KEGG通路

5.肌纖維增長相關(guān)的潛在功能性lncRNA篩選

為研究lncRNA如何與靶基因來調(diào)節(jié)肌肉生長,依據(jù)FPKM進(jìn)行差異表達(dá)lncRNA和對應(yīng)的差異表達(dá)靶基因的共表達(dá)分析,共獲得了15(胎兒組vs幼年組),7(幼年期vs成年期),37(胎兒期vs成年期)個(gè)共調(diào)節(jié)的lncRNA-基因?qū)?。三個(gè)網(wǎng)絡(luò)都顯示了與肌肉生長相關(guān)的候選lncRNA(圖8)。差異表達(dá)的lncRNA和相應(yīng)的差異表達(dá)的順式和反式作用的靶基因來構(gòu)建lncRNA-基因互作網(wǎng)絡(luò)。差異表達(dá)的靶基因直接與肌肉生長過程相關(guān),對靶基因?qū)?yīng)的差異表達(dá)lncRNA也進(jìn)行了分類。

圖8 不同對比組lncRNA-基因關(guān)系網(wǎng)絡(luò)

(A胎兒期/幼年期組,B幼年期/成年期組,C胎兒期/成年期組;基因以紫色表示,lncRNA以綠色表示,上調(diào)用三角形表示,下調(diào)用圓形表示,順式作用實(shí)心線表示,反式用虛線表示)

隨后通過GO分析得到了8個(gè)生物學(xué)過程和相關(guān)20個(gè)mRNA和41個(gè)lncRNA,如RTL1和JPH2(表S5)。

qRT-PCR分析顯示在肌肉生長過程中l(wèi)ncRNA表達(dá)和對應(yīng)靶基因變化一致,包括TCONS_00606329和它的靶基因elastin,TCONS_00758916、?TCONS_00685981 和他們的靶基因phosphofructokinase?muscle and ankyrin repeat?SOCS box containing 8; TCONS_00297401和靶基因泛素特異性蛋白酶2編碼基因,
TCONS_00377352, TCONS_00381991、TCONS_00381994和他們的靶基因RTL1 (圖?9)?。這些結(jié)果進(jìn)一步揭示了lncRNA和他們靶基因的互作關(guān)系。

圖9胎兒期、幼年期、成年期差異表達(dá)lncRNA和共表達(dá)的靶基因的表達(dá)水平的qRT-PCR驗(yàn)證

?

研究結(jié)論

本研究基于Illumina平臺,篩選出一系列與湖羊三個(gè)關(guān)鍵生長時(shí)期相關(guān)的lncRNA和基因,篩選得到的6924個(gè)差異表達(dá)的lncRNA轉(zhuǎn)錄子中,特異性表達(dá)于某一生長階段的占比高于蛋白編碼基因(33.03%:4%),提示lncRNA的特殊意義和動態(tài)特性。且在胎兒期階段特異性lncRNA數(shù)量較多,提示lncRNA在早期發(fā)展階段的重要意義。

通過兩兩比較分析篩選特異性表達(dá)的lncRNA和基因,在胎兒期vs幼年期、幼年期vs成年期、胎兒期vs成年期(對照組vs實(shí)驗(yàn)組)分別得到特異性表達(dá)的27、14、92個(gè)lncRNA,239 270 1437個(gè)基因。差異表達(dá)的lncRNA和DEGs的分層集群顯示幼年期和成年期的表達(dá)模式相似,與胎兒期有差異。

選擇MYOG,MYH7,5種差異表達(dá)的lncRNA,4種DEGs進(jìn)行qRT-PCR分析。表達(dá)量與RNA-Seq結(jié)果一致,測序結(jié)果可信度高。

通過與NR,GO,COG,KEGG數(shù)據(jù)庫進(jìn)行比對,對差異表達(dá)lncRNA和基因的靶基因進(jìn)行了多種肌肉相關(guān)生物學(xué)過程的注釋。且構(gòu)建了lncRNA-gene 共調(diào)控網(wǎng)絡(luò),提供了候選lncRNA的有價(jià)值的信息,?qRT-PCR分析顯示在肌肉生長過程中l(wèi)ncRNA表達(dá)和對應(yīng)靶基因變化一致。

?

創(chuàng)新點(diǎn)

首次對三個(gè)關(guān)鍵生長階段的湖羊肌肉生長相關(guān)lncRNA進(jìn)行系統(tǒng)性描述。從轉(zhuǎn)錄子結(jié)構(gòu)和表達(dá)模式上研究lncRNA,然后進(jìn)一步預(yù)測lncRNA的靶基因來進(jìn)行功能研究。為進(jìn)一步研究湖羊lncRNA功能提供了依據(jù),為促進(jìn)湖羊肌肉生長提供了有價(jià)值的信息。