蜜桃av秘 乱码一区二区三区,苍井空一级婬片A片,波多野结衣无码视频在线观看,在线观看午夜成人一区二区三区
百邁客云 | 百邁客亞洲棉科研成果在Nature Genetics上發(fā)表
3554
post-template-default,single,single-post,postid-3554,single-format-standard,_masterslider,_ms_version_3.0.1,,qode_grid_1200,qode-content-sidebar-responsive,qode-theme-ver-10.1.1,wpb-js-composer js-comp-ver-5.0.1,vc_responsive

百邁客亞洲棉科研成果在Nature Genetics上發(fā)表

棉花是世界上最重要的經(jīng)濟(jì)作物之一,在2018年5月8日中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所所長(zhǎng)李付廣研究員、武漢大學(xué)朱玉賢院士、中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所杜雄明研究員、中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)基因組研究所所長(zhǎng)黃三文研究員、林濤博士與北京百邁客生物科技有限公司關(guān)于亞洲棉的合作成果發(fā)表在Nature Genetics上,論文題目為“Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits”。該研究以全新亞洲棉基因組為基礎(chǔ),增加遺傳進(jìn)化和GWAS研究,對(duì)棉的品質(zhì)、產(chǎn)量、抗病等重要農(nóng)藝性狀進(jìn)行研究。其中朱玉賢院士與李付廣研究員為通訊作者,杜雄明研究員為第一作者。

以下為文獻(xiàn)詳細(xì)解讀:

英文題目:Sequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits.
中文題目:以更新的亞洲棉A基因組為基礎(chǔ)的243份二倍體棉花的重要農(nóng)藝性狀的研究
1. 摘要:
亞洲棉(Gossypium arboreum)和草棉(Gossypium herbaceum)的祖先是現(xiàn)代栽培異源四倍體棉花A亞基因組的供體。本研究中通過(guò)整合了不同的技術(shù),提升了亞洲棉的基因組組裝水平;同時(shí)對(duì)243株二倍體棉花(亞洲棉和草棉)進(jìn)行全基因組重測(cè)序分析,繪制基因組變異圖譜,并發(fā)現(xiàn)亞洲棉和草棉(A)與雷蒙德氏棉(D)同時(shí)進(jìn)行了分化;單獨(dú)的對(duì)亞洲棉分析表明亞洲棉起源于中國(guó)南部,隨后被引入長(zhǎng)江和黃河地區(qū),大多數(shù)具有馴化相關(guān)特性的種質(zhì)都經(jīng)歷了地理隔離;通過(guò)亞洲棉的全基因組關(guān)聯(lián)分析(GWAS),鑒定了亞洲棉11個(gè)重要農(nóng)藝性狀的98個(gè)顯著關(guān)聯(lián)位點(diǎn),GaKASIII的非同義替換(半胱氨酸/精氨酸替換)使得棉籽中的脂肪酸組成(C16:0和C16:1)發(fā)生了變化;棉花枯萎病抗性與GaGSTF9基因的表達(dá)激活相關(guān)。本研究對(duì)理解棉花A亞基因組的進(jìn)化具有重要的意義。
2. 研究背景:
棉花是世界上最重要的商業(yè)作物之一,同時(shí)也是研究植物多倍化的有價(jià)值的資源。亞洲棉最可能在馬達(dá)加斯加或印度河流域文明(巴基斯坦摩亨佐達(dá)羅)開始馴化,隨后分散到非洲和亞洲一些地區(qū)。亞洲棉最初在1000多年前作為觀賞植物引入中國(guó)。當(dāng)?shù)胤降霓r(nóng)業(yè)生態(tài)環(huán)境的適應(yīng)和人類選擇影響的過(guò)程中,中國(guó)的Gossypium arboreum形成了獨(dú)特的地理種群,稱之為“sinense cotton”。
雖然棉花種植者已經(jīng)基于RFLP和SSR markers構(gòu)建了各種遺傳圖譜,但是G. arboreum和G. herbaceum優(yōu)良農(nóng)藝和經(jīng)濟(jì)性狀的基因尚未被鑒定。同樣通過(guò)種內(nèi)和種間特異性雜交將二倍體的重要特性引入四倍體并不是富有成效的,G. raimondii,G. arboreum,G. hirsutum和G. barbadense基因組序列的發(fā)布為研究群體遺傳,栽培和馴化提供了先決條件。通過(guò)GWAS和QTLs在水稻,玉米,大豆,谷子,黃瓜,番茄和陸地棉中鑒定了許多候選基因。本研究中,利用了三代PacBio和Hi-C技術(shù),重新組裝了高質(zhì)量的亞洲棉基因組,分析了243份二倍體棉花種質(zhì)的群體結(jié)構(gòu)和基因組分化趨勢(shì),同時(shí)確定了一些有助于棉花皮棉產(chǎn)量遺傳改良的候選基因位點(diǎn)。
3. 材料和方法:
測(cè)序材料:
基因組測(cè)序材料:二倍體G. arboreum栽培品種cultivar Shixiya1(SXY1);
自然群體材料選擇:243份棉花,包含230份亞洲棉 G. arboretum 和13份草棉 G. herbaceum [243份棉花選自國(guó)家種質(zhì)基因庫(kù)(中國(guó)安陽(yáng)),種植在中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所(ICR,CAAS)的溫室中],插入片段長(zhǎng)度500 bp;測(cè)序深度6X;
遺傳群體材料選擇:親本(GA0146和GA0149),測(cè)序深度20X;2個(gè)混池(F2群體,有絨型和無(wú)絨型各20個(gè)子代),測(cè)序深度30X;
群體材料表型調(diào)查:
在230份亞洲棉中選擇了215份表型穩(wěn)定的材料,分別在河南安陽(yáng),海南三亞和新疆阿克蘇進(jìn)行種植,大部分性狀選自多年多點(diǎn)的表型數(shù)據(jù)進(jìn)行調(diào)查,每個(gè)地點(diǎn)設(shè)置3次重復(fù)。
測(cè)序平臺(tái):
PacBio RSII和Illumina HiSeq 2500
相關(guān)軟件:
基因組組裝(Canu和Falcon;Quiver;Pbjelly);TEs轉(zhuǎn)座元件注釋(RepeatScout,LTR-FINDER,MITE和PILER;Repbase;REPET;RepeatMasker);基因預(yù)測(cè)注釋(geMoMa;Augustus;PASA;EVidenceModeler;InterProScan)
群體研究:比對(duì)注釋(BWA,Picard,GATK,ANNOVAR);群體結(jié)構(gòu)分析(FastTree,PHYLIP,STRUCTURE);連鎖不平衡分析(Haploview);遺傳多樣性分析(π,F(xiàn)st);全基因組關(guān)聯(lián)分析(EMMAX);
4. 研究結(jié)果:
1. 亞洲棉基因組組裝更新
三代+Hi-C:PacBio reads ?(77.6×);有效Hi-C reads(>20×)
三代組裝結(jié)果:共計(jì)獲得了142.54 Gb ?原始三代測(cè)序數(shù)據(jù),組裝1.71 Gb亞洲棉基因組,Contig N50=1.1 Mb,最長(zhǎng)的Contig為12.37 Mb
(1)Hi-C輔助基因組組裝:利用Hi-C技術(shù)將組裝的1573 Mb的數(shù)據(jù)定位到13條染色體上,與已經(jīng)發(fā)表的基因組相比,當(dāng)Hi-C數(shù)據(jù)比對(duì)到更新的基因組后,對(duì)角線外的不一致性明顯減少(圖1 a-b)。

圖1 Hi-C數(shù)據(jù)在兩版亞洲棉基因組上的比對(duì)

a. Hi-C數(shù)據(jù)與亞洲棉原基因組比對(duì);b. Hi-C數(shù)據(jù)與亞洲棉更新基因組比對(duì)
(2)基因組共線性分析:進(jìn)行了亞洲棉A型與異源四倍體陸地棉的AADD型的共線性分析,發(fā)現(xiàn)更新后的基因組的共線性更高(圖2 a-b)。

圖2 亞洲棉(AA型)與陸地棉(AADD型)共線性分析

a. 亞洲棉原基因組與陸地棉基因組共線性分析;b. 亞洲棉更新基因組與陸地棉基因組共線性分析
(3)亞洲棉原基因組(二代)與更新后基因組(三代)比較(表1):

表1 亞洲原基因組與更新后基因組的組裝指標(biāo)比較

 

2. 二倍體棉花群體遺傳進(jìn)化分析
(1)二倍體棉花群體材料選擇
共計(jì)選擇了243份二倍體棉花材料:230份亞洲棉G. arboreum (A2) ?和13份草棉G. herbaceum (A1);材料來(lái)源:中國(guó)南部(SC),長(zhǎng)江(YZR)和黃河(這些區(qū)域代表了中國(guó)二倍體棉花大部分的表型和地理多樣性)。

圖3 亞洲棉的地理分布

(2)群體重測(cè)序數(shù)據(jù)統(tǒng)計(jì)
通過(guò)重測(cè)序的研究策略,利用Illumina HiSeq 2500 ?測(cè)序平臺(tái),PE125雙端測(cè)序,共計(jì)獲得了2.29 T數(shù)據(jù),平均測(cè)序深度~6.0×,以本研究中更新后的亞洲棉基因組為參考基因組進(jìn)行比對(duì)分析,統(tǒng)計(jì)獲得了17,883,108個(gè)高質(zhì)量SNPs和2,470,515個(gè)indels,242,449 個(gè)SNPs(1.36%)和16,816個(gè)indels(0.68%)位于亞洲棉36,205個(gè)基因的編碼區(qū)。在31,549個(gè)基因中,共計(jì)鑒定了128,512(0.72%)個(gè)非同義突變SNPs,在8,117個(gè)基因中共計(jì)鑒定了11,372 (0.46%)個(gè)indels。
(3)二倍體棉花群體分層分析
以雷蒙德氏棉(G. raimondii)為外群,利用72,419個(gè)SNPs構(gòu)建系統(tǒng)發(fā)育樹,顯示:G. herbaceum(草棉)和G. arboretum(亞洲棉)聚類成2個(gè)獨(dú)立的群(圖4 a-b)。G. arboretum(亞洲棉)進(jìn)一步又分為SC,YZR和YER三個(gè)群,顯示了地理分布模式的差異,進(jìn)而利用PCA分析支持這一結(jié)果(圖4 c)。同時(shí)發(fā)現(xiàn)了亞洲棉和草棉是由不同的祖先種馴化而形成。

圖4 二倍體棉花的群體分層分析

a. 243份二倍體棉花系統(tǒng)發(fā)育樹 b. 243份二倍體棉花的群體結(jié)構(gòu)分析 c. PCA主成分分析(中國(guó)亞洲棉的PCA分析;亞洲棉和草棉的PCA分析)
(4)二倍體棉花LD和選擇性清除分析
通過(guò)表型計(jì)算統(tǒng)計(jì)發(fā)現(xiàn),與長(zhǎng)江和黃河區(qū)域的兩個(gè)不同地區(qū)的材料項(xiàng)目,中國(guó)南部的材料的表型相對(duì)匱乏。此外中國(guó)南部SC的亞洲棉(π=0.211×10-3)比長(zhǎng)江流域YZR(π=0.197×10-3)和黃河流域YER(π=0.199×10-3)的亞洲棉的核苷酸多態(tài)性高,這表明了亞洲棉最早在中國(guó)南部地區(qū)種植,并進(jìn)一步擴(kuò)展到長(zhǎng)江和黃河地區(qū),而這與之前基于SSR分析的結(jié)果一致;連鎖不平衡分析結(jié)果顯示,亞洲棉的LD衰減距離約為105.5 kb(r2=0.40),草棉的衰減距離約為145.5 kb(r2=0.39)(圖5),其LD衰減距離與大豆(約83 kb)和水稻(秈稻約123 kb;粳稻約167 kb)接近,但遠(yuǎn)遠(yuǎn)高于栽培玉米(22-30 kb)。大約有23.9%的亞洲棉和22.9%的草棉的等位基因與雷蒙德氏棉的基因組相一致,暗示了亞洲棉與草棉同時(shí)開始分化(圖6)。

圖5 連鎖不平衡分析? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖6 棉屬的系統(tǒng)發(fā)育與等位基因分析

人工選擇在農(nóng)作物的馴化和遷徙的過(guò)程中具有重要的作用。群體結(jié)構(gòu)分析顯示當(dāng)K=4時(shí),YER與SC和YZR明顯不同(圖4 b,K=4)。通過(guò)兩兩群體間(SC vs. YZR, SC vs. YER, YZR vs. YER)的選擇性清除分析(FST)鑒定出了分別覆蓋到3,162,2,879和3,308個(gè)基因上的59,53和51個(gè)顯著遺傳分化的區(qū)域。SC和YZR之間的21個(gè)分化的區(qū)域(約43.5 Mb 含有915個(gè)基因)在群體SC和YER之間是保守的(圖7 a)。

圖7 a. 亞洲棉SC,YZR和YER的選擇性清除分析;b. 全基因組關(guān)聯(lián)分析

3. 亞洲棉的全基因組關(guān)聯(lián)分析(GWAS)
對(duì)來(lái)自不同環(huán)境下的11個(gè)重要性狀進(jìn)行全基因組關(guān)聯(lián)分析,在98個(gè)顯著關(guān)聯(lián)的信號(hào)中,其中25信號(hào)個(gè)來(lái)自基因區(qū)(外顯子或內(nèi)含子區(qū)),包含與形態(tài)性狀相關(guān)的8個(gè)信號(hào)區(qū),與產(chǎn)量性狀相關(guān)的6個(gè)信號(hào)區(qū),與油籽性狀相關(guān)的3個(gè)信號(hào)區(qū);剩余73個(gè)信號(hào)來(lái)自非編碼區(qū)。大部分農(nóng)藝性狀的GWAS關(guān)聯(lián)信號(hào)中顯示地理差異,如交配分支數(shù),開花期,鈴重和抗病性這些性狀定位在保守的基因區(qū)(圖7 b,表2)。因此推斷成熟度,產(chǎn)量和抗病性這些性狀一直處于強(qiáng)烈的認(rèn)為和/或地理選擇之下。

表2 部分與性狀關(guān)聯(lián)的SNPs及候選基因


(1)脂肪酸含量相關(guān)基因的定位與研究 棉花是世界上第六大植物油來(lái)源,通過(guò)GWAS關(guān)聯(lián)分析,在11號(hào)染色體上的GaKASIII基因組座位上(Ga11G3851)的第8個(gè)外顯子區(qū)獲得了1個(gè)顯著的SNP位點(diǎn),該基因編碼3-Oxoacyl-[acyl-carrier-protein ACP] synthase III(3-氧?;?[酰載體蛋白]合酶III),如圖8 a-c,KASIII基因編碼的這一關(guān)鍵酶可以使得脂肪酸鏈從C2到C4延伸,并最終確定種子中棕櫚酸(C16:0)和棕櫚油酸(C16:1)的組成。GaKASIII基因的多態(tài)性導(dǎo)致了保守的ACP_synthase_III_(酰載體蛋白合酶III)結(jié)構(gòu)域中半胱氨酸/精氨酸間的置換(圖8 c),單倍型B(TGT,Cys)主要出現(xiàn)在低含油量種質(zhì)中,而在高含油量種質(zhì)中發(fā)現(xiàn)單倍型A(CGT,Arg)(圖8 d-e)。GaKASIII基因在開花后(DPA)的30天表達(dá)量最高(圖9),這是種子油量積累的關(guān)鍵階段,在單倍型種質(zhì)A中,C16:0和C16:1含量以顯著的速率累積(圖10);蛋白質(zhì)結(jié)構(gòu)模型預(yù)測(cè)顯示,半胱氨酸/精氨酸殘基位于α螺旋處,該位點(diǎn)靠近酶活性位點(diǎn),同時(shí)是輔酶A(CoA)結(jié)合位點(diǎn)(圖11)。

圖8 脂肪酸含量GWAS關(guān)聯(lián)分析

a. 棕櫚酸含量的GWAS關(guān)聯(lián)分析;b. 棕櫚油酸的GWAS關(guān)聯(lián)分析;c. GaKASIII基因的變異(Arg/Cys);d-e. Hap. A和Hap. B中棕櫚酸和棕櫚油酸含量比較

圖9 GaKASIII基因在棉花胚珠發(fā)育過(guò)程中的表達(dá)

圖10 在棉花生長(zhǎng)發(fā)育過(guò)程中C16:0和C16:1脂肪酸含量分析(Hap. A和Hap. B)

圖11 GaKASIII蛋白結(jié)構(gòu)模型

(2)棉花枯萎病抗性相關(guān)基因的研究 棉花枯萎病是由尖孢鐮刀菌萎蔫?;虵usarium oxysporum f. sp. vasinfectum (FOV)引起的棉花維管束病害,是棉花產(chǎn)量的重要威脅之一。通過(guò)GWAS,進(jìn)行棉花FOV抗性分析,發(fā)現(xiàn)在11號(hào)染色體上獲得了強(qiáng)的關(guān)聯(lián)信號(hào),其-logP value=8.96(圖12 a)。進(jìn)一步分析表明,關(guān)聯(lián)到的SNP簇位于Ga11G2353基因的上游(圖12 b),該基因與擬南芥GSTF9基因?yàn)橹毕低椿?,GSTF9基因編碼參與植物對(duì)生物和非生物脅迫響應(yīng)的谷胱甘肽S轉(zhuǎn)移酶(glutathione-S-transferases),攜帶疾病易感等位基因‘T’(以紫色顯示)的種質(zhì)主要在SC群體中發(fā)現(xiàn),所有YER群體材料攜帶耐病等位基因‘C’(以橙色顯示)(圖12 c)。研究發(fā)現(xiàn)GSTF9基因僅在FOV接種到亞洲棉幼苗的耐受系中上調(diào)(圖13),與空載體棉花系(TRV::00)相比,GSTF9基因沉默棉花品系(TRV::GSTF9, the virus-induced gene silencing,VIGS,vector carrying the GSTF9 gene)對(duì)于FOV的接種更加敏感(圖14-15)。此外,TRV::GSTF9植株系與TRV::00植株系相比,TRV :: GSTF9植株系中的真菌DNA的量顯著高于TRV::00植株系,且GST催化活性顯著低于TRV::00植株系(圖16 a-b),表明GaGSTF9基因可能是亞洲棉FOV抗性的靶標(biāo)。

圖12 亞洲棉FWDI的全基因組關(guān)聯(lián)分析

a. FWDI的GWAS分析;b. GaGSTF9基因結(jié)構(gòu)及附近關(guān)聯(lián)到的SNPs;c. 關(guān)聯(lián)分析群體基因分型 敏感型(紫);耐受型(橙)


圖13 GaGSTF9基因表達(dá)的qRT-PCR分析

注:根部接種鐮刀霉菌,(高耐受型GA0165,GA0078和GA0190;高敏感型GA0198,GA0035和GA0026)


圖14 不同植株處理后的病癥比較(GA00198,GA0165,TRV::00和TRV::GSTF9,
處理?xiàng)l件:接種水和FOV)

圖15 不同植株處理后的疾病感染指數(shù)比較(GA00198,GA0165,TRV::00和TRV::GSTF9,處理?xiàng)l件:接種FOV)


圖16 a GA00198, GA0165, TRV::00和TRV:GSTF9植株中FOV DNA的相對(duì)含量測(cè)定;b GA00198, GA0165, TRV::00和TRV:GSTF9植株中GST酶活性測(cè)定;

(3)與棉絨相關(guān)基因的研究 棉絨是覆蓋種子表面的短纖維。研究中選擇了亞洲棉種質(zhì)中的158份有絨毛和57份無(wú)絨毛材料進(jìn)行GWAS關(guān)聯(lián)分析,最終在8號(hào)染色體上(?0.6 Mb至?1.3 Mb的區(qū)間內(nèi))獲得了強(qiáng)烈的關(guān)聯(lián)信號(hào)(圖17 a-b)。QTL分析也同樣定位到8號(hào)染色體上(圖17 c)。通過(guò)有絨毛品系(GA0146)和無(wú)絨毛品系(GA0149)雜交獲得的F2代顯示了有絨毛和無(wú)絨毛的表型分離比為1:3(圖17 d),說(shuō)明了棉絨的生長(zhǎng)是由單基因座控制。研究中進(jìn)而放大了QTL和GWAS的重疊區(qū),發(fā)現(xiàn)了這個(gè)大約600 kb的區(qū)域包含推測(cè)的10個(gè)蛋白編碼基因(圖17 e)。在這一強(qiáng)烈的信號(hào)區(qū)域(-logP = 18.95)下或附近,發(fā)現(xiàn)了4個(gè)凱氏帶膜蛋白基因(casparian strip membrane protein genes)。在B-型細(xì)胞周期蛋白上游獲得了1個(gè)信號(hào),而B-型細(xì)胞周期蛋白之前被報(bào)道過(guò)與毛狀體和纖維發(fā)育有關(guān)。

圖17 棉絨生長(zhǎng)發(fā)育基因的聯(lián)合定位(GWAS+QTL)

a 亞洲棉種子有絨(左)和無(wú)絨(右)表型;b GWAS關(guān)聯(lián)分析;c F2群體QTL分析;d F2群體的構(gòu)建 e GWAS和QTL聯(lián)合分析
亞洲棉在中國(guó)棉花的栽培史上具有重要的作用。本研究揭示了中國(guó)的亞洲棉群體呈現(xiàn)出不同的地理格局,這一觀點(diǎn)與其從中國(guó)的南部到長(zhǎng)江和黃河的引入相一致。幾種表型如產(chǎn)量和抗病性狀在棉花從中國(guó)南部遷徙到長(zhǎng)江再到黃河,經(jīng)歷了顯著的變化,而這一變化受到了當(dāng)?shù)丨h(huán)境和人為選擇的影響。研究中通過(guò)不同種質(zhì)群體的比較,獲得的地理受選擇的基因區(qū)域與QTL重疊區(qū)域是重要的,具高分辨率的遺傳資源,這將極大地促進(jìn)棉花復(fù)雜性狀的改良。此外,研究中確定了GaKASIII基因可以促進(jìn)棉花脂肪酸鏈的延伸和含油量,同時(shí)發(fā)現(xiàn)了2種典型的GaGSTF9基因單倍型啟動(dòng)子與FOV抗性相關(guān)。最后結(jié)合GWAS與QTL共同定位的結(jié)果,鑒定了凱氏帶膜蛋白基因在棉絨細(xì)胞的發(fā)育過(guò)程中可能發(fā)揮功能性的作用。本研究表明地理隔離已經(jīng)影響了SC,YZR和YER群體的遺傳基礎(chǔ),同時(shí)影響了中國(guó)亞洲棉的抗病性和產(chǎn)量性狀的形成與分布。

 

想與我們的技術(shù)人員進(jìn)行文章思路溝通?請(qǐng)點(diǎn)擊下面的按鈕,免費(fèi)獲取設(shè)計(jì)方案。