時(shí)間:2021年04月21日 分類:農(nóng)業(yè)論文 次數(shù):
摘要為進(jìn)一步探究苦茶特異性狀形成的遺傳基礎(chǔ),基于PacBio對(duì)苦茶進(jìn)行Iso-Seq,最終得到Polishedconsensus序列132334個(gè),其中有26184個(gè)為已知基因的新轉(zhuǎn)錄本,7115個(gè)為新基因,同時(shí)鑒定得到21106個(gè)SSR位點(diǎn);基因結(jié)構(gòu)分析結(jié)果中,4892個(gè)基因發(fā)生了可變剪切事件,其中內(nèi)含子滯留事件占比最大;預(yù)測(cè)得到1918個(gè)新的轉(zhuǎn)錄因子,778個(gè)LncRNA。比較KEGG(10976+5626)、KOG(6296+1896)、GO(6221+575)三大數(shù)據(jù)庫(kù)功能注釋情況,發(fā)現(xiàn)注釋到KEGG的轉(zhuǎn)錄本數(shù)最多,其中多個(gè)轉(zhuǎn)錄本注釋到與茶葉品質(zhì)和苦茶特異性狀形成相關(guān)的代謝途徑,如苦茶堿等嘌呤生物堿代謝(74+17)、氨基酸代謝(409+69)、苯丙烷生物合成(70+18)和萜類物質(zhì)生物合成(152+31)等(括號(hào)內(nèi)數(shù)值為未比對(duì)到基因組的轉(zhuǎn)錄本和新轉(zhuǎn)錄本數(shù)量)。這些發(fā)現(xiàn)將有助于苦茶特異性狀相關(guān)基因標(biāo)記的開(kāi)發(fā)、并為其形成的機(jī)理及遺傳機(jī)制的研究奠定基礎(chǔ)。
關(guān)鍵詞苦茶;全長(zhǎng)轉(zhuǎn)錄組測(cè)序;LncRNA;可變剪切
苦茶(Camelliasinensis)是中國(guó)的一種特異茶樹(shù)種質(zhì)資源[1],由其制成的茶葉感官品質(zhì)表現(xiàn)極苦,且與其他茶類的苦味不同,因此,被命名為苦茶。苦茶多分布于云南、四川,以及廣東、湖南、江西毗鄰區(qū),尤以云南以及南嶺山脈兩側(cè)最多[2-3]。在苦茶的原生地,苦茶成為當(dāng)?shù)厝嗣裆畹谋仨毱罚瑢⑺鳛橐环N藥物飲用,認(rèn)為長(zhǎng)期飲用苦茶具有“退火發(fā)汗、解毒、治病”的功效[2]。
農(nóng)業(yè)論文投稿刊物:《西南農(nóng)業(yè)學(xué)報(bào)》主要刊登農(nóng)牧業(yè)各個(gè)學(xué)科應(yīng)用基礎(chǔ)研究、應(yīng)用技術(shù)、區(qū)域綜合開(kāi)發(fā)和軟科學(xué)方面的研究報(bào)告、專題論文、研究簡(jiǎn)報(bào)、學(xué)科進(jìn)展述評(píng)等文章,立于大西南、面向全國(guó)、系學(xué)科地、及時(shí)地、有見(jiàn)地反映西南地區(qū)農(nóng)業(yè)科學(xué)研究新成果、前沿動(dòng)態(tài),以推動(dòng)農(nóng)業(yè)科研、教育和生產(chǎn)的發(fā)展。
研究已證實(shí),苦茶嘌呤生物堿的組分與常規(guī)茶樹(shù)差異較大,其以苦茶堿(1,3,7,9-四甲基尿酸)為主,其次是咖啡堿、可可堿[3-4],苦茶堿具有鎮(zhèn)靜催眠[5]、抗抑郁[6]等藥理活性,并且毒理試驗(yàn)鑒定苦茶堿為無(wú)毒[6],其還可以削弱咖啡堿的興奮作用[7],這使得苦茶的價(jià)值不斷提升,消費(fèi)需求連年增加。苦茶除含有高含量的苦茶堿外,還有非兒茶素類茶多酚[8]。
同時(shí),苦茶中還具有高含量的表沒(méi)食子兒茶素(EGC),EGC含量與紅茶中關(guān)鍵品質(zhì)成分茶黃素的含量呈極顯著正相關(guān)[2,9],所以苦茶可以作為選育和培育特異高級(jí)紅茶茶樹(shù)品種的育種材料;以往的研究表明,苦茶茶葉中存在一種具有丁香香氣的特殊物質(zhì)丁子香酚甙[2]。這說(shuō)明苦茶還具有多種不同于常規(guī)栽培茶樹(shù)的特異性狀,這些性狀形成的機(jī)理、性狀相關(guān)基因標(biāo)記的開(kāi)發(fā)以及遺傳機(jī)制的研究,都需要借助于苦茶資源。當(dāng)前,大多數(shù)轉(zhuǎn)錄組測(cè)序是基于Illumina平臺(tái)的第二代測(cè)序(SGS)技術(shù)生成的[10]。
但是,SGS技術(shù)不能產(chǎn)生較長(zhǎng)的轉(zhuǎn)錄本,并且SGS無(wú)法獲得可變剪接等信息,從而限制了該技術(shù)在轉(zhuǎn)錄組測(cè)序中的利用[11]。而全長(zhǎng)轉(zhuǎn)錄組測(cè)序是基于第三代測(cè)序(TGS)平臺(tái)進(jìn)行的,該方法可以產(chǎn)生長(zhǎng)讀段,因此可以直接測(cè)序全長(zhǎng)轉(zhuǎn)錄本[12],在這方面全長(zhǎng)轉(zhuǎn)錄測(cè)序優(yōu)于短讀測(cè)序;另外,它還可用于選擇性剪接事件及初級(jí)-前體-成熟RNA結(jié)構(gòu)的分析,以幫助更好地理解RNA的加工過(guò)程;此外,其可以在轉(zhuǎn)錄水平上全面分析由交替剪接和基因融合產(chǎn)生的結(jié)構(gòu)變異,比SGS更準(zhǔn)確地檢測(cè)結(jié)構(gòu)變異(SV),使其適合于多倍體物種或具有高重復(fù)序列和高雜合性的物種的轉(zhuǎn)錄組分析[13]。
由于茶樹(shù)基因組具有高的重復(fù)序列(至少包含64%的重復(fù)序列)和高的雜合度[14],以及苦茶特異性狀形成機(jī)制需進(jìn)一步解析。因此,本研究以苦茶為材料,利用PacBio平臺(tái)進(jìn)行Iso-Seq,對(duì)所獲得序列與參考基因組比對(duì)、同時(shí)對(duì)其進(jìn)行功能注釋、基因結(jié)構(gòu)分析等,為苦茶特征形狀遺傳分析提供基礎(chǔ)數(shù)據(jù),為更好地了解和利用這一重要的特異茶樹(shù)資源提供幫助。
1材料與方法
1.1試驗(yàn)材料
用于測(cè)序分析的苦茶資源‘老曼娥苦茶’來(lái)源于云南省農(nóng)業(yè)科學(xué)院茶葉研究所試驗(yàn)基地,其6個(gè)不同組織(芽、葉、花芽、花蕾、莖和幼果)的樣品采摘后用液氮冷凍,并置于-80℃冰箱,之后送至諾禾致源科技股份有限公司(北京)進(jìn)行測(cè)序。
1.2RNA提取與構(gòu)建文庫(kù)
參照張亞真等[15]的方法,分別提取苦茶芽、葉、花芽、花蕾、莖、幼果不同部位的總RNA,檢測(cè)合格后進(jìn)行等量混勻。利用帶有Oligo(dT)的磁珠從混勻后的RNA樣品中分離出mRNA,并利用SMARTerPCRcDNASynthesisKit將其反轉(zhuǎn)錄為cDNA,接著用BluePippin對(duì)cDNA進(jìn)行片段篩選,對(duì)全長(zhǎng)cDNA進(jìn)行損傷修復(fù)、末端修復(fù),并連接SMRT啞鈴型接頭,最終使用核酸外切酶消化獲得文庫(kù)。
1.3Iso-Seq及組裝分析
采用軟件SMRTLinkv5.0對(duì)輸出進(jìn)行過(guò)濾和處理,參數(shù):--minLength=200,--minRead-Score=0.75,最終得到的數(shù)據(jù)即為有效數(shù)據(jù),校正后獲得CCS序列(CircularConsensusSe-quence,參數(shù):--minPasses=1,minPredictedAc-curacy=0.8)。
通過(guò)檢測(cè)CCS是否包含5′-prim-er、3′-primer、poly-A對(duì)CCS進(jìn)行分類找出FLNC(full-lengthnonchimera)序列,之后對(duì)FLNC進(jìn)行聚類和校正,最終獲得polishedcon-sensus序列用于后續(xù)分析。使用MISA(http://pgrc.ipk-gatersleben.de/misa/misa.html)軟件對(duì)單、二、三、四、五和六核苷酸的最低重復(fù)次數(shù)分別設(shè)置為10、6、5、5、5和5,進(jìn)行SSR搜索。
2結(jié)果與分析
2.1Iso-Seq分析
2.1.1測(cè)序結(jié)果與組裝全長(zhǎng)
轉(zhuǎn)錄組測(cè)序共獲得8730808個(gè)Subreads(10G),平均Subreads的長(zhǎng)度為1145bp,N50為1741。通過(guò)校正,CCS序列(環(huán)形一致性序列)有418424個(gè),含有5′端引物的reads數(shù)有338306個(gè),含有3′端引物的reads數(shù)目為368458個(gè),含有PolyA尾的reads數(shù)目為351952個(gè);全長(zhǎng)序列數(shù)目為295803個(gè),F(xiàn)LNC序列的數(shù)目有217701個(gè),且FLNC的平均長(zhǎng)度為1836bp;最終獲得Pol-ishedconsensus序列132334個(gè),用于后續(xù)分析。
2.1.2SSR分析
利用MISA對(duì)苦茶全長(zhǎng)轉(zhuǎn)錄組測(cè)序獲得的25735條(大于500bp)轉(zhuǎn)錄本序列進(jìn)行搜索,共在12926條轉(zhuǎn)錄本序列中發(fā)現(xiàn)符合標(biāo)準(zhǔn)的21106個(gè)SSR位點(diǎn),其中5227個(gè)轉(zhuǎn)錄本含有大于1個(gè)SSR位點(diǎn),SSR的發(fā)生頻率為50.22%,SSR出現(xiàn)率為82%,平均2.4kb出現(xiàn)1個(gè)SSR。
在檢測(cè)到的苦茶轉(zhuǎn)錄組SSR中,單、二和三核苷酸重復(fù)類型的比例較大,分別占總SSR的32.49%、47.91%和16.18%;其他3種重復(fù)類型所占比例相對(duì)較少,只占總SSR的3.42%。苦茶轉(zhuǎn)錄組SSR重復(fù)單元的重復(fù)次數(shù)分布在5~46,其中5~10次重復(fù)的SSR位點(diǎn)有13625個(gè),占位點(diǎn)總數(shù)的64.56%;11~20次重復(fù)的SSR位點(diǎn)有7299個(gè),占總數(shù)的34.58%;20次重復(fù)以上的SSR位點(diǎn)有0.86%。
3討論與結(jié)論
目前,PacBio-Iso-Seq測(cè)序手段已在多種植物中得到了廣泛的應(yīng)用,該方法相比于二代測(cè)序具有讀長(zhǎng)長(zhǎng)、無(wú)需組裝轉(zhuǎn)錄組就可以直接獲得全長(zhǎng)轉(zhuǎn)錄本、更準(zhǔn)確地檢測(cè)結(jié)構(gòu)變異和適合于具有高重復(fù)序列和高雜合性的物種的轉(zhuǎn)錄組分析等優(yōu)勢(shì)[11-13]。本試驗(yàn)利用Iso-Seq技術(shù),結(jié)合生物信息學(xué)分析,獲得了苦茶全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)。
本研究共得到8730808個(gè)Subreads,平均Subreads的長(zhǎng)度為1145bp,N50為1741,可以看出全長(zhǎng)轉(zhuǎn)錄組測(cè)序讀長(zhǎng)長(zhǎng)且連續(xù)性較高。全長(zhǎng)非嵌合(FLNC)reads有217701個(gè),通過(guò)對(duì)FLNC-reads的聚類及校正分析,最終獲得pol-ishedconsensus序列132334個(gè)。龐丹丹等[17]對(duì)不同葉色的6份茶樹(shù)材料進(jìn)行二代測(cè)序,共獲得112233個(gè)Unigene,平均長(zhǎng)度為759bp,N50為1081bp。
Li等[18]采用RNA-seq對(duì)龍井43的根、莖、4個(gè)不同嫩度的葉片及花蕾和果實(shí)等13個(gè)組織進(jìn)行測(cè)序分析,共獲得347827條Unigene(>200bp),平均長(zhǎng)度為791.2bp,N50為1342bp。上述結(jié)果表明在獲得的序列質(zhì)量和基因數(shù)等方面,三代測(cè)序結(jié)果均優(yōu)于二代測(cè)序。苦茶的全長(zhǎng)轉(zhuǎn)錄組測(cè)序在很大程度上補(bǔ)充了現(xiàn)有茶樹(shù)基因資源,并為發(fā)現(xiàn)新的或以前未被識(shí)別的蛋白質(zhì)的編碼基因和轉(zhuǎn)錄亞型提供了優(yōu)勢(shì)。
與茶樹(shù)參考基因組比對(duì),分析發(fā)現(xiàn)大多數(shù)PacBio轉(zhuǎn)錄本是已知基因的新亞型(59.32%),有16.12%的轉(zhuǎn)錄本為7115個(gè)新基因提供了證據(jù)。分析表明,新的轉(zhuǎn)錄組數(shù)據(jù)對(duì)探究苦茶的注釋具有巨大的潛力。Unmapped轉(zhuǎn)錄本在NR數(shù)據(jù)庫(kù)中的比對(duì)結(jié)果顯示,共比對(duì)上311個(gè)物種,比對(duì)到最多的物種仍是茶樹(shù),其次是葡萄,這表明比對(duì)所用到的參考基因組可能還需進(jìn)一步完善。
比較KEGG(10976+5626)、KOG(6296+1896)、GO(6221+575)3大數(shù)據(jù)庫(kù)功能統(tǒng)計(jì)情況,發(fā)現(xiàn)注釋到KEGG的轉(zhuǎn)錄本數(shù)最多(括號(hào)內(nèi)數(shù)值為未比對(duì)到基因組的轉(zhuǎn)錄本和新轉(zhuǎn)錄本數(shù)量,下同),這些轉(zhuǎn)錄本中包含多個(gè)轉(zhuǎn)錄本與茶葉品質(zhì)和苦茶特征性狀形成相關(guān)的代謝途徑,如苦茶堿等嘌呤生物堿代謝(74+17)、氨基酸代謝(409+69)、苯丙烷生物合成(70+18)和萜類物質(zhì)的生物合成(152+31)等。Wang等[19]對(duì)3個(gè)苦茶品種進(jìn)行轉(zhuǎn)錄組測(cè)序,通過(guò)與嘌呤生物堿代謝的KEGG通路富集分析,篩選出一批與苦茶堿和咖啡堿生物合成相關(guān)的關(guān)鍵基因。同樣,本研究新注釋到的一些轉(zhuǎn)錄本亦能夠?yàn)楹笃趯?duì)苦茶性狀形成的研究提供基因資源。
可變剪切(AlternativeSplicing,AS),即某些基因的一個(gè)mRNA前體以不同的剪接方式,形成不同的mRNA異構(gòu)體[20];其能夠調(diào)控基因的表達(dá)水平和促進(jìn)蛋白質(zhì)組的多樣性,在植物生長(zhǎng)、發(fā)育和脅迫響應(yīng)中發(fā)揮著關(guān)鍵作用[21-23]。選擇性剪接的亞型具有基于組織或時(shí)間的優(yōu)先表達(dá)特征,并且它們也受環(huán)境條件的影響[24]。在茶樹(shù)中,研究發(fā)現(xiàn)可變剪切亞型在高溫、干旱、低溫等不同環(huán)境脅迫條件下的表達(dá)模式存在明顯差異[25-26],同時(shí)可變剪切事件還參與了黃酮、類黃酮和花青素等重要物質(zhì)的次生代謝過(guò)程中[24,27-28]。
因此,對(duì)基因結(jié)構(gòu)進(jìn)行分析,發(fā)現(xiàn)4892個(gè)基因發(fā)生了選擇性剪接,其中內(nèi)含子滯留事件占比最大,這為進(jìn)一步研究可變剪切在苦茶特異成分代謝中的作用奠定了基礎(chǔ)。以往的研究表明,轉(zhuǎn)錄因子(TF)參與植物多種生長(zhǎng)代謝過(guò)程中。在茶樹(shù)中,發(fā)現(xiàn)它們不僅參與葉片花等器官的發(fā)育[29-30],以及脅迫反應(yīng)[31],還參與兒茶素[17]、茶氨酸[32]和花青素[33-34]等多種次生代謝過(guò)程。
本研究還預(yù)測(cè)得到1918個(gè)TF,在獲得的TF家族中,bHLH家族有96個(gè)、C3H家族有80個(gè)、bZIP家族有70個(gè)、MYB-re-lated家族有66個(gè)、C2H2家族有66個(gè)、MYB家族有57個(gè)。這些轉(zhuǎn)錄因子的預(yù)測(cè)與分析,為之后研究苦茶特異性狀(苦茶堿[3-4]、丁子香酚甙[2]和高EGC[9]等)相關(guān)基因表達(dá)以及詳細(xì)的基因家族分析提供數(shù)據(jù)。此外,本研究還預(yù)測(cè)得到778個(gè)LncRNA,它們可能在茶樹(shù)次生代謝的調(diào)控中起著特殊的作用。本研究為苦茶品質(zhì)和特異性狀形成機(jī)制的研究提供了基礎(chǔ)數(shù)據(jù),上述結(jié)果將有助于進(jìn)一步開(kāi)展苦茶特異性狀相關(guān)基因標(biāo)記的開(kāi)發(fā)、并為其形成的機(jī)理及遺傳機(jī)制的研究奠定基礎(chǔ)。
參考文獻(xiàn)Reference:
[1]張宏達(dá).茶葉植物資源的訂正[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),1984(1):3-14.ZHANGHD,Aevisiononthetearesourceplants[J].ActaScientiarumNaturaliumUniversitatisSunyatseni,1984(1):3-14.
[2]王新超,姚明哲,馬春雷,等.我國(guó)苦茶資源主要生化成分的鑒定評(píng)價(jià)[J].中國(guó)農(nóng)學(xué)通報(bào),2008,24(6):65-69.WANGXCH,YAOMZH,MACHL,etal.Analysisand evaluationofbiochemicalcomponentsinbitterteaplantgermplasms[J].ChineseAgriculturalScienceBulletin,2008,24(6):65-69.
[3]汪云剛,劉本英,宋維希,等.云南茶組植物的分布[J].西南農(nóng)業(yè)學(xué)報(bào),2010,23(5):1750-1753.WANGYG,LIUBY,SONGWX,etal.DistributionofSect.Thea(L.)DyerinYunnanprovince[J].SouthwestChi-naJournalofAgriculturalSciences,2010,23(5):1750-1753.
[4]JOHNSONTB.Purinesintheplantkingdom:Thediscov-eryofanewpurineintea[J].JournaloftheAmericanChemicalSociety,1937,59(7):1261-1264.
[5]葉創(chuàng)興,林永成,蘇建業(yè),等.苦茶CamelliaassamicavarkuchaChangetWang的嘌呤生物堿[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),1999,38(5):82-86.
作者:龐丹丹1,2,劉玉飛1,2,孫云南1,2,田易萍1,2,宋維希1,2,陳林波1,2