圖片來源:www.ebiotrade.com
技術概述
線粒體是真核細胞內(nèi)的一種十分重要的細胞器,是細胞進行氧化磷酸化的場所。線粒體擁有自身的DNA和遺傳體系,與生物進化及細胞起源有很密切關系。線粒體基因組是分子進化、系統(tǒng)發(fā)育和分子標記領域的重要研究對象,而獲得目的生物的線粒體基因組全序列,則成為該領域研究人員的首要目標。
(轉(zhuǎn)導生物編輯)
技術詳情
除了少數(shù)低等真核生物的線粒體基因組是線狀DNA分子外,一般都是一個環(huán)狀的DNA分子。由于線粒體DNA并不容易從細胞中分離出來進行直接測序分析,通過對總DNA進行簡并引物PCR釣取、未知序列擴增以及長PCR擴增等方法成為了精確獲得線粒體基因組全序列最主流的方法。
微小型動物,極易出現(xiàn)混樣,其主要難度在于提取的基因組濃度低,在實驗方法上,采用單個個體提取基因組,核基因鑒定完后把同一目標物種的基因組混合,然后對基因組進行復制處理,用于短片段的調(diào)取,采用的試劑盒是:PicoPLEXTM WGA Kit。全長實驗完成后再用一個個體進行全長驗證。所以對于此類物種要求樣品量充足,新鮮,盡量是一個群體采集。
植物和細菌,我們采用高通量測序測序加一代測序的方法進行全長測序,因為單純依賴高通量技術難以獲取完整環(huán)形結(jié)果,需要一代測序補漏拼接,而且花費的總時間較長。我們采用對總DNA進行提取,調(diào)取部分保守的基因,然后采用長PCR擴增,對這些長片段進行高通量測序。
線蟲,這類低等動物,線粒體基因組結(jié)構在進化上非常不平衡,某些分類階元的線蟲會表現(xiàn)出大量的基因重排和不穩(wěn)定性(基因復制,假基因)。這些基因在某些情況下,只是基因片段,在其他情況下,序列是相對保守的,但它們含有終止密碼子,似乎是沒有功能的基因[ ]。正是由于這一特點,我們選擇用sanger測序法,實驗過程中我們需要不斷調(diào)整嘗試直至找到正確的基因順序,進一步確定基因組的大小和序列,而這些是高通量所不能達到的。
原生動物,由于這一類物種目前分來地位比較雜亂,而且有些線粒體基因組呈線狀,且數(shù)據(jù)庫中可參考的數(shù)據(jù)非常少,可想而知其測序難度。因此我們對于實驗樣品也有很高的要求,需要量大,且純。根據(jù)我們已完成的線粒體基因組,會發(fā)現(xiàn)其擁有特殊的基因如ND9,ND7,正是由于線粒體基因組結(jié)構特殊,而如果選用高通量測序,組裝的時候無法找到合適的參考基因組造成組裝錯誤或無法完成組裝。
如果遇到某些物種,其線粒體基因組變異較大,并且可參考的序列較少,有時無法準確判斷基因間的排列順序,我們會采用基因組步移的方法來推進?;蚴窃谄胀≒CR擴增中,無法準確獲得目的片段,也可采用基因組步移
1.5’或3’未知序列的獲取
根據(jù)已知序列設計3條高退火溫度的特異性下游或上游引物,同時使用低退火溫度的簡并引物,利用特異性引物與簡并引物之間退火溫度的差異進行不對稱PCR,通過三次巢式PCR獲取側(cè)翼序列。
2.對獲取的序列進行驗證
獲取側(cè)翼未知序列后,我們將分別在已知和未知序列上設計引物進行PCR擴增并對PCR產(chǎn)物進行測序,以驗證獲取序列的真實性。
對于取樣,應盡可能詳細地記錄樣品和取樣程序,并盡可能多地收集樣品。
1.如何,何時何地獲得標本? (地理坐標)。
2.標記每個樣本,如果你有條件,可以拍攝高質(zhì)量的活標本照片,標簽清晰可見。
3.記錄每個樣本的收集情況。 例如:他們屬于一個個體嗎? 或者他們是從不同的群體中收集的? 如果它們是寄生的 – 記錄它們是從一個宿主還是多個宿主收集的。
4.對寄生蟲來說,最好是讓它們活著幾天并且餓死,這樣不會讓我們的DNA樣本被宿主污染。
基因組注釋,基因組快速上傳NCBI,生成線粒體基因組組成表,進行不同基因起始密碼子/終止密碼子使用的比較分析,制作環(huán)形圖??梢陨筛鞣N統(tǒng)計表,比如按分類信息列好的基因組的AT含量、skewness以及參考文獻的統(tǒng)計表;各物種蛋白基因的長度、起始、終止密碼子統(tǒng)計生成統(tǒng)計圖,如一個或多個物種的RSCU堆積圖。對13編碼基因進行Ka/Ks分析,計算各位點核苷酸的多樣性(nucleotide diversity:π),并進行滑窗分析。也可視數(shù)據(jù)情況對非編碼區(qū)分析、串聯(lián)重復序列多個(二級結(jié)構),同時我們還可繪制tRNA二級結(jié)構圖??梢詫崿F(xiàn)基于線粒體基因組的各種形式的系統(tǒng)發(fā)育分析,按數(shù)據(jù)類型分有核苷酸序列建樹、氨基酸序列建樹;按數(shù)據(jù)分有串聯(lián)蛋白基因、tRNA基因和核糖體rRNA基因建樹;按軟件方法分有NJ樹(MEGA)、ML樹(phyml/raxml)、BI樹(MrBayes)以及異質(zhì)性模型建的貝葉斯樹(phylobayes);按數(shù)據(jù)處理有去除冗余、去除第三位密碼子、去除異質(zhì)性高的部分以及分區(qū)建樹等??梢造`活的使用itol進行系統(tǒng)發(fā)育樹的美化,比如用顏色和標簽標記科、總科、目等信息;批量替換物種名字;將每個物種的基因順序映射到系統(tǒng)發(fā)育樹上;將每個物種的基因組長度和AT含量等的條形圖映射到系統(tǒng)發(fā)育樹上。

不同基因起始密碼子/終止密碼子使用的比較分析

環(huán)形圖

線粒體基因組、線粒體各基因、蛋白基因密碼子1,2,3位A、T、C、G含量及AT-skew=[A-T]/[A+T],GC-skew=[G-C]/[G+C]分析及其與其它類群的比較等(多個)

密碼子分析:密碼子相對使用頻率(RSCU)條形圖;近緣物種mtDNA在密碼子使用選擇方面的差異比較。

13個編碼基因的Ka/Ks分析,結(jié)果以圖片形式展示

滑窗分析:計算各位點核苷酸的多樣性(nucleotide diversity:π),并進行滑窗分析。

非編碼區(qū)分析、串聯(lián)重復序列多個(二級結(jié)構)(根據(jù)數(shù)據(jù)是否可分析來決定)

tRNA二級結(jié)構圖

系統(tǒng)發(fā)育分析(NJ/BI/ML法)
PhyloSuite,一款以流程化、界面化操作方式完成系統(tǒng)發(fā)育分析的工具套件[2]
系統(tǒng)發(fā)育分析,俗稱“建樹”,是科研工作中非常重要的內(nèi)容之一,不管是鑒定新物種或找出不同物種間的進化關系,都離不開系統(tǒng)發(fā)育分析,可以說是“建樹無處不在”。常規(guī)的操作步驟主要包括多重序列比對、進化模型選擇和系統(tǒng)發(fā)育樹重建等。通常情況下,完成這些流程比較費時,并且不同的步驟大都對輸入數(shù)據(jù)要求不盡相同,一些關鍵的參數(shù)設置還需要根據(jù)實際數(shù)據(jù)進行手工調(diào)整,尤其多基因聯(lián)合建樹時。從獲取數(shù)據(jù)(NCBI下載)到系統(tǒng)發(fā)育樹重建的規(guī)范性以及結(jié)果的可重復性都是得出嚴肅科學結(jié)論的重要前提,這些不僅對于新手是一個嚴峻的考驗,對于老手同樣也不是舉手投足之間可以完成的事。有鑒于此,我們開發(fā)了PhyloSuite。
軟件下載地址:
https://github.com/dongzhang0725/PhyloSuite/releases
參考文獻
[[1]] Zou H, Jakovli? I, Chen R, et al (2017) The complete mitochondrial genome of parasitic nematode Camallanus cotti: extreme discontinuity in the rate of mitogenomic architecture evolution within the Chromadorea class. BMC Genomics 18:840. doi: 10.1186/s12864-017-4237-x
[2]Zhang, D., Gao, F., Li, W.X., Jakovli?, I., Zou, H., Zhang, J., and Wang, G.T. (2018). PhyloSuite: an integrated and scalable desktop platform for streamlined molecular sequence data management and evolutionary phylogenetics studies. bioRxiv, doi: 10.1101/489088.
聚生物技術詞條修善計劃
對現(xiàn)在的詞條不滿意?或者您有關于該技術的獨特見解,最新發(fā)展資訊?都可以投稿給聚生物。一經(jīng)采用,您對該詞條的貢獻將被聚生物所有用戶所看到。
投稿參加技術詞條修善計劃

求助,線粒體DNA測序成本