linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)
PhyML利用氨基酸序列建樹步驟
(核酸建樹也可以作為參考)
前言:本文閱讀對象適合建樹新手,生物信息學高手請勿嘲笑,其中有什么錯誤還懇請指點。為什么要建樹及其你要解決什么問題這里不做討論,只是一個純粹的建樹過程,前期的序列收集過程自己費心,根據自己的需要來做。這里主要是最大似然法來建樹,NJ法像mega這些軟件中都有集成,最新的mega7也集成ML法,不過模型及各種參數不一定適合你,所以學習多種多種方法也是有用的,PhyML速度較慢,如果數列數量較多、步長檢驗次數多,等待時間會很長,有可能達到幾十小時,也與電腦配置有關,一般時間都是以小時計數,所以要有心理準備,如果數據量大,推薦用RaxML或其他方法建樹,它處理速度要比PhyML 快,不過RaxML是純命令操作,對不熟悉命令及參數意義的人有一定難度,我只在linux 下操作過,在win下沒有使用過。本文是用氨基酸建樹過程,如果你是用核酸序列建樹,也可以參考這個過程,核酸替代模型請用jmodeltest或其他同功軟件計算。
由于PhyML計算過程比較長,做一遍比較耗時,推薦你用其他軟件用NJ法先行試驗建樹,看看你選擇的序列是否有效及符合你的預期結果,調整好序列后再用PhyML跑一遍看結果是否符合自己的要求。
PhyML有線上版本,只需要提交序列比對結果,設置模型參數,留下郵箱等待就會給你返回結果,不過時間不可控,根據自身情況選擇線上還是本地自己建樹。水平有限,如有錯誤遺漏懇請各位指點。如果在文庫不能下載,可以去網盤下載,見文末。
●建樹過程:序列準備-模型選擇-建樹及樹的驗證。
●環境準備:電腦^-^Windows或者Linux都可以(沒試過mac,如果是mac環境,請參考
具體的操作手冊)、ProtTest、PhyMl及序列比對的軟件,線上或本地都可以。
1.序列準備:
在自己熟悉的數據庫中(我自己比較熟悉Ncbi)上做blast,選取跟要建樹蛋白同源的各物種序列,下載到本地,整合到一個fasta文件中,注意修改物種名稱,字數最好不要太長,序列比對后.phy格式文件對文件名長度有限制(這個可能跟軟件有關系,只要自己知道是什么物種,不至于混淆就行),注意規范性,fasta文件中最好除了>頭標,字母及下劃線不要有其他不相關的字符,因為如果后面你要用軟件分析.phy文件的時候這些軟件對.phy的格式要求比較變態,有其他多余字符它都會報錯的(你如果在dos 下用命令合并文件請注意文件中最后一行的字符,請刪除)。做序列分析,常用的分析軟件有clustalW系列,mega也集成了蛋白比對工具,線上線下各種軟件自由選擇,區別不大,保存的格式可以選擇多一點,主要是看你后續操作。如clustalx 比對可以保存的結果格式如圖1所示。選中你希望的格式保存即可。
總結
以上是生活随笔為你收集整理的linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于X5内核的UI自动化
- 下一篇: 原创:伊朗为何推翻富裕发达的巴列维王朝,