當前位置：首頁 > 运维知识 > linux >内容正文

linux

linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)

發布時間：2024/5/8 linux 63 豆豆

生活随笔收集整理的這篇文章主要介紹了 linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

PhyML利用氨基酸序列建樹步驟

(核酸建樹也可以作為參考)

前言：本文閱讀對象適合建樹新手，生物信息學高手請勿嘲笑，其中有什么錯誤還懇請指點。為什么要建樹及其你要解決什么問題這里不做討論，只是一個純粹的建樹過程，前期的序列收集過程自己費心，根據自己的需要來做。這里主要是最大似然法來建樹，NJ法像mega這些軟件中都有集成，最新的mega7也集成ML法，不過模型及各種參數不一定適合你，所以學習多種多種方法也是有用的，PhyML速度較慢，如果數列數量較多、步長檢驗次數多，等待時間會很長，有可能達到幾十小時，也與電腦配置有關，一般時間都是以小時計數，所以要有心理準備，如果數據量大，推薦用RaxML或其他方法建樹，它處理速度要比PhyML 快，不過RaxML是純命令操作，對不熟悉命令及參數意義的人有一定難度，我只在linux 下操作過，在win下沒有使用過。本文是用氨基酸建樹過程，如果你是用核酸序列建樹，也可以參考這個過程，核酸替代模型請用jmodeltest或其他同功軟件計算。

由于PhyML計算過程比較長，做一遍比較耗時，推薦你用其他軟件用NJ法先行試驗建樹，看看你選擇的序列是否有效及符合你的預期結果，調整好序列后再用PhyML跑一遍看結果是否符合自己的要求。

PhyML有線上版本，只需要提交序列比對結果，設置模型參數，留下郵箱等待就會給你返回結果，不過時間不可控，根據自身情況選擇線上還是本地自己建樹。水平有限，如有錯誤遺漏懇請各位指點。如果在文庫不能下載，可以去網盤下載，見文末。

●建樹過程：序列準備-模型選擇-建樹及樹的驗證。

●環境準備：電腦^-^Windows或者Linux都可以(沒試過mac，如果是mac環境，請參考

具體的操作手冊)、ProtTest、PhyMl及序列比對的軟件，線上或本地都可以。

1.序列準備：

在自己熟悉的數據庫中(我自己比較熟悉Ncbi)上做blast，選取跟要建樹蛋白同源的各物種序列，下載到本地，整合到一個fasta文件中，注意修改物種名稱，字數最好不要太長，序列比對后.phy格式文件對文件名長度有限制(這個可能跟軟件有關系，只要自己知道是什么物種，不至于混淆就行)，注意規范性，fasta文件中最好除了>頭標，字母及下劃線不要有其他不相關的字符，因為如果后面你要用軟件分析.phy文件的時候這些軟件對.phy的格式要求比較變態，有其他多余字符它都會報錯的(你如果在dos 下用命令合并文件請注意文件中最后一行的字符，請刪除)。做序列分析，常用的分析軟件有clustalW系列，mega也集成了蛋白比對工具，線上線下各種軟件自由選擇，區別不大，保存的格式可以選擇多一點，主要是看你后續操作。如clustalx 比對可以保存的結果格式如圖1所示。選中你希望的格式保存即可。

總結

以上是生活随笔為你收集整理的linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：基于X5内核的UI自动化
下一篇：原创：伊朗为何推翻富裕发达的巴列维王朝，