日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

基因家族分析之同源基因的寻找

發布時間:2024/8/5 综合教程 84 生活家
生活随笔 收集整理的這篇文章主要介紹了 基因家族分析之同源基因的寻找 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Blast進行同源基因的尋找

參考博客:

http://boyun.sh.cn/bio/?p=1849
https://www.bioinfo-scrounger.com/archives/673/

基于蛋白的比對結果,尋找某一個蛋白家族的同源基因,使用如下的參數

identity >30%;
e-value <1e-10;
score>200
overlap >60%

首先對感興趣的基因家族蛋白序列建立索引

makeblastdb -in test.fsa -parse_seqids -dbtype prot -out test_db

然后使用blastp比對到建立好索引的數據庫

-outfmt "6 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore qcovs"

blastp -query Bju.chr.modified_id.pep.fa -db MAGL_pep -outfmt "6 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore qcovs" -max_hsps 1  -num_alignments 1 -evalue 1e-10 -num_threads 30  -out Bju.MAGL.v2.txt

如果需要blast比對返回一個最優的比對結果,需要控制-max_target_seqs , -num_alignments 和 -max_hsps 選項:

-max_target_seqs <Integer, >=1>Maximum number of aligned sequences to keepNot applicable for outfmt <= 4* Incompatible with: num_descriptions, num_alignments 
-num_alignments <Integer, >=0>Number of database sequences to show alignments for* Incompatible with: max_target_seqs

分割NR子庫

NCB blast-2.8版本可支持用NCBI自帶代碼分割的NR子庫的索引作為比對的庫,使用比較方便

NR庫也要重新下載了ftp://ftp.ncbi.nlm.nih.gov/blast/db/v5/

如果只想比對到單一物種人9606

blastp –db nr –query query.fasta –taxids 9606 –outfmt 6 –out blast.outfm6

比對NR子庫哺乳動物的話,需要先建個哺乳動物子庫tax_id索引

get_species_taxids.sh -t 40674 > 40674.txids

將序列比對至NR哺乳動物子庫

blastp –db nr –query query.fasta –taxidlist 40674.txids –outfmt 6 –out blast.outfm6

總結

以上是生活随笔為你收集整理的基因家族分析之同源基因的寻找的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。