日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

SAM文件格式

發(fā)布時間:2024/8/26 编程问答 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 SAM文件格式 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

幫朋友處理sam各式文件,又記不住sam各式每列代表的什么內(nèi)容,干脆轉(zhuǎn)個帖子留著以后查詢。

在SAM輸出的結(jié)果中每一行都包括十二項(xiàng)通過Tab分隔,從左到右分別是:

1 序列的名字

2 概括出一個合適的標(biāo)記,各個數(shù)字分別代表

  • 1? 序列是一對序列中的一個

  • 2? 比對結(jié)果是一個pair-end比對的末端

  • 4? 沒有找到位點(diǎn)

  • 8? 這個序列是pair中的一個但是沒有找到位點(diǎn)

  • 16? 在這個比對上的位點(diǎn),序列與參考序列反向互補(bǔ)

  • 32? 這個序列在pair-end中的的mate序列與參考序列反響互補(bǔ)

  • 64 序列是 mate 1

  • 128 序列是 mate 2

假如說標(biāo)記為以上列舉出的數(shù)目,就可以直接推斷出匹配的情況。假如說標(biāo)記不是以上列舉出的數(shù)字,比如說83=(64+16+2+1),就是這幾種情況值和。

3? 參考序列的名字

4 在參考序列上的位置

5? mapping qulity?? 越高則位點(diǎn)越獨(dú)特

bowtie2有時并不能完全確定一個短的序列來自與參考序列的那個位置,特別是對于那些比較簡單的序列。但是bowtie2會給出一個值來顯示出 這個段序列來自某個位點(diǎn)的概率值,這個值就是mapping qulity。Mapping qulity的計算方法是:Q=-10log10p,Q是一個非負(fù)值,p是這個序列不來自這個位點(diǎn)的估計值。

假如說一條序列在某個參考序列上找到了兩個位點(diǎn),但是其中一個位點(diǎn)的Q明顯大于另一個位點(diǎn)的Q值,這條序列來源于前一個位點(diǎn)的可能性就比較大。Q值的差距越大,這獨(dú)特性越高。

Q值的計算方法來自與SAM標(biāo)準(zhǔn)格式,請查看SAM總結(jié)。

6 代表比對結(jié)果的CIGAR字符串,如37M1D2M1I,這段字符的意思是37個匹配,1個參考序列上的刪除,2個匹配,1個參考序列上的插入。M代表的是alignment match(可以是錯配)

7? mate 序列所在參考序列的名稱

8 mate 序列在參考序列上的位置

9? 估計出的片段的長度,當(dāng)mate 序列位于本序列上游時該值為負(fù)值。

10 read的序列

11 ASCII碼格式的序列質(zhì)量

12 可選的區(qū)域

  • AS:i? 匹配的得分

  • XS:i? 第二好的匹配的得分

  • YS:i? mate 序列匹配的得分

  • XN:i? 在參考序列上模糊堿基的個數(shù)

  • XM:i? 錯配的個數(shù)

  • XO:i? gap open的個數(shù)

  • XG:i? gap 延伸的個數(shù)

  • NM:i? 經(jīng)過編輯的序列

  • YF:i? 說明為什么這個序列被過濾的字符串

  • YT:Z

  • MD:Z? 代表序列和參考序列錯配的字符串

也可以查看這個,也比較詳細(xì)

https://blog.csdn.net/u014182497/article/details/51691743 ?

轉(zhuǎn)載于:https://www.cnblogs.com/zhanmaomao/p/9281646.html

總結(jié)

以上是生活随笔為你收集整理的SAM文件格式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。