日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一文掌握二代测序NGS

發布時間:2025/3/13 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一文掌握二代测序NGS 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

一. RPKM,FPKM,TPM的區別
二. 二代測序中的barcode
三.?De Novo?sequencing & resequencing
四. depth & coverage
五. 高通量測序技術
六. Sanger測序
七. 三代測序技術
八. 外顯子測序
九. small RNA測序
十. SNP、SNV、InDel、CNV、SV
十一. Duplication
十二. Read
十三. Contig/Scaffold
十四. gene fusion,基因融合
十五. Paired-end reads和single reads

一.RPKM,FPKM,TPM的區別

先說一個背景:
在運用NGS檢測基因表達量時,如果直接用每個基因對應的reads數來統計表達量,常常會導致偏差。偏差主要來源于2個方面:
1) 測序深度;
2) 基因長度。
測序深度越深,基因長度越長,對于隨機取樣的NGS測序來說,越容易測到該基因的reads,即相應的reads數越多。
因此,基于一定標準,將基因表達量均一化之后再做描述,就能避免上述偏差,獲得有意義的結果。
在此,介紹幾個均一化之后的表達量的概念:

RPKM: Reads Per Kilobase per Million mapped reads (每千個堿基的轉錄每百萬映射讀取的reads)
FPKM: Fragments Per Kilobase per Million mapped fragments(每千個堿基的轉錄每百萬映射讀取的fragments)
TPM:Transcripts Per Kilobase per Million mapped reads (每千個堿基的轉錄每百萬映射讀取的Transcripts)
舉一個簡單例子:
表1. 各基因reads數。

基因名(長度)樣本A樣本B樣本C
alpha(2kb)101230
beta(4kb)202560
gama(1kb)5815
theta(10kb)001

大家可以清楚地看到,樣本C的4個基因read counts數目明顯多於其他兩個樣本,説明其測序深度較高,基因beta的長度的基因alpha的兩倍,也使得其read counts在三個樣本中都高於alpha。接下來我們要做就是對這個矩陣進行標準化,分別計算RPKM, FPKM和TPM,為了使數值可讀性更好,下面的計算中我們用10代表million。

我們先來説説RPKM怎么算。第一步先將測序深度標準化,計算方法很簡單,先分別計算出每個樣本的總reads數(這里以10為單位),然后將表中數據分別除以總reads數即可,這樣就得到了reads per million. 如下表2:
表2. 各基因reads per million。

文章剩余內容查看<<<<<

?

總結

以上是生活随笔為你收集整理的一文掌握二代测序NGS的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。