當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一文掌握二代测序NGS

發布時間：2025/3/13 编程问答 23 豆豆

生活随笔收集整理的這篇文章主要介紹了一文掌握二代测序NGS 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一. RPKM,FPKM,TPM的區別
二. 二代測序中的barcode
三.?De Novo?sequencing & resequencing
四. depth & coverage
五. 高通量測序技術
六. Sanger測序
七. 三代測序技術
八. 外顯子測序
九. small RNA測序
十. SNP、SNV、InDel、CNV、SV
十一. Duplication
十二. Read
十三. Contig/Scaffold
十四. gene fusion，基因融合
十五. Paired-end reads和single reads

一.RPKM,FPKM,TPM的區別

先說一個背景：
在運用NGS檢測基因表達量時，如果直接用每個基因對應的reads數來統計表達量，常常會導致偏差。偏差主要來源于2個方面：
1) 測序深度；
2) 基因長度。
測序深度越深，基因長度越長，對于隨機取樣的NGS測序來說，越容易測到該基因的reads，即相應的reads數越多。
因此，基于一定標準，將基因表達量均一化之后再做描述，就能避免上述偏差，獲得有意義的結果。
在此，介紹幾個均一化之后的表達量的概念：

RPKM: Reads Per Kilobase per Million mapped reads (每千個堿基的轉錄每百萬映射讀取的reads)
FPKM: Fragments Per Kilobase per Million mapped fragments(每千個堿基的轉錄每百萬映射讀取的fragments)
TPM：Transcripts Per Kilobase per Million mapped reads (每千個堿基的轉錄每百萬映射讀取的Transcripts)
舉一個簡單例子：
表1. 各基因reads數。

基因名(長度)樣本A樣本B樣本C

alpha(2kb)	10	12	30
beta(4kb)	20	25	60
gama(1kb)	5	8	15
theta(10kb)	0	0	1

大家可以清楚地看到，樣本C的4個基因read counts數目明顯多於其他兩個樣本，説明其測序深度較高，基因beta的長度的基因alpha的兩倍，也使得其read counts在三個樣本中都高於alpha。接下來我們要做就是對這個矩陣進行標準化，分別計算RPKM, FPKM和TPM,為了使數值可讀性更好，下面的計算中我們用10代表million。

我們先來説説RPKM怎么算。第一步先將測序深度標準化，計算方法很簡單，先分別計算出每個樣本的總reads數（這里以10為單位），然后將表中數據分別除以總reads數即可，這樣就得到了reads per million. 如下表2：
表2. 各基因reads per million。

文章剩余內容查看<<<<<

總結

以上是生活随笔為你收集整理的一文掌握二代测序NGS的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

一文
NGS

上一篇：如何利用ChatGPT进行数据分析？
下一篇： R语言——双样本独立检验的快速分析立检验

编程问答

一文掌握二代测序NGS

目錄

一.RPKM,FPKM,TPM的區別

總結