各种测序基础知识汇总
1.RNA-Seq名詞解釋
2.測序名詞解釋
3.高通量測序常用名詞解釋
4.轉錄組測序問題集錦
RNA-Seq名詞解釋
index 測序的標簽,用于測定混合樣本,通過每個樣本添加的不同標簽進行數據區分,鑒別測序樣品。
堿基質量值 (Quality Score或Q-score)是堿基識別(Base Calling)出錯的概率的整數映射。堿基質量值越高表明堿基識別越可靠,堿基測錯的可能性越小。
?Q30 堿基質量值為Q30代表堿基的精確度在99.9%。
?FPKM(Fragments Per Kilobase of transcript per Millionfragments mapped) 每1百萬個map上的reads中map到外顯子的每1K個堿基上的fragment個數。計算公式為 公式中,cDNAFragments 表示比對到某一轉錄本上的片段數目,即雙端Reads數目;Mapped Reads(Millions)表示Mapped Reads總數,以10為單位;Transcript Length(kb):轉錄本長度,以kb個堿基為單位。
FC(Fold Change) 即差異表達倍數。
FDR(False Discovery Rate) 即錯誤發現率,定義為在多重假設檢驗過程中,錯誤拒絕(拒絕真的原(零)假設)的個數占所有被拒絕的原假設個數的比例的期望值。通過控制FDR來決定P值的閾值。
P值(P-value) 即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的P 值,一般以P<0.05為顯著,P<0.01為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于0.05或0.01。
可變剪接(Alternative splicing) 有些基因的一個mRNA前體通過不同的剪接方式(選擇不同的剪接位點)產生不同的mRNA剪接異構體,這一過程稱為可變剪接(或選擇性剪接,alternative splicing)。可變剪接是調節基因表達和產生蛋白質組多樣性的重要機制,是導致真核生物基因和蛋白質數量較大差異的重要原因。在生物體內,主要存在7種可變剪接類型:A)Exonskipping;B)Intron retention;C) Alternative 5' splice site;D) Alternative3' splice site;E) Alternative first exon;F) Alternativelast exon;G) Mutuallyexclusive exon。
外顯子跳躍(Exon skipping) 外顯子在前體mRNA剪接形成成熟mRNA過程中被跳過,最終沒有出現在某些成熟mRNA上,這種剪接機制被稱為外顯子跳躍。
內含子保留(Intron retention) 前體mRNA在剪接形成成熟mRNA的過程中,部分內含子被保留下來,這種剪接機制被稱為內含子保留。
5'或3'端可變剪接 前體mRNA在剪接形成成熟mRNA的過程中,5'端或3'端邊界發生不同方式的剪接,這種剪接機制被稱為5'或3'端可變剪接。12.基因結構優化 由于使用的軟件或數據本身的局限性,導致所選參考基因組的注釋往往不夠精確,需要對原有注釋的基因結構進行修正,這一過程稱為基因結構優化。
文章剩余內容<<<<
總結
以上是生活随笔為你收集整理的各种测序基础知识汇总的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Lnc2cancer 3.0,lncRN
- 下一篇: 跟着这篇柳叶刀的文章来学会重复测量方差分