日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

二代测序技术之illumina测序技术原理简介

發布時間:2023/12/8 编程问答 52 豆豆
生活随笔 收集整理的這篇文章主要介紹了 二代测序技术之illumina测序技术原理简介 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

現今的生信領域幾乎就是和無數的序列打交道,而這些序列的來源就是如今風靡的高通量測序技術,現今的測序不論是測RNA、DNA、miRNA還是ChIP-Seq等等,都是基于NGS(二代測序,next-generation sequencing)的技術發展而來的,目前最為常用的就是illumina公司的測序技術,當然除了illumina公司外還是有其它二代測序技術存在的,ABI公司也有SOLiD測序技術。而之所以被稱為二代測序,是因為比一代測序技術提升了非常多,具體體現在速度、準確性、效率等等方面。

由于序列對于生信行業的重要性,我認為了解基本的測序技術的原理是非常必要的,這也有利于生信技術人員了解到測序序列的特點和測序序列中可能出現的問題,了解到現今測序技術的局限性,甚至提出意見改進測序技術。因此本文會簡要介紹當今最常用的illumina測序技術的測序原理。

文章目錄

    • 基因文庫制備(sample prep)
    • 生成序列簇(cluster generation)
    • 測序(sequencing)
    • 數據處理(data analysis)


基因文庫制備(sample prep)

制備測序基因文庫是最初始的一步,這里我不過多解釋文庫,簡要解釋文庫就是一個包含你所要測序的所有基因序列的集合體。測序過程中的基因文庫的制備是將要測序的樣本經過序列片段化(fragmentation)、再將這些片段化后得到的所有短序列的兩端加上接頭,從而將要測序的序列制備成為一個有很多擁有相同雙端序列,但內部序列不同的序列片段集合體。具體步驟如下圖。

圖自:https://max.book118.com/html/2017/0924/134913788.shtm

解釋一下圖中的步驟:

  • 首先將要測序的序列或者基因組等使用nebulisation(霧化)或者sonification(超聲)再或者是酶學方法處理,即可得到片段化后的DNA序列,每個片段大概200-300bp。
  • 片段化后的序列很大幾率是擁有末端凸出的序列,并不是完整的配對狀態,因此需要使用酶將其末端補平。
  • 再使用酶在序列的平末端兩端各加上一個A(腺嘌呤)尾。
  • 通過上一步加上的A尾,illumina公司制作的接頭(adapter)很容易加在序列的兩端。
  • 通過上面的步驟,制作步驟就結束了。但是需要提升測序序列的數量從而提高測序的準確性,也使后續的序列拼接步驟較為方便。因此最后還需要進行PCR操作擴增基因文庫中序列的數量。由于每個序列的兩端都有接頭,因此設計的引物只需要和接頭配對即可,十分方便。

有博客中寫到文庫制作是有兩次序列片段化的過程的,這個具體我不是很清楚,但是實際上操作是一樣的,只是會重復某些步驟而已。有興趣的人可以去看這篇文章

這里要提一下加上的接頭序列,一個序列片段加上接頭后即變成如圖的序列:


圖自:https://www.cn-healthcare.com/articlewm/20210110/content-1179325.html

  • 原始的序列在③處,而③之外的兩端各為一個接頭。
  • ①處為后續會使用到的區域,暫時先不解釋。
  • ②處是測序時會使用到的片段,測序時發揮功能的引物是和②處配對的,配對后向中間部分(即③,要測序的序列)擴增序列,從而達到邊合成、邊測序(sequencing by synthesis)的效果。
  • 這里圖中提到的read1和read2是代表從正向和反向兩次測序得到的序列結果。既然只是一條DNA序列,那為什么要測兩次呢,這是因為有時候序列片段化不夠徹底導致序列較長,而測序的序列若是較長則會導致測序的結果越來越不準,并且測序也可能達不到序列的全長,而從兩端都進行測序就能夠延長測序長度同時還能夠使測序結果相對更為準確一些。
  • ④處的序列是后續用于區別樣品來源的一段引物配對序列。由于現今的測序技術已經達到很快速且很高效的地步,要是每次測序都只是測很短的序列,那么會導致資源浪費,因此每次測序可以盡量多測幾組從而不浪費測序資源。這里的index序列就是后續區別所添加的樣本來源的依據。后面測序步驟時會再介紹。

生成序列簇(cluster generation)

這一個步驟很多博客直接起名為橋式PCR,我覺得不夠完整,橋式PCR只是是其中的一個重要的步驟,重要的是通過一系列包含了橋式PCR的步驟,從而生成了測序序列的序列簇。什么叫序列簇呢?就是相同的序列都聚集在一起從而形成的一簇序列。這個步驟是最最最核心的步驟,也是illumina公司的專利技術所在。

生成序列簇的意義是因為若是僅有一條序列進行測序,而測序時每條序列上又僅有一個熒光分子,而一個熒光分子所釋放的熒光是很難被設備檢測到的,而將每條需要測序的序列進行處理從而生成序列簇后就能在每次檢測熒光時檢測到一群相同的序列所釋放的熒光,這樣就不會有剛剛的問題了。大致了解序列簇后,接下來就要介紹序列簇的生成了。

序列簇的生成是在flowcell(流動槽)上形成的,一個flowcell的外觀如圖

可以看到上面有八條白色的槽,這些槽也被成為陣列式流動槽,這些流動槽中使用illumina的技術從而使數十億個納米井按照固定位置分布在槽中,這樣大數量的納米井的存在使得數據產出增加、成本降低、運行時間也相對縮短了。接下來看一下納米井是什么吧!


上面這張圖就是flowcell放大非常多倍后的情況,可以看到上面密布著密密麻麻的孔,這些孔就是一個一個的納米井,而每一個納米井中的情況是:

上面這張圖就是一個孔中的情況,每個孔中都密布著DNA探針,這些探針序列是能夠和之前提到的接頭序列互補配對的,所以每個孔中就只有兩種DNA探針,這些探針序列是通過共價鍵結合到孔底部的(這些技術都是illumina的專利技術)。

了解了上面的知識后,就可以開始介紹如何制作序列簇啦。

首先,將之前制作好的DNA文庫變性解旋,以使加入的序列都是單鏈狀態,將這些單鏈序列加入到流動槽之中,而illumina獨有的技術能夠確保每個納米井中僅進入一條序列。由于每個納米井中只進入一條序列,因此每個納米井中最終都只生成一個序列簇,也正是因此每一個納米井中的所有序列發出的熒光都是一樣的,因此對一個納米井中的熒光檢測的結果也就是一條序列測序的結果,這樣也就完成對單獨的一條序列進行測序的需求啦。

每條序列進入納米井后,由于具有接頭序列,因此其能夠與納米井中的一條探針序列配對,配對后加入dNTP和聚合酶就能夠使序列延伸到文庫中序列的長度(包含接頭),如下圖:

形成完整的雙鏈后,再使序列變性解旋,而這時新合成的鏈由于其底部的探針序列是依靠共價鍵和底部相連的,因此其不會被洗脫掉。由于其不會被洗脫,其就能夠依靠其伸出去的一端與附近的探針序列配對,如圖

就這樣配對后,再加入dNTP和聚合酶,其又會被延伸,延伸后如圖

之后再變性解旋,就得到這樣的兩條鏈

得到這樣的兩條鏈后,就反復地重復上面的橋式PCR的過程,從而使得每個納米井中有非常多序列的拷貝數,才能達到測序的要求,如下圖

測序(sequencing)

達到上圖所示的狀態后,就差不多算完成了。但是要進行測序,就得先確定測序的方向,而剛剛提到了雙端測序,也就是我們要對序列的兩條單鏈序列進行分別測序。首先進行read1的測序,使用一種酶在能與read2引物配對的序列的某個位置上將read1切斷,這樣每個納米井中就只剩下了一種方向的序列(不是5→3就是3→5),之后還會對伸出那端的核酸進行修飾防止額外延伸。這樣就能夠進行一端的測序啦。

如上圖就可以開始測序啦,測序時先加入測序引物1,配對如圖

這樣在體系中添加含有熒光標記的dNTP就開始測序了,添加有熒光標記的dNTP還額外包含一個疊氮基團,有疊氮基團的存在序列不能正常延伸,因此每添加上一個核酸后,序列的延伸會停止,這時候就能夠在觀測設備下根據納米井發出的熒光顏色讀取到正在合成的核酸,在觀測后,使用特定酶水解調疊氮基團和熒光基團,這樣下一個dNTP就能夠正常進入到延伸序列中。就是不斷的重復上面的步驟,最終就能夠讀取到序列的組成了。

貼一下示意圖


上面的圖就是一個示意圖,其中的一個固定的納米井在不同的圖中顯示不同的顏色,就一一對應著序列信息。上圖中使用的是四通道測序(即每種堿基是不同的熒光顏色,因此其需要收集四張照片,四張照片是因為每種熒光都需要分開去激發),現在illumina又有新的雙通道測序技術了,雙通道測序只依賴兩種熒光顏色即可,有興趣可以去了解一下。

上面第一部分介紹到了接頭中包含了一端index序列,在測read1結束后就會測index序列了,測index序列時,首先需要將測序得到的雙鏈水解掉。再使用read2引物和序列接頭(這時配對的部分與read1部分不同,但是延伸的方向)配對,配對后延伸大概六到八個堿基即可,這六到八個堿基就能夠用于確定樣本的來源了

測完index序列后就可以開始對read2的測序啦,要對read2測序很簡單,就只需要再進行一次橋式PCR即可,這樣得到的納米井就是所有探針序列都被延伸過的結果,如圖(同上面的一張圖一樣)

這時候再對能與read1引物配對的序列的某個位置的核酸進行切斷處理就可以啦,就留下另外一條需要測序的鏈了。之后測序的步驟同之前測read1一樣。

數據處理(data analysis)

在測序結束后,需要對得到的結果進行處理,這個方面我不是很清楚,不過可能大多會得到fastq文件。

fastq文件格式如上,

  • 第一行是測序reads的ID以及其他信息。
  • 第二行是序列
  • 第三行以+開頭,跟隨著該read的名稱。
  • 第四行代表著每個堿基的測序質量。

這個部分不多講,因為我不是很熟,以后有機會會補上的。

參考:https://www.bilibili.com/video/BV13p411f7vx
參考:http://41j.com/blog/2012/04/nextgen-sequencing-primer/
參考:https://www.illumina.com.cn/science/technology/next-generation-sequencing/sequencing-technology/patterned-flow-cells.html?langsel=/cn/
參考:https://max.book118.com/html/2017/0924/134913788.shtm
參考:https://www.cn-healthcare.com/articlewm/20210110/content-1179325.html

總結

以上是生活随笔為你收集整理的二代测序技术之illumina测序技术原理简介的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。