日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

临床外显子组测序分析中的那些坑(中)

發布時間:2025/3/15 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 临床外显子组测序分析中的那些坑(中) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

臨床外顯子組測序分析中的那些坑(上)

4.?Exome CNV分析:參考對照組

很早以前,人們就清楚WES還可以根據樣本之間序列覆蓋深度的差異來推斷CNV。由于序列捕獲和GC含量,單個目標的覆蓋率偏差阻礙了外顯子組之間覆蓋深度的比較。從外顯子組數據中檢測CNV的大多數工具依賴于創建參考對照,以標準化每個區域的覆蓋深度,并克服數據中的覆蓋偏差。我們發現參考對照的大小和質量對CNV的質量有很大影響。具有少量樣本或具有不同測序特征的樣本混合的參考對照,將導致測序目標預期覆蓋率的變異性增加(圖1E)。

這將導致許多虛假的CNV,使解釋更加困難。2016年,我們意外地在同一參考池中組合了使用兩種不同方法比對reads的樣本。出乎意料的是,這不僅導致了虛假的CNV被檢出,還導致了大型CNV被錯過,但在之前的CNV分析中已經檢測到。目前,我們的CNV參考對照使用最新樣本不斷更新,以使測序化學和方案的變化導致的技術變化最小(圖1F)。

除此之外,根據測序平臺、富集平臺、在X染色體上分析CNV的性別,還使用了幾個獨立的參考池。為了了解潛在的質量問題,我們在趨勢分析中監控每個樣本和測序批次的CNV呼叫數量,以及每個樣本的標準化目標覆蓋率的平均變異性。根據我們的經驗,我們建議使用與捕獲試劑盒、測序儀器和化學以及性別相匹配的CNV參考對照。

5.?注釋:基因定義?

雖然我們定期更新參考數據集,如人口頻率、OMIM信息和HGMD/ClinVar分類,但我們最初沒有定期更新我們的基因定義,天真地期望人類基因組中的所有基因和轉錄本都已被徹底繪制出來。基因定義是解釋基因變異最基本的資源。有幾種可用于基因定義的公開資源,例如RefSeq(由國家生物技術信息中心(NCBI)開發)和GENCODE,它們結合了HAVANA集團的手動注釋和Ensembl的計算注釋。

有點讓我們驚訝的是,當我們將2017年GENCODE基本基因定義更新為更新版本時,我們遇到了幾個最初被注釋為非編碼的變異,但其結果是在一個新注釋的外顯子中,從而可能完全改變解釋,例如基因CCDC141(圖1G)。

RefSeq和GENCODE仍有定期更新,這些更新會改變已知的基因定義,并對WES變異的解釋產生深遠影響。特別是對于WGS,使用更廣泛的基因定義是值得的,因為變異是在全基因組范圍內檢測到的,并且不局限于WES的預定義區域。GENCODE的定期更新很好地說明了這些正在進行的改進。在過去的12個月中,基因編碼被更新了四次,最新的基因編碼V38版本,2021年5月更新包括超過2500個新的蛋白質編碼轉錄本,以及與2020年1月版本V33相比的蛋白質編碼基因列表中的幾個修改(SUP.S2表)。所有注釋的定期更新(例如每6個月更新一次),包括基因定義和現有樣本的定期重新注釋,可能會導致額外的診斷。

變異解釋

除了數據分析之外,NGS的變異解釋與傳統做法有很大不同,并且對分子和臨床遺傳學家也帶來了挑戰。在這里,我們描述了在臨床外顯子組變異解釋中遇到的問題和學到的經驗教訓,并用實際例子加以說明。這些經驗教訓暫時按重要性排序,從我們經驗中最有價值的經驗教訓開始。在所有提供的示例中,變異最初是根據我們的標準協議進行解釋的,如圖2所示。我們注意到,在實踐中,這些課程通常是組合使用的,我們提供的一些示例可能用于多個課程。

1.???? 肉眼檢查數據?

變異檢測算法需要平衡靈敏度、特異性和性能,因此并不總能提供完美的結果。因此,肉眼檢查序列比對數據(BAM/CRAM文件)以手動過濾假陽性位點是一種很好的做法。假陽性變異通常發生在同源性較高的區域,在檢查序列比對數據時很容易看到。另一方面,變異尤其是插入/刪除變異可能會被遺漏或不準確地檢出。

在一名患有神經發育障礙的患者中,我們在基因CHD2(補充圖S3)中發現了兩種分別稱為新發突變的基因(NM_001271.4:c.4592+37del和NM_001271.4:c.4592+38C>G)。這些變異中的每一個都被預測對剪接有良性或適度的影響,而這兩個變異最初都被忽略了。然而,在檢查校準數據后,這很明顯地代表了一個單一的變量Chr15(GRCh37):g.93552590_93552591delinsG NM_001271.4:c.4592+37_4592+38delinsG,它引入了一個新的供體剪接位點,預計會導致部分內含子保留和過早無義突變。類似地,通過對比對數據的肉眼檢查,我們發現GPSM2中的13堿基對雜合缺失實際上以純合狀態存在(圖3A),并且是從該變異雜合的雙親遺傳的。

尤其是在WES數據中檢測到CNV的情況下,肉眼檢查(歸一化深度文件和BAM文件)至關重要。例如,MTMR2基因中的復制事件可以被識別為逆轉錄轉座子,即拷貝DNA插入基因組,因為多個讀取正好在外顯子-內含子邊界處結束(補充圖S4)。

同樣,肉眼檢查在嵌合缺失、重復和單親二倍體的情況下尤其重要,否則可能會錯過。2015年,在一名患有多種先天性異常(左腭、異位肛門、小陰莖和短近端肢體)的患者中,通過外顯子組測序無法發現任何遺傳原因。然而,在2016年對同一數據進行CNV再分析后,我們發現了幾個小拷貝數增益,其中只有少數在所要求基因面板的限制范圍內可見。目視檢查標準化覆蓋范圍? 剖面圖立即顯示了12號染色體整個短臂的增益(補充圖S5)。該患者最終被診斷為12號染色體短臂嵌合四倍體,這是帕利斯特-基利亞綜合征(OMIM#601803)的病因。

數據的肉眼檢查是變異解釋的一個基本方面。有幾種工具可以做到這一點,包括整合基因組學查看器(IGV)。然而,對數據的目視檢查非常耗時,應僅限于錯誤調用可能性較高的變異。這類變異包括CNV、移碼變異、等位基因比率偏離理想孟德爾比率(即不明顯雜合或純合)的變異,以及單個基因中的多個相鄰變異。此外,應對實驗室打算報告的所有變異進行目視檢查。

2.除了非同義單核苷酸變異以外的變異很容易被遺漏。

外顯子組測序最初旨在檢測編碼區和剪接位點內的單核苷酸或多核苷酸替換,或小的缺失和重復(~1-25 bp)。近年來,多項研究表明,在一定程度上,在外顯子組測序數據中也可以檢測到其他類型的變異。其中包括CNV、內含子變異、單親二體性(UPD)、線粒體變異、重復擴增和移動元件插入。雖然與編碼單核苷酸變異相比,所有這些都只能在相對較少的患者中解決病因,但這種特殊變異加在一起可以大大提高診斷率。

例如,對編碼區和+/-20bp剪接位點區的常規WES分析不能診斷患有痙攣性偏癱和關節紊亂的白質營養不良患者。作為Solve RD聯盟全面再分析的一部分,發現CSF1R基因中的純合已知致病性深內含子c.1969+115_1969+116del變體(補充圖S6),導致CSF1R轉錄本中包含假外顯子。雖然這個區域沒有特定的捕獲目標,但在這個位置,序列覆蓋率足以稱之為這個特定的變異。

對于臨床診斷為Stargardt病的患者,WES對視力障礙面板基因的分析以及對Stargardt基因(ABCA4和ELOVL4)的特別關注并未獲得分子診斷。針對單親二體的再分析檢測到該患者的1號染色體的父系同源二體(補充圖S7)。隨后對位于1號染色體上的ABCA4 Stargardt疾病基因進行Sanger測序,發現了一個純合致病性深內含子變體(Chr1(GRCh37):g.94546780C>g NM_000350.2(ABCA4):c.859-506G>c),導致ABCA4轉錄本中相當一部分出現假外顯子。

在一名患有額葉肥厚癥、呼吸模式障礙和心動過速的死亡兒童中,進行了全外顯子組分析。在PLAA基因中檢測到兩個罕見的純合子變異,一種錯義變異和一種同義變異。雖然最初我們關注的是錯義變異,但在解釋后它仍然是一個VUS。對于同義變異,剪接預測工具表明,它可能在該基因的第6外顯子中創建一個替代剪接供體位點。由于患者的臨床表型符合PLAA基因突變,因此需要對預測的剪接位點效應進行后續分析。對從攜帶者父母的淋巴母細胞生成的cDNA進行測序分析,確實證實了使用了替代剪接供體位點,導致突變等位基因編碼的轉錄本中11個核苷酸的框外缺失(補充圖S8)。這種變異不是“僅僅”是一種沉默的變異,而是導致該等位基因功能的喪失。

因此,我們建議考慮在臨床上與患者表型相關的基因內的所有類型的變異,并在解釋期間突出來自HGMD和ClinVar等數據庫的所有類型的已知致病變異(即,獨立于它們的位置或頻率)。

3.當其中一個“隱藏”時,復合雜合子變異很容易丟失。

我們發現,在許多預期隱性遺傳的情況下,我們最初只能識別隱性疾病基因中的一個雜合(致病)變異,如果存在第二個致病變異,這將是患者疾病的一個非常好的匹配基因。在這些情況下,第二種變異可能是不同類型的突變(見VI-2),可能不符合質量標準,或者似乎不太可能致病。例如,根據肌酸激酶(CK)水平升高和運動遲緩,在懷疑患有肌病的兒童中,使用標準篩選法檢測到MICU1基因中的雜合功能缺失變異p(Lys440*)。僅在肉眼檢查CNV數據后,檢測到第二個CNV變異,即MICU1中的雜合雙外顯子缺失(圖3B)。當時使用的CNV算法(CoNIFER)沒有分析出該CNV,因為該算法的閾值是三個或更多外顯子。

另一個例子是在四名患有運動障礙的無關個體中鑒定POLR3A基因的雜合功能缺失突變。雖然最初這些患者沒有得到診斷,但經過檢查,我們在所有四名患者中發現了一個額外的內含子變異(NM_007055.4:c.1909+22G>A)。這種變異的效果尚不確定,因為據預測它可以增強隱匿的供體剪接位點,同時保持原始供體剪接位點完好無損。該突變后來被證明是一種常見的亞型變異(即導致更溫和的POLR3A表型),導致19個堿基對以組織和發育階段特有的方式保留。

這些例子表明,當在隱性疾病基因中檢測到一個雜合子變異(這可能是對患者表型的一個很好的解釋)時,應該激發人們采取額外的努力來識別第二個變異。

譯者介紹

邊疆 男 2010年畢業于中山大學婦產科生殖內分泌專業,獲博士學位。專業方向:女性生殖力保存、環境生殖毒理學。從事婦科內分泌疾病和女性生殖內分泌臨床20余年

往期精品(點擊圖片直達文字對應教程)

機器學習

后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集

總結

以上是生活随笔為你收集整理的临床外显子组测序分析中的那些坑(中)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。